Сегодня
разрабатываются методы прогнозирования, использующие положения теории хаоса и
фракталов. В отличие от "мягких" алгоритмов, они пока мало
проработаны как с теоретической точки зрения, так и в плане практической
реализации. Отдельные моменты иногда применяются при анализе финансовых рынков
- трейдеры, как правило, первыми испытывают все новые методы прогнозирования.
Потенциальная практическая значимость этих исследований не вызывает сомнений. В
результате могут быть получены методы довольно точного прогнозирования резких и
внезапных изменений - например, экономических кризисов, скачкообразной динамики
спроса, банкротств...
Историческая
логика развития методов прогнозирования отражает рост информационной
насыщенности, возрастающую взаимозависимость различных объектов и сложность их
поведения. Новые методы появляются в области сложных комбинированных подходов,
использующих элементы искусственного интеллекта, обучения и развития. Учитывая
тот факт, что в последнее время в рамках отдельных концепций разработано
множество алгоритмов для специфических задач и частных случаев, можно
предположить, что будут развиваться не столько методы прогнозирования, сколько
методология в целом.
Чтобы
получить общее представление о методах прогнозирования, необходимо для начала
классифицировать эти методы. Их принято разделять на количественные и
качественные.
Методы
различаются:
по
горизонту прогноза: краткосрочные (как правило, в пределах года или нескольких
месяцев), среднесрочные (несколько лет) и долгосрочные (более пяти лет);
по
типу прогнозирования: эвристические (использующие субъективные данные, оценки и
мнения), поисковые (в свою очередь делятся на экстраполятивные, проецирующие
прошлые тенденции в будущее, и альтернативные, учитывающие возможности
скачкообразной динамики явлений и различные варианты их развития) и нормативные
(оценка тенденций проводится исходя из заранее установленных целей и задач);
по
степени вероятности событий: вариантные (подразумевают вероятностный характер
будущего и предлагают несколько сценариев развития событий) и инвариантные
(предполагается единственный сценарий);
по
способу представления результатов: точечные (прогнозируется точное значение
показателя) и интервальные (прогнозируется диапазон наиболее вероятных
значений);
по
степени однородности: простые и комплексные (сочетают в себе несколько
взаимосвязанных простых методов);
по
характеру базовой информации: фактографические (основываются на имеющейся
информации о динамике развития явления или объекта, бывают статистическими и
опережающими), экспертные (индивидуальные и коллективные, в зависимости от
числа экспертов) и комбинированные (использующие разнородную информацию).
Рассмотрим
некоторые методы "мягких" вычислений, не получившие пока широкого распространения
в бизнесе. Алгоритмы и параметры этих методов значительно меньше
детерминированы по сравнению с традиционными. Появление концепций
"мягких" вычислений было вызвано попытками упрощенного моделирования
интеллектуальных и природных процессов, которые во многом носят случайный
характер.
Нейронные
сети используют современное представление о строении и функционировании мозга.
Считается, что мозг состоит из простых элементов - нейронов, соединенных между
собой синапсами, через которые они обмениваются сигналами.
Основное
преимущество нейронных сетей заключается в способности обучаться на примерах. В
большинстве случаев обучение представляет собой процесс изменения весовых
коэффициентов синапсов по определенному алгоритму. При этом, как правило, требуется
много примеров и много циклов обучения. Здесь можно провести аналогию с
рефлексами собаки Павлова, у которой слюноотделение по звонку тоже начало
появляться не сразу. Отметим лишь, что самые сложные модели нейронных сетей на
много порядков проще мозга собаки; и циклов обучения нужно значительно больше.
Применение
нейронных сетей оправдано тогда, когда невозможно построить точную
математическую модель исследуемого объекта или явления. Например, продажи в
декабре, как правило, больше, чем в ноябре, но нет формулы, по которой можно
посчитать, насколько они будут больше в этом году; для прогнозирования объема
продаж можно обучить нейронную сеть на примерах предыдущих лет.
Среди
недостатков нейронных сетей можно назвать: длительное время обучения, склонность
к подстройке под обучающие данные и снижение обобщающих способностей с ростом
времени обучения. Кроме того, невозможно объяснить, каким образом сеть приходит
к тому или иному решению задачи, то есть нейронные сети являются системами
категории "черный ящик", потому что функции нейронов и веса синапсов
не имеют реальной интерпретации. Тем не менее, существует масса нейросетевых
алгоритмов, в которых эти и другие недостатки так или иначе нивелированы.
В
прогнозировании нейронные сети используются чаще всего по простейшей схеме: в
качестве входных данных в сеть подается предварительно обработанная информация
о значениях прогнозируемого параметра за несколько предыдущих периодов, на
выходе сеть выдает прогноз на следующие периоды - как в вышеупомянутом примере с
продажами. Существуют и менее тривиальные способы получения прогноза; нейронные
сети - очень гибкий инструмент, поэтому существует множество конечных моделей
самих сетей и вариантов их применения.
Еще
один метод - генетические алгоритмы. В их основе лежит направленный случайный
поиск, то есть попытка моделирования эволюционных процессов в природе. В
базовом варианте генетические алгоритмы работают так:
1.
Решение задачи представляется в виде хромосомы.
2.
Создается случайный набор хромосом - это изначальное поколение решений.
3.
Они обрабатываются специальными операторами репродукции и мутации.
4.
Производится оценка решений и их селекция на основе функции пригодности.
5.
Выводится новое поколение решений, и цикл повторяется.
В
результате с каждой эпохой эволюции находятся более совершенные решения.
При
использовании генетических алгоритмов аналитик не нуждается в априорной
информации о природе исходных данных, об их структуре и т. д. Аналогия здесь
прозрачна - цвет глаз, форма носа и густота волосяного покрова на ногах
закодированы в наших генах одними и теми же нуклеотидами.
В
прогнозировании генетические алгоритмы редко используются напрямую, так как
сложно придумать критерий оценки прогноза, то есть критерий отбора решений, -
при рождении невозможно определить, кем станет человек - космонавтом или
алконавтом. Поэтому обычно генетические алгоритмы служат вспомогательным
методом - например, при обучении нейронной сети с нестандартными активационными
функциями, при которых невозможно применение градиентных алгоритмов. Здесь в
качестве примера можно назвать MIP-сети, успешно прогнозирующие, казалось бы,
случайные явления - число пятен на солнце и интенсивность лазера.
Еще
один метод - нечеткая логика, моделирующая процессы мышления. В отличие от
бинарной логики, требующей точных и однозначных формулировок, нечеткая
предлагает иной уровень мышления. Например, формализация утверждения
"продажи в прошлом месяце были низкими" в рамках традиционной
двоичной или "булевой" логики требует однозначного разграничения понятий
"низкие" (0) и "высокие" (1) продажи. Например, продажи
равные или большие 1 миллиона шекелей - высокие, меньше - низкие.
Возникает
вопрос: почему продажи на уровне 999 999 шекелей уже считаются низкими?
Очевидно, что это не совсем корректное утверждение. Нечеткая логика оперирует
более мягкими понятиями. Например, продажи на уровне 900 тыс. шекелей будут
считаться высокими с рангом 0,9 и низкими с рангом 0,1.
В
нечеткой логике задачи формулируются в терминах правил, состоящих из
совокупностей условий и результатов. Примеры простейших правил: "Если
клиентам дали скромный срок кредита, то продажи будут так себе",
"Если клиентам предложили приличную скидку, то продажи будут
неплохими".
После
постановки задачи в терминах правил четкие значения условий (срок кредита в
днях и размер скидки в процентах) преобразуются в нечеткую форму (большой,
маленький и т. д.). Затем производится их обработка с помощью логических
операций и обратное преобразование к числовым переменным (прогнозируемый
уровень продаж в единицах продукции).
По
сравнению с вероятностными методами нечеткие позволяют резко сократить объем
производимых вычислений, но обычно не повышают их точность. Среди недостатков
таких систем можно отметить отсутствие стандартной методики конструирования,
невозможность математического анализа традиционными методами. Кроме того, в
классических нечетких системах рост числа входных величин приводит к
экспоненциальному росту числа правил. Для преодоления этих и других
недостатков, так же как и в случае нейронных сетей, существует множество
модификаций нечетко-логических систем.
В
рамках методов "мягких" вычислений можно выделить так называемые
гибридные алгоритмы, включающие в себя несколько разных составляющих. Например,
нечетко-логические сети, или уже упоминавшиеся нейронные сети с генетическим
обучением.
В
гибридных алгоритмах, как правило, имеет место синергетический эффект, при
котором недостатки одного метода компенсируются достоинствами других, и
итоговая система показывает результат, недоступный ни одному из компонентов по
отдельности.
Любой
процесс прогнозирования, как правило, строится в следующей последовательности:
1.
Формулировка проблемы.
2.
Сбор информации и выбор метода прогнозирования.
3.
Применение метода и оценка полученного прогноза.
4.
Использование прогноза для принятия решения.
5.
Анализ "прогноз-факт".
Все
начинается с корректной формулировки проблемы. В зависимости от нее задача
прогнозирования может быть сведена, например, к задаче оптимизации. Для
краткосрочного планирования производства не так важно, каким будет объем продаж
в ближайшие дни. Важнее максимально эффективно распределить объемы производства
продукции по имеющимся мощностям.
Краеугольным
ограничением при выборе метода прогнозирования будет исходная информация: ее
тип, доступность, возможность обработки, однородность, формализуемость, объем.
Например, при прогнозировании темпов научно-технического прогресса в случае
масштабного контакта и сотрудничества с внеземной цивилизацией применение
фактографических методов вряд ли будет возможным. Для таких прогнозов
необходимо использовать методы моделирования, экспертные, сценарные. С другой
стороны, для прогнозирования объемов продаж туалетной бумаги с приемлемой
точностью достаточно простой экстраполяции тренда.
Выбор
конкретного метода прогнозирования зависит от многих моментов. Достаточно ли
объективной информации о прогнозируемом явлении (существует ли данный товар или
аналоги достаточно долго)? Ожидаются ли качественные изменения изучаемого
явления (оснащение автомобиля антигравитационным оборудованием)? Имеются ли
зависимости между изучаемыми явлениями и/или внутри массивов данных (объемы
продаж, как правило, зависят от объемов вложений в рекламу)? Являются ли данные
временным рядом (информация о наличии собственности у заемщиков не является
временным рядом)? Имеются ли повторяющиеся события (сезонные колебания)?
Из
всего набора методов прогнозирования в реальной практике бизнеса используются
лишь некоторые.
Абсолютный
хит - метод оценки прогнозов сотрудниками компании. Подразумевается, что
работники обладают необходимым опытом и интуитивным знанием предметной области,
рынка. К этой же группе можно отнести опросы потребителей, которые призваны
выявить их предпочтения и ожидания, на основе чего моделируется будущее.
Второй
по популярности является экстраполяция трендов, которая подразумевает выявление
во временном ряде основной тенденции и продление ее в будущее. Этот метод
предельно прост и дает приблизительные результаты.
Скользящее
среднее применяется при краткосрочном прогнозировании: каждое последующее
значение среднего рассчитывается на основе сдвигающегося вперед набора
предыдущих значений.
Метод
аналогий предполагает построение прогноза на основе известной динамики
родственных явлений, например товаров-субститутов. Этот способ прогнозирования
схож с методом подобия, применяемым на финансовых рынках, но менее трудоемок,
используется обычно в случае новых товаров.
Экспоненциальное
сглаживание выдает в качестве прогноза комбинацию прошлых значений. Метод
работает при небольших колебаниях уровней ряда или при краткосрочном
прогнозировании.
Регрессионный
анализ исследует взаимосвязь зависимой переменной от других независимых, применяется
при наличии связи между прогнозируемым процессом и какими-либо факторами,
влияющими на него.
Из
экспертных оценок обычно используют хорошо известный метод "Дельфи".
В
бизнесе в основном применяют субъективные методы прогнозирования и некоторые
количественные. Возникает вопрос: почему, имея значительный набор средств
прогнозирования, аналитики в подавляющем большинстве случаев продолжают
пользоваться простейшими из них? Причин здесь несколько.
Во-первых,
использование более сложных методов не всегда приводит к повышению точности
прогнозов. Многие вещи можно прочувствовать, но практически невозможно
просчитать. Интуиция в бизнесе все еще остается незаменимой. Во-вторых, чем
сложнее метод, тем больше времени требуется на подготовку данных, на расчеты, анализ,
численные эксперименты. Чем больше ассортимент, тем проще используемые методы
прогнозирования (или больше штат прогнозистов).
В-третьих,
окружающая среда, продукция, внутрифирменные факторы и прочие условия меняются
слишком часто, что не позволяет опереться при прогнозировании на
репрезентативные выборки исходных данных. При этом подавляющее большинство
методов прогнозирования так или иначе использует именно исторические данные.
В-четвертых,
грамотное применение научных методов прогнозирования обычно требует специальных
знаний, соответствующего образования, умения пользоваться математическим и
статистическим аппаратом, прикладными пакетами анализа и т. д.
Какой
же точности прогноза удается добиться с помощью используемых на практике
методов? Здесь все, как правило, зависит от степени агрегированности
показателя. Так, если прогнозировать совокупный общий объем реализации в
деньгах - точность прогноза может достигать +-5%. Но если прогнозировать,
например, объемы оптовых продаж потребительских товаров по ассортиментным
позициям в разрезе регионов - очень высоким результатом считается 40-процентная
точность попадания в интервал +-20% в пределах месяца, то есть объем реализации
40% позиций ассортимента угадан с точностью +-20%.
Широко
известным является факт значительного роста объемов оптовых продаж к концу
месяца. Если сравнивать объемы продаж первой и последней недель внутри месяца -
разница может достигать нескольких сотен процентов, тогда как разница между
двумя месяцами обычно не так велика.
Чем
более агрегированный по объему или по времени показатель анализируется, тем
точнее будет прогноз. Со снижением степени агрегированности снижается и польза
от статистических методов. Поэтому необходимо искать баланс между детализацией
и точностью.
Текущий
уровень развития средств обработки информации позволяет говорить о возможности
массового перехода от отдельных методов прогнозирования к системам поддержки
принятия решений, использующим в работе элементы искусственного интеллекта и
самообучения. Однако практическая востребованность этих методов вызывает
сомнения.
Во-первых,
не доказано их преимущество перед человеческой интуицией в условиях бизнеса.
Во-вторых, процесс функционирования сложной системы, как правило, недостаточно
прозрачен для пользователя, соответственно, результат не вызывает полного
доверия. В-третьих, параметры таких систем требуют тонкой настройки и подбора,
методы проведения которых практически не формализованы. В-четвертых, комплексные
прогностические системы создаются для уникальных условий и редко тиражируются,
в связи с чем стоимость их разработки, внедрения и поддержки довольно высока.
Эти
и другие причины тормозят проникновение научного прогнозирования в бизнес,
фильтрующий все методы на предмет практической пользы и простоты применения.
Вне зависимости от их продвинутости - с академической точки зрения.
Современная
наука предлагает более 150 методов прогнозирования, которые могут быть использованы
для целей бизнеса. От простейших приемов усреднения до программно-аппаратных
систем поддержки принятия решений. И если практикой применения трендовых
моделей и экспертных оценок в экономике сложно кого-то удивить, то новые
достижения научной мысли на стыке математики, статистики, информатики и
кибернетики продолжают оставаться недостаточно востребованными большинством
компаний.
Причин
здесь несколько: консерватизм и отсутствие воображения у многих менеджеров,
сложность новых концепций прогнозирования и их математического аппарата,
неочевидность сравнительной практической пользы от внедрения, нехватка
информации о них.
Методы
"мягких" вычислений, среди которых можно отметить нейронные сети,
генетические алгоритмы и нечеткую логику, существуют уже несколько десятилетий.
Но вряд ли многие из читателей смогут вспомнить пример их регулярного
использования в бизнесе. Исключением будут разве что компании, чья основная
деятельность - активные операции на финансовых рынках, страховщики и некоторые
банки.
В
научных кругах прогрессивность и практическая польза этих методов не вызывают
сомнений, однако теоретикам далеко не всегда удается донести информацию до
практиков в доступной форме.