Ну вот, добрались и до тройного экспоненциального сглаживания.
Кто не был в курсе, бывает просто Экспоненциальное сглаживание, бывает также Двойное экспоненциальное сглаживание, ну и теперь вот, встречайте — тройное экспоненциальное сглаживание.
Сначала немного истории.
Экспоненциальное сглаживание было впервые предложено в 1957 году Хольтом (C. C. Holt) и предназначалось для непериодических (отсутствует сезонность) рядов динамики, не показывающих наличие какой-либо тенденции.
В 1958 году он же предложил модификацию этого метода, учитывающую тенденции — двойное экспоненциальное сглаживание.
А Винтерс (Winters) в 1965 году обобщил этот метод с учетом сезонности колебаний. Поэтому тройное экспоненциальное сглаживание называют еще методом Хольта-Винтерса (Holt-Winters method).
Поскольку всякие вводные слова я уже говорил в предыдущих статьях, перейдем сразу к формулам.
Тройное экспоненциальное сглаживание:
Общее уравнение:
,
Сглаживание тенденции
,
Сглаживание сезонности
,
Прогноз
где,
, , принимает значение из диапазона [0;1]
y - наблюдение
S - сглаженное значение наблюдения
b - коэффициент тенденции
I - индекс сезонности
F - прогноз на m периодов вперед
t - индекс текущего наблюдения
Как и для прочих экспоненциальных сглаживаний, , , подбираются методом проб и ошибок таким образом, чтобы минимизировать среднеквадратическую ошибку.
Что здесь является особенным — наличие числа L, определяющего число периодов. По числу периодов нужно построить соответствующие начальные индексы сезонности. Таким образом метод, с точки зрения расчета индексов сезонности, требует наличия минимум L наблюдений. Понятно, чем больше полных сезонов в наличии, тем лучше — точнее будут начальные индексы сезонности.
Индексы сезонности рассчитываются следующим образом - предположим, есть данные наблюдений за n сезонов по L периодов.
Тогда
1) для каждого сезона рассчитывается среднее значение
, j меняется от 1 до n
2) для каждого периода рассчитывается индекс сезонности
, i меняется от 1 до L
где
- наблюдение, соответствующее i-му периоду j-го сезона.
Далее — чтобы правильно рассчитать начальную тенденцию, надо уметь учитывать влияние сезонных колебаний. Если у нас есть данные за один сезон (например, год — L=12), то сложно тенденцию отличить от сезонных колебаний. Таким образом метод, с точки зрения расчета начального коэффициента тенденции, требует наличия минимум 2L наблюдений. Имея данные за два сезона (L=24), понятно, уже можно выявлять тенденцию, сравнивая соответствующие периоды сезонов (например, январь прошлого года с январем настоящего года).
Общеупотребительная формула для оценки тенденции
Как видим, используются данные за два сезона.
Отсюда мораль — лучше всего применять тройное экспоненциальное сглаживание для данных, показывающих стойкую тенденцию и наличие сезонных колебаний, при этом необходимо располагать результатами 2L и больше наблюдений.
Калькулятор ниже это квинтэссенция всех трех статей — он строит простое экспоненциальное сглаживание, двойное экспоненциальное сглаживание и тройное экспоненциальное сглаживание. Кроме того, он строит прогнозные значения на указанную дальность.
Задаются параметры , , , периодичность данных L (по умолчанию 4 — как бы 4 квартала одного года) и дальность прогноза m (тоже 4).
Примечание: Калькулятор будет считать только при наличии минимум 2L наблюдений.
P.S. Кстати, если данные по умолчанию заменить данными, которые действительно имеют выраженную тенденцию и периодичность, среднеквадратическая ошибка тройного сглаживания будет на порядок меньше, чем среднеквадратические ошибки простого и двойного сглаживания. Аж сам удивился. Данные по умолчанию здесь, пожалуй, не очень показательны для демонстрации.