Скользящее среднее yi величины xi с интервалом n вычисляется как среднее последних n значений xi, то есть yi = (xi + xi-1 + … + xi-n )/n.
Применение скользящего среднего к зашумлённым данным позволяет сгладить данные и более явно определить тенденции, избавившись от части шума.
Недостатком применения скользящего среднего является появление задержки в информации, поскольку скользящее среднее равно среднему от предыдущих значений.
Пример.
Построим графики линейной функции с шумом и её скользящее среднее, а также графики их трендов. Сравнение показывает, что линейный тренд скользящего среднего запаздывает относительно реальных данных.
Как избавиться от лага, являющегося недостатком метода скользящего среднего?
Введение специально рассчитанной поправки на тренд, учитывающей запаздывание, позволит устранить этот недостаток.
Как рассчитать такую поправку?
Рассчитаем величину zi, аналогичную скользящему среднему для нечётного n = 2*k + 1, по формуле среднего арифметического от k левых, центрального xi и k правых значений xi: zi = (xi+k + xi+k-1 + … + xi + … + xi-k+1 + xi-k)/n.
Величина zi обладает следующими свойствами. Для её расчёта необходимо знать k будущих значений xi, что обычно недоступно для временных рядов. Однако линейный тренд величины zi (в отличие от yi) лишён запаздывания. Таким образом, для учёта запаздывания в этом случае достаточно сдвинуть индекс скользящего среднего на k.
Как же рассчитать поправку с учётом всех этих соображений?
|