Автор: Александр Кургузкин (mehanizator).
Обычно в качестве исторических данных для индекса S&P 500 я беру данные с 1994 года. Они покрывают большой цикл 1994-2003 годов, трендовый рынок 2004-2007, большой кризис 2007-2008 годов и бычий рынок до нынешнего момента. Однако последнее время у меня возникли сомнения в том, что данные цикла 1994-2003 годов разумно использовать в качестве исходных для опционных моделей. Даже визуально поведение цены различается для того периода и рынка последних 10 лет. Рост был плавнее и не было таких мощных распродаж как в 2008 году.
S&P 500 с 1994 года, шкала логарифмическая:
Волатильность, шкала логарифмическая:
В итоге провел небольшое исследование.
Я буду рассматривать логарифмы ценовых изменений индекса за месяц, нормированные на волатильность, которая считается как СКО цен за предыдущий месяц, переведенную на год (умноженную на sqrt(252)). Поскольку именно в таком виде я обычно использую данные в моделях — нормировка на волатильность дает более-менее стационарный ряд и сильно сокращает эксцесс.
Разбиваю весь период на две примерно равные части (по ноябрь 2003 и после) и считаю моменты распределений для этих нормированных данных.
Результат:
2-й период -> N: 2425, mean: 0.039, sigma: 0.288, skew: -0.957, kurtosis: 1.731
Что видим? Видим серьезную разницу в ассимметрии распределения, на втором периоде она вдвое больше. И видим опять же двукратно выросший эксцесс.
Поскольку для, например, оценки опционов ассимметрия и эксцесс имеют большое значение, нужно серьезно задуматься над тем, использовать ли для тренировки текущей модели данные с прошлого цикла (1994-2003).
Комментарии:
Yaroslav Alexeev: На мой взгляд нет смысла использовать для анализа 1994-2003.
Тогда много чего не было:
— VIX’а таким, каким мы его знаем;
— недельных опционов;
— большого количества роботов.
Pavel Sergeyev: Ну можно предположить что второй цикл тоже кончился году этак в 2012 и сейчас развивается третий цикл.