в Стратегии

Многогранная линейная регрессия

Много лет назад в телефонном интервью один портфельный менеджер спросил меня “Как вы считаете, для трейдинга какие модели более мощные: линейные или нелинейные?”. Будучи молодым и неопытным, я не колеблясь ответил “Нелинейные!”. Тогда я не знал, что это тот самый вопрос, который отделяет мужчин от мальчиков в царстве количественного трейдинга. Последующий опыт показал мне, что нелинейные модели в основном были абсолютным ужасом в отношении торговых прибылей. Как сказал Max Dama в одной из своих статей по линейной регрессии “когда отношение сигнала к шуму 0.05:1, нет смысла беспокоиться относительно эффектов высших порядков”. Почти наверняка это приведет к переподгонке нелинейной модели к неповторяющемуся шуму.

До недавних пор, я использовал линейную регрессию в основном для поиска отношения хеджа между двумя инструментами в парном трейдинге, или в более общем случае для поиска весов отдельной акции в корзине в некоторых формах арбитража с индексом. Конечно, другие пользуются линейной алгеброй в Методе главных компонент (principal component analysis, PCA) и более общем факторном анализе. В последнее время я стал применять линейную регрессию более активно в торговых моделях.

Один способ прямо применить линейную регрессию в трейдинге – использовать ее вместо скользящих средних. Использование скользящих средних неявно подразумевает, что тренда в ценовых сериях нет и что среднее цены остается на одном уровне. Это конечно может быть не так. Поэтому использование линейной регрессии для прогнозирования текущей равновесной цены более адекватно, чем полагать ее равной скользящей средней. Для некоторых случаев я нашел, что эта равновесная цена дает лучшие модели возврата к среднему, т.е. например шорт инструмента когда текущая цена выше равновесной. Конечно, можно использовать линейную регрессию похожим образом в моментум-моделях, т.е. например, когда текущая цена сильно выше равновесной, понимать это как “прорыв” и покупать.

Max Dama в своей статье еще указал на более хитрую версию линейной регрессии, обычно называемой “взвешенной регрессией” (“weighted least squares regression”, WLS). WLS по отношению к линейной регрессии примерно то же самое, как экспоненциальное скользящее среднее (EMA) к простому (SMA): оно дает большие веса недавним данным. Я обнаружил, что EMA часто дает в трейдинге лучшие результаты, чем SMA. Однако пока я не могу сказать того же про WLS по отношению к обычной линейной регрессии. Также он сослался на статью, которая указывает на эквивалентность между WLS и фильтром Калмана. В последнее время фильтр Калмана очень популярен среди количественных трейдеров. Интересная особенность фильтра Калмана в том, что там очень мало свободных параметров, модель последовательно адаптирует себя к среднему и ковариациям входящих данных. И более того, она может делать это каждый шаг (на техническом жаргоне, используя “онлайн” алгоритм), то есть нет необходимости делить данные на “тренировочный” и “тестовый” наборы, и нет необходимости определять период “окна”, как в случае скользящих средних. Он использует “скрытые состояния” подобно скрытым марковским моделям (Hidden Markov Models, HHM), но в отличие от них он линеен.

Автор: Ernest P. Chan

Источник: epchan.blogspot.ca

Комментарии:

Intro: Да ну не. Вопрос сродни религиозным предпочтениям. На него нет ответа.

mehanizator: есть общее правило – чем проще модель, тем меньше возможностей с ее помощью задурить себе голову.

Intro: Чем проще модель, тем больше народу ее видит и использует, тем меньше ты на ней заработаешь.

mehanizator: нелинейный эффект можно вытащить в отдельный фактор оставаясь в рамках линейной модели