Автор: Intro.
Я тут перебирал разные плагины к экселю для исследований и в одном пакете обнаружил странное, как мне на первый взгляд показалось. В комплекте поставки программы шел пример, который собирал модельку для прогноза цены биржевого актива. Среди данных для тренировки много всевозможных производных цены, вроде скользящих средних, разных индикаторов, изменения оборота, последняя сделка и проч. Но самой цены нет! То есть, модель тренируется предсказывать цены актива не видя ни одной котировки актива для своей тренировки. Казалось бы — глупость страшная. А потом до меня дошло, если у нас нет стакана, допустим L1 данные, то зачем нам смотреть на цены? Они ведь меняются все время, наша стратегия не будет работать на том же рынке, по которому обучалась. Цены такими уже никогда не будут. Так зачем нам вообще смотреть на них? А вот, например, волатильность или стандартное отклонение и прочие параметры могут быть похожи в будущем на те, что были в тестовом сете и тогда наша модель будет знать, куда цена пойдет с большей вероятностью. Или я все же не прав?
Комментарии:
mehanizator: Не очень понятно — а откуда берутся производные цены, индикаторы, если самой цены нет?
Intro: Ну она видимо изначально в сете была, с нее посчитали производные и из сета убрали.
Intro: Как вариант, можно цену из надбора убирать, пусть железяка сама разбирается кому какие веса проставить. Но это не совсем правильно, правильно подобранный сет — половина успеха, а я не понимаю, что в нем должно быть.
mehanizator: ну так на голой цене тренироваться смысла особенно нет, надо ее как-то преобразовывать, нормализовывать, от того что получится уже и плясать.
Intro: Ну это-то понятно. Но саму цену выкинуть из сета довольно радикальное решение )
mehanizator: ее и надо выкидывать, на ней шума много слишком.
Intro: В других примерах других программ цена оставлена. Зачем?
mehanizator: Может рука не поднялась выпилить? 🙂
Intro: Забавная гипотеза =)
mehanizator: а что за модель? нейросеть?
Intro: Логистическая регрессия.
albert.khamzin: Что такое цена, вообще? Тиковые данные что ли? Или OHLC? Видимо, скорее OHLC, но это же четыре набора данных, вот и выпилили.
Intro: Зачем свечи юзать? Ну, можно кнечно, иногда даже имеет смысл. Если там были свечи, то почему бы и нет? Диапазон хождения цены все-таки, штука полезная. Оно и волатильность в первом приближении, может пригодиться.