«Голос толпы» и биржевые пузыри

Анализ степенных распределений комментариев к финансовым газетным сайтам можно использовать для распознавания пузырей фондового рынка, добавив традиционный анализ волатильности. Используя собранные за четыре года 17713 финансовые онлайн-статьи (более 10 миллионов слов) из Файнэншл Таймс (Financial Times), Нью-Йорк Таймс (New York Times) и Би-би-си (BBC), мы показываем, что изменения в степенных распределениях от недели к неделе отражают рыночные движения индексов Доу-Джонса (DJI), FTSE-100 и NIKKEI-225. В частности, по статистическим закономерностям в языке отслеживается пузырь фондового рынка 2007 года, прослеживая появляющуюся структуру в формулировках комментаторов, поскольку прогрессивно возрастающее согласие явилось результатом их позитивного восприятия рынка. Кроме того, как показал анализ, пока пузырь надувался, наблюдалось заметное расхождение в положительных формулировках.

Известно, что Джон Рокфеллер (John D. Rockefeller) избавился от акций перед катастрофой 1929 года, когда коридорный спросил его о курсе акций, что показывает глубокое понимание миллионером пузырей фондового рынка, а именно, что они возникают, когда все говорят о рынке и имеют о нем одинаковое позитивное мнение. Пузыри появляются из-за нереалистичных ожиданий будущей прибыли от торговли акциями или товаром, чья стоимость растет посредством искусственного поведения толпы, вкладывающейся в дальнейшее “нелогичное богатство” [Sornette, 2003]. Современные методы прогнозирования пузырей основаны на анализе динамики цен и волатильности (c.f. VXO/VIX или модель LP-PL, см. [Yan et al., 2010]), но их часто оправдывают заявлениями о новых моделях оценки (например, история с «Новой экономикой» во время пузыря dot.com). В последнее время статистические закономерности, выявленные в документах письменной речи – газетных статьях, электронных письмах, поисковых запросах – поразительно хорошо прогнозируют принятие решений и выбор. Время реакции человека при выполнении тестов на запоминание может быть спрогнозировано статистикой совместного появления слов в больших корпусах текстов. [Landauer и Dumais, 1997], Google предсказал автомобильные продажи, анализируя поисковые запросы [Choi and Varian, 2009], рекомендательная система книг Амазона собирает предпочтения, сопоставляя названия книг [Schafer et al., 1999]. Возможно, независимое средство для анализа крахов фондовой биржи заключается в следовании примеру Рокфеллера – слушать «Голос Толпы» следя за языком, используемым финансовыми комментаторами.

Хотя большая часть богатства новых индустрий сетевых СМИ – Google, Amazon и Facebook – получена при использовании такого корпусного анализа письменной речи, идеи, на которых базируется этот анализ, известны достаточно давно. Уже в 1940-ых годах Джордж Зипф (George Zipf) обнаружил, что плотность распределения слов в Моби Дике [Melville, 1851], и в другие корпусах, соответствует степенному закону в обобщенной форме [Estoup, 1916; Newman, 2006; Zipf, 1949].

Степенные законы найдены во многих физических, биологических, политических, и позже, веб-системах [Barabási and Albert, 1999; Barabási, 2003; Estoup, 1916; Halvey et al., 2005; Huberman and Adamic, 1999; Newman, 2006; Zipf, 1949]. Например, самые популярные страницы веб-сайтов удовлетворяют закону Зипфа, неважно осуществляется ли к ним доступ с компьютера или мобильного устройства [Halvey, 2005; Huberman and Adamic, 1999], структура связей самой Сети также удовлетворяет степенному распределению [Barabási and Albert, 1999; Barabási, 2003]. Здесь, мы рассматриваем появление структуры в языке финансового репортажа газетных веб-сайтов, поскольку в обзорах состояния рынка появляются совпадения, и одни слова становятся более важными/видными, чем другие (такие слова как «покупать, покупать, покупать»).

Наша основная гипотеза заключается в том, что язык, используемый финансовыми комментаторами во время экономического пузыря, проявляет структуру на стадии становления, поскольку встречается от недели к неделе в одном и том же позитивном взгляде на фондовый рынок. Это совпадение в языке должно быть отражено:

(1) в сходимости глаголов, когда используются одинаковые глаголы – комментарии становятся единообразно позитивными (то есть все с большей частотой используется меньший набор глаголов, таких как «акции снова выросли», «достигли новых высот» или «взлетели»);

(2) в сходимости существительных, поскольку комментарии фокусируются на меньшем чем обычно наборе событий (например, возросшая одержимость небольшим количеством быстро растущих акций, таких как акции интернет-компаний в 1999).

Статистически, поскольку появляется биржевой пузырь и сходится язык в комментариях, показатели степенного закона, характеризующие частотность распределения слов, должны отклониться относительно средних показателей всего корпуса вверх, когда пузырь раздувается и резко пойти вниз после краха.

Проведенный анализ показывает, что в корпусном анализе финансовых статей может быть найдена важная закономерность. Согласно нашей точке зрения изменения, наблюдаемые в языке, отражают крупномасштабные изменения во взглядах комментаторов на рынок, изменения, отслеживающие движение на рынке. Недавно экономисты разработали несколько средств для предсказания периодов раздувания пузыря и последующего краха, основанные в значительной степени на ценообразовании [Sornette, 2003, Yan et al., 2010]. В основном эти подходы анализируют изменение цены товара или акции. Интересно, что многие из этих средств полагаются на степенной анализ, показывающий, например, что последовательные колебания цен ускоряются как раз перед крахом. Мера волатильности VIX/VXO, о которой часто сообщают финансовые журналисты, так же полагается на цены месячных опционов на акции. Так зачем же нам этот анализ языка?

Короткий ответ – анализ языка необходим, потому что опирающиеся на цену оценки часто игнорируются из-за того, что какая-нибудь статья с обложки говорит об изменении модели оценки. В крахе 2007 году основной темой была низкая процентная ставка, для пузыря доткомов это была тема с «Новой экономикой».

Значение данной работы состоит в том, что она предлагает независимый инструмент измерения, так называемых, «изменчивых мнений» на рынке. Если вы наблюдаете за радикальным появлением всеобщего «нелогичного» взгляда на рынок, такого как перед крахом 2007 года, это очень мощный сигнал, что что-то идет не так. Цель данной работы заключается в том, что она предоставляет способ оценить грядущие события на рынке, наблюдая за тем, о чем говорят (и по-видимому думают) люди. Также этот инструмент может использоваться в качестве независимого источника дополнительного анализа ценообразования.

В общих чертах, этот вид онлайнового анализа текстов можно сравнить с множеством подобных анализов из области информационных технологий, фиксирующие аспекты поведения людей; например, уже упоминаемыми исследованиями Google и Amazon. Недавно совместная группа Harvard и Google утверждала, что корпусный анализ Google Books откроет совершенно новую эру «культурномики»[Michel et al., 2010]. Данная работа показывает, что даже относительно маленькие корпуса текстов могут дать ответ на конкретные вопросы о групповом поведении на фондовом рынке.

Аарон Джероу (Aaron Gerow), Тринити-Колледж Дублина, Дублин, Ирландия

Марк Т. Кин (Mark T. Keane), Дублинский университетский колледж, Белфильд , Ирландия

Источник:

http://arxiv.org/ftp/arxiv/papers/1212/1212.2676.pdf


Подпишитесь на уведомления о новых постах

И получите доступ к специальным материалам сайта