УкрРус

Социальные сети могут предсказать будущее

Текст переведен специально для сайта "Обозреватель". Оригинал читайте на Bloomberg.com

Поскольку опросы и букмекеры не смогли предсказать результаты референдума по выходу Великобритании из Евросоюза, финансовый сектор, зависящий от достоверной информации, вынужден искать альтернативы. По некоторым утверждениям, хорошую информацию удалось получить, просеивая данные из социальных сетей - которые, возможно, были лучшим средством предсказать результаты голосования 23 июня.

Как сообщается, управлению активами Бревэна Говарда, одним из соучредителей которого является миллиардер Алано Говард, удалось снизить свои риски перед голосованием за счет использования искусственного интеллекта, который изучал данные из соцсетей. Его макро-фонд размером в $16 миллиардов увеличился на 1% процент в день, когда объявили о результатах голосования; хедж-фонды же в целом потеряли 1.6%. Другие фонды, как сообщает Bloomberg News, все больше инвестируют в данную технологию.

На данный момент использование "больших данных" для предсказания результатов выборов – скорее попытки попасть пальцем в небо. Пока что результаты традиционных опросчиков зачастую лишь вводят в заблуждение, в то время как эксперименты с использованием данных из социальных медиа заслуживают большего внимания.

Общедоступные социальные данные по теме государственных выборов, не кажутся очень серьезными. Большая часть информации представляет из себя твиты или посты пользователей, в которых упоминается определенный кандидат или событие. В статье об анализе активности в Instagram, предшествовавшей референдуму, Вячеслав Полонский из Оксфордского университета выявил, что численность сторонников выхода Великобритании из ЕС намного превосходила желающих остаться. Twitter предоставил некоторые данные касательно активности пользователей: кампания по выходу из Евросоюза породила большее количество обсуждений. Издательство New York Times изучила данные из Facebook, и оказалось, что сторонники отделения от ЕС здесь также были более активны: больше лайков, репостов и комментариев.

Это исходные данные, однако, не так много означают: красноречивое, рассерженное меньшинство часто создает больше шума, чем уверенное, спокойное большинство. Те же самые хэштеги могут использоваться обеими сторонами, зачастую саркастически. Великобритания особенно любит сарказм, делая тем самым осложняя попытки вычислить эмоциональный посыл плаката с определенным хэштегом или ключевым словом. И какое значение имеет широта обсуждения кампании, если в большинстве случаев они представляют собой лишь насмешки?

Даже если множество людей сегодня читают новости в основном в социальных сетях, кажущееся преимущество одной группы не всегда может предсказать конечный результат, поскольку пользователи Twitter, Facebook и Instagram склонны существовать в своего рода бункерах, взаимодействуя только с теми, кто разделяет их точку зрения.

Помимо тенденции к отклонению самостоятельного выбора, вызванной гневом - несчастные люди более мотивированы выражать свои чувства – также существует склонность отказываться от пребывания в социальных сетях вообще (хотя в Великобритании около 33 миллионов человек пользуются Facebook)

И все же, во всем этом определенно что-то есть. Андраник Тумэсджэн, преподаватель из Мюнхенского технического университета, был одним из первых опубликовавших анализ того, как социальная сетевая деятельность коррелирует с результатами выборов в федеральные органы. В 2010 году Тумэсджэн и соавторы утверждали, что число твитов о каждой стороне кампании достаточно точно предсказывало результаты парламентских выборов 2009 года в Германии. Другие исследователи позже указали на то, что предел погрешности в анализах Тумэсджэна был в действительности намного больше, чем в традиционных опросах.

Это сопровождалось более сложной работой, которая основывалась не только на частоте упоминаний, но также и на различных методах анализа мнений. Как-раз здесь был задействован искусственный интеллект: в лучшем варианте развития событий исследователи нанимают людей, чтобы маркировать тысячи постов как положительные, отрицательные или нейтральные, а отметить множество других нюансов, которые проектировщики исследования сочли важными. Затем искусственная нейронная сеть, используя эти данные, проходит "тренировку" до тех пор, пока не научится "оценивать" посты пользователей самостоятельно. Тем не менее, есть некоторые проблемы. В 2012 году Даниэль Гайо-Авейо из испанского университета Овьедо написал свое мнение о собрании исследований в данной сфере:

"Это вовсе не предсказание! Я не нашел ни одной бумаги, предсказавшей будущий результат. Все они утверждают, что предсказать было возможно; таким образом, все это – лишь запоздалый анализ и, само собой разумеется, неудачные результаты сложно найти"

В некоторых случаях социальный сетевой анализ достиг немного лучших результатов, чем опросы - но он страдает от тех же самых недостатков, что и традиционные обзоры. Например, он недооценил выступления правых радикалов Национального фронта Франции - стороны, представители которой часто воздерживаются от публичной демонстрации своих чувств.

К числу других сложно преодолеваемых проблем принадлежат склонность к самоотбору и географический фактор: точные данные геолокации необходимы, чтобы предсказать выступления региональных сторон, таких как шотландские националисты, и каким образом региональное голосование разделится. Такая информация часто недоступна.

Другими словами, в этой довольно молодой (но уже заполненной) области академики все еще работают над оптимальным алгоритмом обработки, использующем социальные сетевые данные. Тем не менее, очевидно, что некоторые технически подкованные инвесторы на этом уже зарабатывают, объединяя традиционное исследование общественного мнения с анализом "больших данных"

Традиционным опросчикам стоит перенять эту технологию, учитывая, что она может помочь усовершенствовать методологию, и начать публиковать результаты наряду с теми, что получены посредством опросов по телефону и через интернет. Становится все более трудным делать верные предсказания, имея лишь старый набор инструментов. В конце концов, в таких ситуациях, как британский референдум, любой подсчет голосов и соцопрос могут спровоцировать забастовку. Новая технология несовершенна, и пока не совсем ясно, где и как ее применять, но мир изменяется слишком быстро, чтобы ее игнорировать.

Присоединяйтесь к группам "Обозреватель Блоги" на Facebook и VKontakte, следите за обновлениями!

Наши блоги