Кассовые сборы фильмов научились прогнозировать по Википедии
Группа исследователей из Великобритании, Венгрии и Финляндии научилась использовать Википедию для предсказания кассовых сборов фильмов до их выхода в прокат. В своей статье для журнала PLoS One ученые показали, что кассовые сборы фильмов положительно коррелируют с посещаемостью страниц, посвященных кинокартинам, перед премьерой.
Корреляция, выявленная в исследовании, носит не абсолютный характер: коэффициент корреляции составляет 0,671, поэтому высокий интерес пользователей Википедии еще не гарантирует успеха. Ученые проанализировали 312 фильмов, которые были выпущены в США в 2010 году, собрав данные о числе просмотров страниц сетевой энциклопедии за месяц до официальной премьеры.
Статистический анализ определил, что число просмотров страниц уже за полгода до показа фильма дает более надежные результаты, чем число кинотеатров, в которых можно будет увидеть ленту. Кроме того, ученые попытались использовать для прогнозирования как суммарное количество правок статей, так и число участников, вовлеченных в правку статьи о фильме. Информация о правках оказалась менее информативна, чем данные о числе просмотров.
Более ранние оценки, выполненные за год до премьеры, дают ожидаемо менее точные результаты, так как далеко не все фильмы заранее удостаиваются отдельной страницы. Исследователи отмечают, что из 535 кинокартин, снятых в 2010 году американскими студиями (с известными сборами) лишь 312 были описаны в английском сегменте Википедии.
Ранее о возможности предсказания объема кассовых сборов сообщили аналитики компании Google. Они опирались на поисковые запросы и число просмотров трейлеров. Заявленная точность при этом была выше, чем в случае с анализом посещаемости Википедии: 94 процента.