Регистрация Войти
Вход на сайт

Проанализировав запросы в «Википедии», ученые построили модель прогнозирования эпидемий

18 ноября 2014 16:24

Проанализировав запросы в «Википедии», ученые построили модель прогнозирования эпидемийАмериканские ученые смогли с большой степенью точности спрогнозировать время и скорость распространения эпидемий гриппа и лихорадки денге — на основе запросов к соответствующим статьям из «Википедии». О новом методе сообщается в журнале PLOS Computational Biology, а коротко о нем пишет Los Angeles Times.

Сайт «Википедии» собирает данные всех поисковых запросов, отправленных читателями (примерно 850 миллионов за сутки). По этой информации, имеющейся в открытом доступе, пытаются предсказывать популярность фильмов и биржевые котировки, но сотрудники отдела оборонных систем и анализа Лос-Аламосской национальной лаборатории впервые построили модель прогнозирования эпидемий.

Проверить ее решили на восьми заболеваниях (холера, лихорадки денге и Эбола, СПИД, грипп, чума и туберкулез) в девяти странах (Бразилия, Китай, Гаити, Япония, Норвегия, Таиланд, Уганда и США — связь запроса со страной выявляли по его языку). Ученые собрали данные по поиску статей, посвященных этим болезням (за 2010-2014 годы), и наложили пиковые часы и дни запросов на хронологию распространения эпидемии.

Лучше всего модель предсказала ход эпидемии гриппа в Японии (за семь дней вперед), лихорадки денге в Бразилии (за две недели), и туберкулеза в Таиланде (за месяц вперед).

По остальным болезням результаты оказались более чем скромными. Причина в том, что грипп и денге являются сезонными заболеваниями: в ожидании вспышки люди готовы заранее разузнать о них побольше. Кроме того, эти болезни отличает короткий инкубационный период (несколько дней): замечая у близких подозрительные симптомы, люди обращаются к «Википедии», чтобы понять, что грозит им самим.

Неудачные же прогнозы касаются вялотекущих (СПИД в Японии) и малозначительных (чума в США) эпидемий. Ученые отметили, что значимые закономерности часто заглушались информационным шумом. Например, просчитать распространение Эболы по Уганде и Демократической Республике Конго не удалось потому, что большинство авторов запросов к соответствующим статьям живут в других странах, а местные жители почти не имеют доступа к интернету. Та же ситуация возникла со вспышками холеры на Гаити.

Компания Google пришла к сходным выводам: она использует данные поисковых запросов для прогноза сезонных вспышек того же гриппа и денге (и только этих заболеваний). Однако ученые из Лос-Аламоса утверждают, что их модель полезнее, так она опирается на выложенные в открытый доступ данные.

lenta.ru


Рейтинг статьи:
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Оставить комментарий
Ваше имя: *
Ваш e-mail: *
Текст комментария:
Полужирный Наклонный текст Подчёркнутый текст Зачёркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
Код: Включите эту картинку для отображения кода безопасности
обновить, если не виден код
Введите код: