Несколько лет назад я принимала участие в проекте исследования больших массивов данных. В тот период было опубликовано несколько статей, а результаты исследования мы с моей подругой Надеждой Пахмутовой излагали в докладах на конференциях. Так, в Пущино, в Царьграде, мы выступали с докладом о применении тематического моделирования к прогнозу тревожных событий. Соответствующая статья была опубликована в сборнике конференции.
В статье изложены результаты практического применения методов тематического моделирования в мультиязыковых средах для мониторинга экстремистской активности в Интернете и прогноза тревожных событий. При работе с двумя корпусами текстов, содержащих экстремистскую идеологию радикальных мусульман и украинских националистов подбираются оптимальные параметры для метода неявных ссылок, рассчитывается мера подобия корпусов текста, определяется общая и специфическая
характерная терминологии двух корпусов текстов. Выделение нескольких категорий терминов по степени ожесточенности позволяет определить этапы роста и спада интереса к теме, прогнозировать будущие этапы, и тем самым — тревожные события в реальности.
Ищенко, Н. С. Использование методов тематического моделирования в мультиязыковых средах для прогноза тревожных событий / Н. С. Ищенко, М. М. Шарнин, Н. Ю. Пахмутова, Ю. В. Сюракшина // Труды Международной научной конференции по физико-технической информатике, 28-31 мая 2018 г, ЦарьГрад, Московская область, Россия. – С. 33 – 42.