
Коллективная работа 2018 года по корпусной лингвистике и тематическому моделированию. В статье изложены результаты практического применения методов тематического моделирования в мультиязыковых средах для мониторинга экстремистской активности в Интернете и прогноза тревожных событий. При работе с двумя корпусами текстов, содержащих экстремистскую идеологию радикальных мусульман и украинских националистов подбираются оптимальные параметры для метода неявных ссылок, рассчитывается мера подобия корпусов текста, определяется общая и специфическая характерная терминологии двух корпусов текстов. Выделение нескольких категорий терминов по степени ожесточенности позволяет определить этапы роста и спада интереса к теме, прогнозировать будущие этапы, и тем самым – тревожные события в реальности.
Ищенко, Н. С. Использование методов тематического моделирования многоязычных коллекций для прогноза тревожных событий / М. М. Шарнин, Н. С. Ищенко, Н. Ю. Пахмутова // Шестнадцатая Национальная конференция по искусственному интеллекту с международным участием КИИ-2018 (24-27 сентября 2018 г., г. Москва, Россия). Труды конференции. В. 2-х томах. Т. 1. – М.: РКП, 2018, – С. 297 – 304.