Математическое моделирование оценки достоверности слухов в средствах массовой информации

Вестник ТюмГУ. Физико-математическое моделирование. Нефть, газ, энергетика.


Выпуск:

2019. Том 5. №4 (20)

Название: 
Математическое моделирование оценки достоверности слухов в средствах массовой информации


Для цитирования: Черняев А. А. Математическое моделирование оценки достоверности слухов в средствах массовой информации / А. А. Черняев, А. Г. Ивашко // Вестник Тюменского государственного университета. Физико-математическое моделирование. Нефть, газ, энергетика. 2019. Том 5. № 4 (20). С. 181-199. DOI: 10.21684/2411-7978-2019-5-4-181-199

Об авторах:

Черняев Александр Андреевич, аспирант, научный сотрудник, Тюменский государственный университет; a.a.chernyaev@utmn.ru

Ивашко Александр Григорьевич, доктор технических наук, профессор кафедры программной и системной инженерии, Тюменский государственный университет; a.g.ivashko@utmn.ru

Аннотация:

Одной из самых важных задач современного общества является борьба с распространением ложной информации. Беспрецедентный переход от традиционных средств массовой информации к современным методам получения новостей породил множество проблем с проверкой доверия к ним.
Журналисты в современном мире вынуждены конкурировать с огромным потоком данных обычных пользователей, из-за чего основным фактором качества становится время, за которое была опубликована новостная статья. В результате все большее число традиционных источников новостей сообщают о необоснованной информации из-за спешки быть первыми.
В представленной работе рассматривается метод определения наличия слухов в средствах массовой информации для русского языка. Метод нацелен на изучение возможности поиска слухов среди сообщений пользователей в социальных сетях. Для достижения цели используются различные способы анализа текста, такие как семантический и лингвистический, а также анализ распространения записей относительно временных отрезков. За время выполнения задачи были проанализированы популярные инструменты для получения данных из социальных сетей, а также вручную составлена и промаркирована выборка для обучения нейронной сети.
В качестве инструмента решения задачи использовалась нейронная сеть, в основе которой лежит многослойный персептрон. На вход поступает набор из 15 измерений, которые оценивают все стороны сообщения, а в качестве выхода — вероятность наличия слуха. Проверка выполнена при помощи различных измерений, которые показали высокие результаты для построенной модели нейронной сети. Кросс-валидация показала, что модель способна выдерживать различные проверки на высоком уровне.

Список литературы:

  1. Клименко C. Сбор маркетинговой информации и конкурентная разведка с использованием социальных сетей / С. Клименко // Финансовая жизнь. 2012. Том 1. № 1. С. 27-31.

  2. Коршунов А. Анализ социальных сетей: методы и приложения / А. Коршунов, И. Белобородов и др. // Труды Института системного программирования РАН. 2014. Том 26. № 1. С. 439-456.

  3. Мартышкин А. И. Этапы сбора и представления больших данных / А. И. Мартышкин, И. И. Сальников, Д. В. Пащенко // Известия Тульского государственного университета. Технические науки. 2018. № 9. С. 617-628.

  4. Мильчук Я. Анализ данных социальных сетей как способ сбора информации / Я. Мильчук // Научный журнал. 2018. Том 5. № 28. С. 30-31.

  5. Михалева К. А. Байесовские классификаторы на основе главных компонент и оценка их качества в условиях отсутствия контрольных выборок / К. А. Михалева, А. И. Кубарев, В. В. Поддубный // Научное творчество молодежи. Математика. Информатика: материалы XIX Всероссийской научно-практической конференции. 2015. C. 70-75.

  6. Agarwal A. Sentiment analysis of Twitter data / A. Agarwal, B. Xie, I. Vovsha, O. Rambow, A. R. Passonneau // Proceedings of the Workshop on Languages in Social Media. Association for Computational Linguistics. 2011. Pp. 30-38.

  7. Benoit K. Quanteda: an R package for the quantitative analysis of textual data / K. Benoit, K. Watanabe, H. Wang, P. Nulty, A. Obeng, S. Müller, A. Matsuo // Journal of Open Source Software. 2018. Vol. 3. № 30. P. 774. DOI: 10.21105/joss.00774

  8. Chua A. Y. K. Linguistic predictors of rumor veracity on the Internet / A. Y. K. Chua, S. Banerjee // Proceedings of the International MultiConference of Engineers and Computer Scientists. 2016. Vol. 1. Pp. 387-391.

  9. Du J. Extracting psychiatric stressors for suicide from social media using deep learning / J. Du, Y. Zhang, J. Luo, Y. Jia, Q. Wei, C. Tao, H. Xu // BMC Medical Informatics and Decision Making. 2018. Vol. 18. Article № 43. DOI: 10.1186/s12911-018-0632-8

  10. Friggeri A. Rumor cascades / A. Friggeri, L. Adamic, D. Eckles, J. Cheng / International AAAI Conference on Web and Social Media. 2014. Pp. 101-110. URL: https://www.aaai.org/ocs/index.php/ICWSM/ICWSM14/paper/view/8122

  11. Hamidian S. Rumor detection and classification for Twitter data / S. Hamidian, M. Diab. // SOTICS 2015: The 5th International Conference on Social Media Technologies, Communication, and Informatics. 2015. Pp. 71-77.

  12. Ma J. Detecting rumors from microblogs with recurrent neural networks / J. Ma, W. Gao, P. Mitra, S. Kwon, B. J. Jansen, K.-F. Wong, M. Cha // Proceedings of the 25th International Joint Conference on Artificial Intelligence. 2016. Pp. 3818-3824.

  13. Pandas: powerful Python data analysis toolkit // pandas.pydata.org. URL: https://pandas.pydata.org/pandas-docs/stable/index.html

  14. Smith K. Statistics of the social network Twitter / K. Smith // Brandwatch. 2017. URL: https://www.brandwatch.com/blog/twitter-stats-and-statistics/

  15. Takahashi T. Rumor detection on Twitter / T. Takahashi, N. Igata // Soft Computing and Intelligent Systems (SCIS). 2012. № 6. Pp. 452-457.

  16. Thomas K. Suspended accounts in retrospect: an analysis of Twitter spam / K. Thomas, C. Grier, V. Paxson, D. Song // Proceedings of the ACM SIGCOMM Conference on Internet Measurement Conference. 2011. Pp. 243-258.

  17. Vosoughi S. Automatic detection and verification of rumors on Twitter: Ph. D. thesis / S. Vosoughi. Cambridge: Massachusetts Institute of Technology, 2015.

  18. Zhao Z. Enquiring minds: early detection of rumors in social media from enquiry posts / Z. Zhao, P. Resnick, Q. Mei // Proceedings of the 24th International Conference on World Wide Web. 2015. Pp. 1395-1405. DOI: 10.1145/2736277.2741637