Выпуск:
2021. Том 7. № 3 (27)Об авторах:
Брунова Елена Георгиевна, доктор филологических наук, профессор кафедры английского языка, военный историк, Тюменский государственный университет; egbrunova@mail.ru; ORCID: 0000-0002-8493-5932Аннотация:
Существующие системы по успешному и точному определению тональности текста основаны на статистических и математических принципах. Однако ничуть не менее интересными и перспективными являются работы, которые посвящены изучению лингвистических особенностей выражения оценки. Результаты данной формализации возможно применить как в области аффективных вычислений для дальнейшего совершенствования автоматических систем, так и для лингвистики и смежных с ней наук.
Новизна данного исследования заключается, прежде всего, в составлении алгоритма, основанного на выявленных лингвистических правилах. Кроме того, материалом исследования стал политический дискурс, который еще недостаточно изучен специалистами аффективных вычислений. Актуальность работы обоснована растущей необходимостью категоризации публикуемой в сети Интернет информации.
Цель исследования заключается в создании системы машинного определения тональности англоязычного политического дискурса, а также в выявлении аспектов сообщаемой информации для последующего применения в разработке. В статье рассматриваются лингвистические особенности анализа тональности и предлагается классификация лингвистических единиц с оценочным потенциалом применительно к структурным уровням языка. Также приводятся результаты эксперимента по тестированию работы системы автоматического определения тональности, проведенного на 300 документах новостей и комментариев, взятых с сайта reddit.com, раздел r/politics. Точность работы системы составила 92%. Кроме того, в ходе исследования была выполнена ручная разметка отобранных 40 комментариев, в ходе которой эксперт выявил 25 аспектов. Помимо этого, были выявлены 3 формальные закономерности в распределении аспектных терминов, что является необходимым для создания автоматической системы. Первая закономерность заключается в том, что аспектные термины повторяются в двух последовательно идущих предложениях. Вторая — аспектные термины часто являются темой предложения. Наконец, третья — выявлена высокая частота распределения аспектных терминов в начале и конце текста (документа).
Ключевые слова:
Список литературы:
Брунова Е. Г. Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания / Е. Г. Брунова, Ю. В. Бидуля // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. 2017. Том 3. № 1. С. 72-89.
Ван Дейк Т. А. Дискурс и власть: репрезентация доминирования в языке и коммуникации / Т. А. Ван Дейк; пер. с англ. М.: Книжный дом «ЛИБРОКОМ», 2013. 344 с.
Комиссарова Н. Г. Оценочность в дискурсе СМИ / Н. Г. Комиссарова, Д. Р. Якупова // Филологические науки. Вопросы теории и практики. 2018. № 2-1 (80). С. 83-87.
Марьянчик В. А. Оценка как категория текста / В. А. Марьянчик // Вестник Северного (Арктического) федерального университета. Серия: Гуманитарные и социальные науки. 2011. № 1. С. 100-103.
Папина А. Ф. Текст: его единицы и глобальные категории / А. Ф. Папина. М.: УРСС, 2002. 367 с.
Чудинов А. П. Россия в метафорическом зеркале: когнитивное исследование политической метафоры (1991-2000): монография / А. П. Чудинов. Екатеринбург: Урал. гос. пед. ун-т, 2001. 238 с.
Шейгал Е. И. Семиотика политического дискурса: дис. ... д-ра филол. наук / Е. И. Шейгал. М.: РГБ, 2005. 431 с.
Bhatt A. et al. Amazon review classification and sentiment analysis / A. Bhatt et al. // International Journal of Computer Science and Information Technologies. 2015. Vol. 6. No. 6. Pp. 5107-5110.
Blinov P. D. Semantic similarity for aspect-based sentiment analysis / P. D. Blinov, E. V. Kotelnikov // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (Moscow, 27-30 May 2015). Мoscow: RSUH, 2015. Iss. 14 / V. P. Selegey (ed.). Pp. 12-22.
Cambria E. Affective computing and sentiment analysis / E. Cambria // IEEE Intelligent Systems. 2016. Vol. 31. No. 2. Pp. 102-107.
Emotion classification using NRC Lexicon in Python, 2020. URL: https://www.geeksforgeeks.org/emotion-classification-using-nrc-lexicon-in-python/ (дата обращения: 23.05.2021).
Fang X. Sentiment analysis using product review data / X. Fang, J. Zhan // Journal of Big Data. 2015. Vol. 2. No. 1. Pp. 1-14.
Fellbaum C. WordNet: An Electronic Lexical Database / C. Fellbaum. Cambridge, MA: MIT Press, 1998. 499 рp.
Gold D. et al. Corpus of aspect-based sentiment in political debates / D. Gold et al. // Proceedings of the 14th Conference on Natural Language Processing (KONVENS 2018). Vienna, 2018. Pp. 89-99.
Haselmayer M. Sentiment analysis of political communication: combining a dictionary approach with crowdcoding / M. Haselmayer, M. Jenny // Quality & Quantity. 2017. No. 51. Pp. 2623-2646.
Hatzivassiloglou V. Predicting the semantic orientation of adjectives / V. Hatzivassiloglou, K. McKeown // Proceedings of the 35th Annual Meeting of ACL. Madrid, 1997. Pp. 174-181.
Lin C. Joint sentiment/topic model for sentiment analysis / C. Lin, Y. He // Proceedings of the 18th ACM Conference on Information and Knowledge Management, 2009. Pp. 375-384.
Mayorov V. A high precision method for aspect extraction in Russian / V. Mayorov, I. Andrianov, N. Astrakhantsev, V. Avanesov, I. Kozlov, D. Turdakov // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (Moscow, 27-30 May 2015). Мoscow: RSUH, 2015. Iss. 14 / V. P. Selegey (ed.). Pp. 34-44.
Miller G. A. WordNet: A Lexical Database for English / G. A. Miller. 1995. URL: https://wordnet.princeton.edu/
Minsky M. The emotion machine: сommonsense thinking / M. Minsky // Artificial Intelligence, and the Future of the Human Mind. Simon & Schuster, 2006. 400 рр.
Mittal A. Stock prediction using twitter sentiment analysis / A. Mittal, A. Goel // CS229: Machine Learning. Standford University Course. 2012. Vol. 15. URL: http://cs229.stanford.edu/proj2011/GoelMittal-StockMarketPredictionUsingTwitterSentimentAnalysis.pdf (дата обращения: 23.05.2021).
Mukherjee S. Feature specific sentiment analysis for product reviews / S. Mukherjee, P. Bhattacharyya // International Conference on Intelligent Text Processing and Computational Linguistics. Berlin; Heidelberg: Springer, 2012. Pp. 475-487.
Mullen T. A preliminary investigation into sentiment analysis of informal political discourse / T. Mullen, R. Malouf // AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs. 2006. Pp. 159-162.
Neidhardt J. Predicting happiness: user interactions and sentiment analysis in an online travel forum / J. Neidhardt, N. Rümmele, H. Werthner // Information Technology & Tourism. 2017. Vol. 17. No. 1. Pp. 101-119.
Poria S. Fusing audio, visual and textual clues for sentiment analysis from multimodal content / S. Poria, E. Cambria, N. Howard, G.-B. Huang, A. Hussain // Neurocomputing. 2016. No. 174. Pp. 50-59.
Reddit.com: website. URL: www.reddit.com (дата обращения: 23.05.2021).
Spencer J. Sentimentor: sentiment analysis of Twitter data / J. Spencer, G. Uchyigit // SDAD@ ECML/PKDD. 2012. Pp. 56-66.
Vasilyev V. G. Aspect extraction and Twitter sentiment classification by fragment rules / V. G. Vasilyev, A. A. Denisenko, D. A. Solovyev // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue” (Moscow, 27-30 May 2015). Мoscow: RSUH, 2015. Iss. 14 / V. P. Selegey (ed.). Pp. 76-88.
Wang X. et al. Topic sentiment analysis in Twitter: a graph-based hashtag sentiment classification approach / X. Wang et al. // Proceedings of the 20th ACM International Conference on Information and Knowledge Management. 2011. Pp. 1031-1040.