Выпуск:
2025. Том 11. № 1 (41)Об авторах:
Остапенко Светлана Валерьевна, соискатель кафедры медиакоммуникаций, технологий рекламы и связей с общественностью, Алтайский государственный университет, Барнаул, РоссияАннотация:
Признание важности формальной параметризации текстов в интернет-коммуникации привело к распространению больших языковых моделей (large language models, LLMs), которые могут создавать тексты на естественном языке на основе пользовательских параметров через интерфейс запроса (промт). Промт-инжиниринг как техника улучшения взаимодействия пользователя с программными алгоритмами посредством моделирования релевантных запросов стал востребованным инструментом для совершенствования механизмов генерации текстов. В данной статье исследуется феномен лингвистической оптимизации запроса (промта) и его влияние на качество генерируемого текста. В задачи исследования входят анализ функционирования запросов генерации текста, изучение возможностей формализации и параметризации запроса, а также экспериментальное исследование влияния детализации запроса на качество генерируемого текста. Результаты показывают, что избыточная параметризация запроса в целом ухудшает показатели лексического разнообразия текста, что свидетельствует о переобучении модели. Оптимальные параметры промтов для генерации высококачественного текста варьируются в пределах двух-трех параметров (тип используемой конструкции, указание на жанрово-стилевые параметры текста), что указывает на необходимость формализации промтов для достижения лучших результатов генерации текста. Применение формализации запросов для уточнения задач генерации текста связывает инжиниринг промтов с когнитивной инженерией знаний. Промт, предсказывающий содержание текста, выступает в качестве когнитивного эквивалента модели речевого события, на которое влияют метатекстовые данные о коммуникативной задаче, имеющиеся у пользователя. Перспективы исследований в области промт-инжиниринга связаны не только с улучшением процессов создания искусственных текстов, но и с развитием структурированных подходов к онтологизации знаниевой парадигмы, представленной в текстах определенного дискурса.Ключевые слова:
Список литературы:
Вежбицка А. 1985. Речевые акты // Новое в зарубежной лингвистике. Вып. XVI. Лингвистическая прагматика / сост. и вступ. Н. Д. Арутюновой и Е. В. Падучевой, общ. ред. Е. В. Падучевой. М.: Прогресс. С. 251–275.
Захарова Е. Ю., Савина О. Ю. 2020. Лексическое разнообразие текста и способы его измерения // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. Том 6. № 1 (21). С. 20–34. https://doi.org/10.21684/2411-197X-2020-6-1-20-34
Николаев Ф. А. 2018. Структурно-семантические и коммуникативно-прагматические характеристики англоязычных рекламных SEO-текстов: дис. … канд. филол. наук. СПБГЭУ. 190 с.
Полоян А. В., Приходько К. Д. 2023. Составление промпта в нейросети midjourney для генерации иллюстраций к творчеству А. П. Чехова // Информационные технологии в гуманитарных исследованиях: материалы Междунар. науч.-практ. конф. (Красноярск, 25–28 сентября 2023 г.) / отв. ред. М. А. Лаптева. Красноярск: Сиб. федер. унт. С. 194–199.
Соколова М. Е. 2024. ChatGPT и промпт-инжиниринг: о перспективах внедрения генеративных нейросетей в науке // Науковедческие исследования. № 1. С. 92–109. https://doi.org/10.31249/scis/2024.01.07
Солдаткина Я. В., Чернавский А. С. 2023. Генеративные языковые модели как актуальный феномен медиакультуры в начале XXI века // Наука и школа. № 4. С. 44–56. http://doi.org/10.31862/1819-463X-2023-4-44-56
Халина Н. В. 2014. Лингвистический инжиниринг и лингвистика инжиниринга: адаптация языковедческой парадигмы к обстоятельствам эпохи инжиниринга // Научно-методический электронный журнал «Концепт». Том 20. С. 3811–3815. http://e-koncept.ru/2014/55027.htm
Черкасова М. Н., Тактарова А. В. 2024. Искусственно сгенерированный академический текст (лингвопрагматический аспект) // Филологические науки. Вопросы теории и практики. Том 17. Вып. 7. С. 2551–2557. https://doi.org/10.30853/phil20240363
Шелестюк Е. В., Щетинкина Е. А. 2023. Стохастичность и энтропия в лингвистике // Вестник Челябинского государственного университета. № 2 (472). С. 150–165.
Johansson V. 2008. Lexical diversity and lexical density in speech and writing: a developmental perspective // Working Papers. Vol. 53. Pp. 61–79. https://journals.lub.lu.se/LWPL/article/view/2273 (дата обращения: 05.05.2025).
Koizumi R. 2012. Relationships between text length and lexical diversity measures: can we use short texts of less than 100 tokens? // Vocabulary Learning and Instruction. Vol. 1. No. 1. Pp. 60–69. https://doi.org/10.7820/vli.v01.1.koizumi
McCarthy P. M., Jarvis S. 2010. MTLD, vocd-D, and HD-D: a validation study of sophisticated approaches to lexical diversity assessment // Behavior Research Methods. Vol. 42. No. 2. Pp. 381–392. https://doi.org/10.3758/brm.42.2.381
Ure J. 1971. Lexical density and register differentiation // Applications of Linguistics: Selected Papers of the Second International Congress of Applied Linguistics, Cambridge 1969 / ed. G. E. Perren, J. L. M. Trim. Cambridge: Cambridge Univ. Press. Pp. 443–452.
White J., Fu Q., Hays S., Sandborn M., Olea C., Gilbert H., Elnashar A., Spencer-Smith J., Schmidt D. C. 2023. A prompt pattern catalog to enhance prompt engineering with ChatGPT // arXiv preprint. 2 Feb. https://doi.org/10.48550/arXiv.2302.11382