Сравнительный анализ порождения глагольного эллипсиса большими языковыми моделями (LLMs) и человеком


Сравнительный анализ порождения глагольного эллипсиса большими языковыми моделями (LLMs) и человеком

Найденова К.А. (ВМА, Санкт-Петербург, Россия)
Булыкина Е.С. (СПбПУ, Санкт-Петербург, Россия)
Пархоменко В.А. (СПбПУ, Санкт-Петербург, Россия)
Мартирова Т.А. (ВМА, Санкт-Петербург, Россия)

Аннотация

Настоящая работа посвящена сравнительному анализу порождения глагольного эллипсиса большими языковыми моделями (LLM) и человеком. Актуальность исследования обусловлена необходимостью понимания того, насколько современные нейросети способны воспроизводить сложные и контекстно-зависимые лингвистические феномены, характерные для естественной речи. В ходе исследования был проведен серийный эксперимент, в котором модели GigaChat, YandexGPT и Gemini преобразовывали полные предложения в эллиптические. Для коррекции ошибок генерации и улучшения контекстуализации использовался метод RAG (Retrieval-Augmented Generation). Отмечается, что LLM, в отличие от людей, демонстрируют более строгое формальное следование инструкции по исключению глагола. Результаты показывают сходство стратегий LLM и человека. Исследование поднимает вопрос о валидности существующих метрик для оценки подобных лингвистических задач.

Ключевые слова

эллипсис; большие языковые модели; метод RAG.

Издание

Труды Института системного программирования РАН, том 38, вып. 3, часть 4, 2026, стр. 145-156.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2026-38(3)-52

Для цитирования

Найденова К.А., Булыкина Е.С., Пархоменко В.А., Мартирова Т.А. Сравнительный анализ порождения глагольного эллипсиса большими языковыми моделями (LLMs) и человеком. Труды Института системного программирования РАН, том 38, вып. 3, часть 4, 2026, стр. 145-156. DOI: 10.15514/ISPRAS-2026-38(3)-52.

Полный текст статьи в формате pdf Вернуться к содержанию тома