Высокоточный метод извлечения аспектных терминов для русского языка


Высокоточный метод извлечения аспектных терминов для русского языка

Авторы

Майоров В., Андрианов И., Астраханцев Н., Аванесов В., Козлов И., Турдаков Д.

Аннотация

Данная статья представляет работу, проделанную ИСП РАН, по задаче извлечения аспектных терминов на SentiRuEval 2015. Наша команда подготовила решения для задач А и В и получила лучшую точность результатов для обеих задач для всех предметных областей среди всех участников. Наш метод также показал лучшую F1-меру для точного совпадения аспектных терминов в задаче А для предметной области "автомобили", а также в обеих задачах для предметной области "рестораны". Метод основан на последовательной классификации токенов с помощью SVM. Он использует локальные и глобальные признаки, а также признаки на основе синтаксиса, GloVe, тематического моделирования и автоматического распознавания терминологии. В данной статье мы также представляем оценки статистической значимости различных групп признаков.

Полный текст статьи в формате pdf

Издание

Компьютерная лингвистика и интеллектуальные технологии (Труды ежегодной международной конференции “Диалог”). Выпуск 14(21). Том 2. 2015. сс. 34-43.

Научная группа

Информационные системы

Все публикации за 2015 год Все публикации