- Об институте
- Инновации
- Структура
- Отдел "Архитектуры вычислительных систем"
- Отдел "Информационных систем"
- Отдел "Компиляторных технологий"
- Отдел "Системного программирования"
- Отдел "Системной интеграции и прикладных программных комплексов"
- Отдел "Теоретической информатики"
- Отдел "Технологий программирования"
- Ученый совет
- Диссертационный совет
- Центр верификации ОС Linux
- Исследовательский центр доверенного искусственного интеллекта
- Центр компетенции по параллельным и распределенным вычислениям
- Образование
- Издания
- Новости
- Лицензии
Smart Context Generation for Disambiguation to Wikipedia
Авторы
Andrey Sysoev Irina Nikishina
Аннотация
Wikification is a crucial NLP task that aims to identify en- tities in text and disambiguate their meaning. Being partially solved for English, the problem still remains fairly untouched for Russian. In this article we present a novel approach to Disambiguation to Wikipedia applied to the Russian language. Inspired by the Neural Machine Trans- lation task our method implements encoder-decoder neural network ar- chitecture. It allows to translate text tokens into concept embeddings that are subsequently used as context for disambiguation. In order to test our hypothesis we add our context feature to GLOW system con- sidered a baseline. Moreover, we present commonly available dataset for the Disambiguation to Wikipedia task.
Ключевые слова
Disambiguation to Wikipedia, Wikification for Russian, Encoder-decoder neural network architecture, Concept embeddings
Издание
7th International Conference, AINL 2018, St. Petersburg, Russia, October 17–19, 2018