- Об институте
- Инновации
- Структура
- Отдел "Архитектуры вычислительных систем"
- Отдел "Информационных систем"
- Отдел "Компиляторных технологий"
- Отдел "Системного программирования"
- Отдел "Системной интеграции и прикладных программных комплексов"
- Отдел "Теоретической информатики"
- Отдел "Технологий программирования"
- Ученый совет
- Диссертационный совет
- Центр верификации ОС Linux
- Исследовательский центр доверенного искусственного интеллекта
- Центр компетенции по параллельным и распределенным вычислениям
- Образование
- Издания
- Новости
- Лицензии
Устранение лексической многозначности терминов Википедии на основе Скрытой Модели Маркова.
Авторы
Турдаков Д.
Аннотация
В статье описывается способ автоматического устранения лексической многозначности терминов естественного языка, использующий открытую энциклопедию Википедию. Рассматриваются проблемы применения существующих алгоритмов, и предлагается собственный метод, основанный на скрытой модели Маркова, параметры которой вычисляются на основе словаря и ссылочной структуры Википедии. Также, предлагается эвристика для ускорения описанного алгоритма, и приводятся экспериментальные оценки точности на различных тестовых корпусах.
Полный текст статьи в формате pdfИздание
Труды 11-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL’2009, Петрозаводск, Россия, 2009.
Научная группа
Все публикации за 2009 год
