Preview

Труды Института системного программирования РАН

Расширенный поиск

Контекстное разрешение омонимии на основе центроидно-контекстной модели

https://doi.org/10.15514/ISPRAS-2022-34(5)-11

Аннотация

В статье описывается новый метод контекстного разрешения омонимии на основе центроидно-контекстной модели (ЦКМ). Предлагаемый метод выявления случаев омонимии в корпусе текстов и ее разрешения с помощью модели ЦКМ базируется на теоретической концепции фразеологического концептуального анализа текстов (ФКАТ) и уникальной машинной грамматике, в основу которой положена система флективных классов русских слов. Заложенное в теоретической концепции флективных классов слов русского языка жесткое соответствие между формой представления слов и их грамматической информацией позволило создать на этой основе новые классы – классы слов, имеющие одинаковые наборы грамматических признаков, соответствующие их формам представления в сходных контекстных окружениях. При разработке этой модели авторы исходили из следующей гипотезы: одинаковым последовательностям обобщенных символов классов слов (обобщенным синтагмам) должны соответствовать одинаковые синтаксические структуры различных фрагментов текстов. При этом предполагалось, что такая гипотеза верна для любых синтаксических моделей и может быть полезна при решении как глобальных, так и частных задач анализа текста. С помощью этого метода было предложено новое решение задачи разрешение омонимии на основе предлагаемой модели ЦКМ.

Об авторах

Александр Алексеевич ХОРОШИЛОВ
Федеральный исследовательский центр «Информатика и управление» РАН, Московский авиационный институт, 327-й Центральный научно-исследовательский институт МО РФ
Россия

Доктор технических наук, профессор МАИ, ведущий научный сотрудник ФИЦ ИУ РАН, старший научный сотрудник 27 ЦНИИ Минобороны России



Юрий Викторович НИКИТИН
Федеральный исследовательский центр «Информатика и управление» РАН, Научно-промышленная компания «Высокие технологии и стратегические системы»
Россия

Научный сотрудник ФИЦ ИУ РАН, руководитель группы разработки АО «НПК «ВТ и СС»



Анна Владимировна КАН
Московский авиационный институт, Национальный исследовательский центр «Институт имени Н.Е. Жуковского»
Россия

Кандидат технических наук, доцент МАИ, начальник аналитического отдела ФГБУ «НИЦ «Институт имени Н.Е. Жуковского



Яна Дмитриевна КОЗЛОВСКАЯ
Научно-промышленная компания «Высокие технологии и стратегические системы»
Россия

Участник группы разработки АО "НПК "ВТ и СС"



Екатерина Андреевна ЕВДОКИМОВА
Московский авиационный институт
Россия

Студентка



Список литературы

1. Baum L.E., Petrie T. Statistical inference for probabilistic functions of finite state Markov chains. The annals of mathematical statistics, vol. 37, issue 6, 1966, pp. 1554-1563.

2. Lafferty J., McCallum A., Pereira F.C.N. Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In Proc. of the Eighteenth International Conference on Machine Learning, 2001, pp. 282-289.

3. Elman J.L. Finding structure in time. Cognitive science, vol. 14, issue 2, 1990, pp. 179-211.

4. Manning C.D., Raghavan P., Schütze H. Introduction to Information Retrieval, Cambridge University Press, 2008, 506 p.

5. Sha F., Pereira F. Shallow parsing with conditional random fields. In Proc. of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology, vol. 1, 2003, pp. 134-141.

6. Хорошилов Александр А., Мусабаев Р.Р. и др. Автоматическое выявление и классификация информационных событий в текстах СМИ. Научно-техническая информация. Серия 2: Информационные процессы и системы, вып. 7, 2020 г., стр. 27-38 / Khoroshilov Alexandr A., Musabaev R.R. et al. Automatic Detection and Classification of Information Events in Media Texts. Automatic Documentation and Mathematical Linguistics, vol. 54, issue 4, 2020, pp. 202–214.

7. Аблов И.В., Козичев В.Н и др. Средства машинной грамматики русского языка (по Г.Г. Белоногову). Научно-техническая информация. Серия 2: Информационные процессы и системы, вып. 6, 2018 г., стр. 32-46 / Ablov I.V., Kozichev V.N. The Tools of a Machine Grammar of the Russian Language (based on G.G. Belonogov). Events in Media Texts. Automatic Documentation and Mathematical Linguistics, vol. 52, issue 3, 2020, pp. 142-156.

8. Калинин Ю.П., Хорошилов Александр А., Хорошилов Алексей А. Современные технологии автоматизированной обработки текстовой информации. Системы высокой доступности, том 11, вып. 2, 2015 г. / Kalinin Yu.P., Khoroshilov Alexander A., Khoroshilov Alexey A. Modern technologies for automated text processing. High Availability Systems, vol. 11, issue 2, 2015 (in Russian).


Рецензия

Для цитирования:


ХОРОШИЛОВ А.А., НИКИТИН Ю.В., КАН А.В., КОЗЛОВСКАЯ Я.Д., ЕВДОКИМОВА Е.А. Контекстное разрешение омонимии на основе центроидно-контекстной модели. Труды Института системного программирования РАН. 2022;34(5):171-182. https://doi.org/10.15514/ISPRAS-2022-34(5)-11

For citation:


KHOROSHILOV A.A., NIKITIN Yu.V., KAN A.V., KOZLOVSKAYA Ya.D., EVDOKIMOVA E.A. Context resolution of homonymy based on a centroid-context model. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2022;34(5):171-182. (In Russ.) https://doi.org/10.15514/ISPRAS-2022-34(5)-11



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)