Информационные системы


Лаборатория «Лингвистические платформы»



Начиная с 2013 года под руководством г.н.с., д.ф.н. Ю.В.Норманской ведется создание платформы ЛингвоДок lingvodoc.ispras.ru, на которой в настоящее время собраны аудиословари и корпуса более чем на 450 исчезающих диалектах уральских и алтайских языков России.

Помимо места для хранения данных и поиска данных на этой платформе есть возможность одновременной распределенной обработки материала и программы для его анализа, в частности, выявления в он-лайн режиме фонетического сходства языков, употребления тех или иных морфологических параметров в определенном значении, возможности построения карт фонетических, морфологических или лексических изоглосс в синхронии и их изменений в диахронии.

На платформе ЛингвоДок есть возможность размещения данных пользователей из различных организаций с сохранением всех прав создателей словарей и корпусов, возможности работы с данными в режиме, когда материалы открыты только ограниченному числу пользователей, выбранных создателем словаря или корпуса. Но при этом для каждого пользователя ЛингвоДока появляется возможность сравнения данных его словарей по любым параметрам с данным других диалектов с помощью авторских программ сотрудников Лаборатории. Благодаря тому, что на платформе уже сейчас представлены материалы в едином цифровом формате по 450 диалектам уральских и алтайских языков России, суммарный объем которых превышает 2 миллиона словоформ, то анализ сравнительный-исторический, фонетический, морфологический анализ проводится методом обсчета больших данных, что значительно повышает точность полученного результата.

В настоящее время ведется работа в коллаборации с создателями национальных корпусов языков России, создание специальной среды для применения парсеров в он-лайн режиме, снятия омонимии, выявления коллакационных сочетаний. Планируется создание специальных программ для корпусного описания морфологии. На основании более полного описания морфологии планируется создания учебных платформ на базе Revita в сотрудничестве в учеными из Хельсинского университета и филиала НИУ «Высшая школа экономики» в Санкт-Петербурге.

На базе Лаборатории с 2020 года будут проводиться курсы повышения квалификации «Цифровые методы для описания языков народов России», где слушатели получат информацию о всех возможностях платформы ЛингвоДок и получат в индивидуальном режиме указания о возможностях обработки именно их материала.

Грант РНФ № 20-18-00403. Цифровое описание диалектов уральских языков на основании анализа больших данных

В настоящее время многие уральские диалекты не имеют описаний фонетики и грамматики и словарей, существующие очерки сделаны по разным стандартам и труднодоступны. Сами языки и архивы, в которых содержатся материалы по ним, находятся под угрозой исчезновения. Энтузиасты из регионов часто пытаются самостоятельно выработать графическую систему для записи текстов на своем диалекте для создания словарей, букварей и учебников. В большинстве случаев она различается у разных носителей, и способы фиксации диалектов в XXI веке фактически оказываются на уровне менее стандартизированном, чем у создателей первых славянских книг в начале XI-XIII вв. Это в ряде случаев провоцирует конфликты в регионах.

В результате работы над проектом на сайте lingvodoc.ispras.ru будут представлены словари по всем диалектным группам уральских языков как современные, собранные в полевых условиях, так и наиболее ранние, найденные нами в архивах. С помощью специальных программ будет проведен их фонетический и сравнительно-исторический анализ, который позволит на полном материале словарей различных диалектов выявить степень их генетической близости. Результаты этого анализа будут отражены на карте РФ и в виде графиков генетических деревьев.

Пресса

В Уфе представили цифровые технологии для изучения башкирского языка

Руководитель

Норманская Юлия Викторовна заведующий лабораторией, г.н.с., д.ф.н. Руководитель гранта РНФ № 20-18-00403 Цифровое описание диалектов уральских языков на основании анализа больших данных.

Сотрудники лаборатории

Алпатов Владимир Михайлович, главный научный сотрудник, академик РАН, д.ф.н. (по гранту РНФ)
Амелина Мария Константиновна, младший научный сотрудник
Баженова Ольга Николаевна, младший научный сотрудник (по гранту РНФ)
Безенова Мария Петровна, старший научный сотрудник, к.ф.н.
Воробьева Виктория Владимировна, научный сотрудник, к.ф.н.
Гаджиева Анар Ахметбековна, старший научный сотрудник, к.ф.н.
Гайдамашко Роман Валентинович, старший научный сотрудник, к.ф.н. (по гранту РНФ)
Казакевич Ольга Анатольевна, старший научный сотрудник, к.ф.н. (по гранту РНФ)
Кашкин Егор Владимирович, старший научный сотрудник, к.ф.н. (по гранту РНФ)
Клементьева Елена Филипповна, научный сотрудник, к.ф.н. (по гранту РНФ)
Ключева Мария Аркадьевна, научный сотрудник, к. иск. (по гранту РНФ)
Ковылин Сергей Васильевич, старший научный сотрудник, к.ф.н.
Кошелюк Наталья Андреевна, младший научный сотрудник (по гранту РНФ)
Левина Мария Захаровна, научный сотрудник, к.ф.н. (по гранту РНФ)
Ли Полина Игоревна, лаборант (по гранту РНФ)
Мищенкова Карина Олеговна, младший научный сотрудник
Молданова Ирина Максимовна, младший научный сотрудник (по гранту РНФ)
Напольнова Елена Марковна, старший научный сотрудник, к.ф.н.
Новак Ирина Петровна, научный сотрудник, к.ф.н. (по гранту РНФ)
Нуриева Фануза Шакуровна, главный научный сотрудник, д.ф.н.
Пустогачева Оксана Николаевна, специалист
Рябова Галина Викторовна, научный сотрудник, к.ф.н. (по гранту РНФ)
Федина Марина Серафимовна, старший научный сотрудник, к.ф.н. (по гранту РНФ)
Федотова Идалия Вячеславовна, младший научный сотрудник
Хозумова Раиса Павловна, лаборант (по гранту РНФ)