Lingvodoc: виртуальная лаборатория для документации исчезающих языков


Скачать сборник технологий

Lingvodoc: виртуальная лаборатория для документации исчезающих языков

Lingvodoc – система для совместной многопользовательской документации исчезающих языков, создания многослойных словарей и научной работы с полученными звуковыми и текстовыми данными. Совместный проект с Институтом языкознания РАН и Томским государственным университетом. Разрабатывается с 2012 года. Сайт– lingvodoc.ispras.ru.

Особенности и преимущества

Lingvodoc – кроссплатформенная технология с открытым исходным кодом (https://github.com/ispras/lingvodoc и https://github.com/ispras/lingvodoc-react), основанная на научных исследованиях.

Lingvodoc – это:

  • Совместная работа пользователей над пополнением словарных данных (в отличие от аналогичного проекта Starling, где такая работа не предусмотрена).
  • Сохранение полной истории действий пользователей.
  • Одновременная работа с аудиотекстовыми корпусами и словарями на основе интеграции с программой ELAN, разработанной Институтом психолингвистики Макса Планка (Нидерланды).
  • Расставление однонаправленных и двунаправленных связей между лексическими входами внутри словарей, а также между словарями.
  • Запись, проигрывание и хранение звуков с разметкой (в форматах WAV, MP3иFLAC), а также построение формант гласных с последующей визуализацией.
  • Продвинутый поиск, который позволяет искать данные в словарях по множеству параметров (в отличие от аналогичного проекта TypeCraft).
  • Возможность поиска данных на карте с автоматическим построением изоглосс.
  • Возможность бесконфликтной двусторонней отложенной синхронизации.
  • Повышенный уровень автоматизации (по сравнению с аналогичным проектом Kielipankki): возможность проводить автоматический этимологический и фонетический анализ.
  • Создание словарей любой структуры, как типичных двуслойных (слой лексических входов и слой парадигм), так и многослойных. Кроме того, существует функция импорта для готовых словарных структур.
  • Наличие программ, воспроизводящих работу ученых по фонетическому и этимологическому анализу.
  • Возможность уточнения классификации языков и диалектов с построениями графиков в форматах 2D и 3D по глоттохронологии, морфологии, этимологико-фонетическим признакам.
  • Возможность размещения корпусов текстов в формате Word и словарей в формате Excel.
  • Встроенные морфологические анализаторы для языков народов России в формате Aperitum.
  • Удобный интерфейс для ручного снятия омонимии после работы морфологического анализатора.
  • Работа как с привлечением облачных ресурсов ИСП РАН, так и с развёртыванием локальной версии с изоляцией собственных данных.
  • Наличие программы для веб-просмотра и десктопной версии.
  • Открытая регистрация (с подтверждением).
  • Оперативная доработка технологии с расширением набора функций, а также адаптация под другую научную отрасль.

На основе глоссированных корпусов Lingvodoc и программ анализа создана драфтовая версия обучающей платформы edu.ispras.ru, объединяющая 10 000 заданий на 9 языках. Платформа предоставляет возможность:

  • создавать упражнения на языках России для любого возраста и уровня владения (любой учитель может создавать свои упражнения, и ему не придётся самому их проверять);
  • выполнять упражнения как на родном языке, так и на иностранном, причём каждому ученику программа может подбирать задания индивидуально в зависимости от его ошибок.

Для кого предназначен Lingvodoc?

В первую очередь, Lingvodoc разработан для лингвистов, ведущих научную работу в сфере документации языков народов России. Однако возможна доработка технологии под другие цели.

Опыт внедрения

Основной функционал Lingvodoc используется филологами из 29 вузов и НИИ из 16 городов. В числе научно-образовательных организаций: Томский государственный университет, Институт филологии СО РАН, Институт истории, языка и литературы Уфимского научного центра РАН, Удмуртский федеральный исследовательский центр УрО РАН, Северо-Восточный федеральный университет, Югорский государственный университет, Институт языка, литературы и истории КарНЦ РАН, Мурманский арктический государственный университет. Специалисты, использующие платформу, готовы к проведению мастер-классов для своих коллег.

В 2023 г. четыре потока учёных из нескольких городов России прошли курсы дополнительного образования по направлению «Использование возможностей платформы Lingvodoc в работе лингвистов» (в том числе в Башкирском государственном университете и в РУДН).

Схема работы

Lingvodoc: виртуальная лаборатория для документации исчезающих языков

Перейти к списку всех технологий