Институт системного программирования им. В.П. Иванникова РАН


Lingvodoc: виртуальная лаборатория для документации исчезающих языков

Lingvodoc – система для совместной многопользовательской документации исчезающих языков, создания многослойных словарей и научной работы с полученными звуковыми и текстовыми данными. Совместный проект с Институтом языкознания РАН и Томским государственным университетом. Разрабатывается с 2012 года. Сайт– lingvodoc.ispras.ru.

Особенности и преимущества

Lingvodoc – кроссплатформенная технология с открытым исходным кодом (https://github.com/ispras/lingvodoc и https://github.com/ispras/lingvodoc-react), основанная на научных исследованиях.

Lingvodoc – это:

  • Совместная работа пользователей над пополнением словарных данных (в отличие от аналогичного проекта Starling, где такая работа не предусмотрена).
  • Сохранение полной истории действий пользователей.
  • Одновременная работа с аудиотекстовыми корпусами и словарями на основе интеграции с программой ELAN, разработанной Институтом психолингвистики Макса Планка (Нидерланды).
  • Расставление однонаправленных и двунаправленных связей между лексическими входами внутри словарей, а также между словарями.
  • Запись, проигрывание и хранение звуков с разметкой (в форматах WAV, MP3иFLAC), а также построение формант гласных с последующей визуализацией.
  • Продвинутый поиск, который позволяет искать данные в словарях по множеству параметров (в отличие от аналогичного проекта TypeCraft).
  • Возможность поиска данных на карте с автоматическим построением изоглосс.
  • Возможность бесконфликтной двусторонней отложенной синхронизации.
  • Повышенный уровень автоматизации (по сравнению с аналогичным проектом Kielipankki): возможность проводить автоматический этимологический и фонетический анализ.
  • Создание словарей любой структуры, как типичных двуслойных (слой лексических входов и слой парадигм), так и многослойных. Кроме того, существует функция импорта для готовых словарных структур.
  • Наличие программ, воспроизводящих работу ученых по фонетическому и этимологическому анализу.
  • Возможность размещения корпусов текстов в формате Word и словарей в формате Excel.
  • Встроенные морфологические анализаторы для языков народов России в формате Aperitum.
  • Удобный интерфейс для ручного снятия омонимии после работы морфологического анализатора.
  • Работа как с привлечением облачных ресурсов ИСП РАН, так и с развёртыванием локальной версии с изоляцией собственных данных.
  • Наличие программы для веб-просмотра и десктопной версии.
  • Открытая регистрация (с подтверждением).
  • Оперативная доработка технологии с расширением набора функций, а также адаптация под другую научную отрасль.

Для кого предназначен Lingvodoc?

В первую очередь, Lingvodoc разработан для лингвистов, ведущих научную работу в сфере документации языков народов России. Однако возможна доработка технологии под другие цели.

Опыт внедрения

Основной функционал Lingvodoc используется филологами из 29 вузов и НИИ из 16 городов. В числе научно-образовательных организаций: Томский государственный университет, Институт филологии СО РАН, Институт истории, языка и литературы Уфимского научного центра РАН, Удмуртский федеральный исследовательский центр УрОРАН, Северо-Восточный федеральный университет, Югорский государственный университет, Институт языка, литературы и истории КарНЦ РАН, Мурманский арктический государственный университет. Специалисты, использующие платформу, готовы к проведению мастер-классов для своих коллег.

Схема работы

Lingvodoc: виртуальная лаборатория для документации исчезающих языков

Разработчик/участник

Перейти к списку всех технологий