Lingvodoc: виртуальная лаборатория для документации исчезающих языков
Lingvodoc – система для совместной многопользовательской документации исчезающих языков, создания многослойных словарей и научной работы с полученными звуковыми и текстовыми данными. Совместный проект с Институтом языкознания РАН и Томским государственным университетом. Разрабатывается с 2012 года. Сайт– lingvodoc.ispras.ru.
Особенности и преимущества
Lingvodoc – кроссплатформенная технология с открытым исходным кодом (https://github.com/ispras/lingvodoc и https://github.com/ispras/lingvodoc-react), основанная на научных исследованиях.
Lingvodoc – это:
- Совместная работа пользователей над пополнением словарных данных (в отличие от аналогичного проекта Starling, где такая работа не предусмотрена).
- Сохранение полной истории действий пользователей.
- Одновременная работа с аудиотекстовыми корпусами и словарями на основе интеграции с программой ELAN, разработанной Институтом психолингвистики Макса Планка (Нидерланды).
- Расставление однонаправленных и двунаправленных связей между лексическими входами внутри словарей, а также между словарями.
- Запись, проигрывание и хранение звуков с разметкой (в форматах WAV, MP3иFLAC), а также построение формант гласных с последующей визуализацией.
- Продвинутый поиск, который позволяет искать данные в словарях по множеству параметров (в отличие от аналогичного проекта TypeCraft).
- Возможность поиска данных на карте с автоматическим построением изоглосс.
- Возможность бесконфликтной двусторонней отложенной синхронизации.
- Повышенный уровень автоматизации (по сравнению с аналогичным проектом Kielipankki): возможность проводить автоматический этимологический и фонетический анализ.
- Создание словарей любой структуры, как типичных двуслойных (слой лексических входов и слой парадигм), так и многослойных. Кроме того, существует функция импорта для готовых словарных структур.
- Наличие программ, воспроизводящих работу ученых по фонетическому и этимологическому анализу.
- Возможность уточнения классификации языков и диалектов с построениями графиков в форматах 2D и 3D по глоттохронологии, морфологии, этимологико-фонетическим признакам.
- Возможность размещения корпусов текстов в формате Word и словарей в формате Excel.
- Встроенные морфологические анализаторы для языков народов России в формате Aperitum.
- Удобный интерфейс для ручного снятия омонимии после работы морфологического анализатора.
- Работа как с привлечением облачных ресурсов ИСП РАН, так и с развёртыванием локальной версии с изоляцией собственных данных.
- Наличие программы для веб-просмотра и десктопной версии.
- Открытая регистрация (с подтверждением).
- Оперативная доработка технологии с расширением набора функций, а также адаптация под другую научную отрасль.
На основе глоссированных корпусов Lingvodoc и программ анализа создана драфтовая версия обучающей платформы edu.ispras.ru, объединяющая 10 000 заданий на 9 языках. Платформа предоставляет возможность:
- создавать упражнения на языках России для любого возраста и уровня владения (любой учитель может создавать свои упражнения, и ему не придётся самому их проверять);
- выполнять упражнения как на родном языке, так и на иностранном, причём каждому ученику программа может подбирать задания индивидуально в зависимости от его ошибок.
Для кого предназначен Lingvodoc?
В первую очередь, Lingvodoc разработан для лингвистов, ведущих научную работу в сфере документации языков народов России. Однако возможна доработка технологии под другие цели.
Опыт внедрения
Основной функционал Lingvodoc используется филологами из 29 вузов и НИИ из 16 городов. В числе научно-образовательных организаций: Томский государственный университет, Институт филологии СО РАН, Институт истории, языка и литературы Уфимского научного центра РАН, Удмуртский федеральный исследовательский центр УрО РАН, Северо-Восточный федеральный университет, Югорский государственный университет, Институт языка, литературы и истории КарНЦ РАН, Мурманский арктический государственный университет. Специалисты, использующие платформу, готовы к проведению мастер-классов для своих коллег.
В 2023 г. четыре потока учёных из нескольких городов России прошли курсы дополнительного образования по направлению «Использование возможностей платформы Lingvodoc в работе лингвистов» (в том числе в Башкирском государственном университете и в РУДН).
Схема работы
Перейти к списку всех технологий