Генерация изображений рукописного текста на русском языке


Генерация изображений рукописного текста на русском языке

Анастасия Олеговна БОГАТЕНКОВА, Оксана Владимировна БЕЛЯЕВА, Андрей Игоревич ПЕРМИНОВ

Аннотация

Задача автоматического распознавания рукописного текста является важной составляющей в процессе анализа электронных документов, однако её решение все еще далеко от идеала. Одной из основных причин сложности распознавания рукописного текста на русском языке является недостаточное количество данных, используемых для обучения моделей распознавания. При этом, для русского языка проблема встаёт более остро и усугубляется большим разнообразием сложных почерков. В данной работе исследуется влияние различных методов генерации дополнительных обучающих наборов данных на качество моделей распознавания: метод на основе рукописных шрифтов, метод склейки слов из символов StackMix, метод на основе генеративно-состязательной сети. В рамках данной работы был разработан новый метод создания изображений рукописного текста на русском языке на основе шрифтов. Кроме того, предлагается алгоритм формирования нового кириллического рукописного шрифта на основе имеющихся изображений рукописных символов. Эффективность разработанного метода проверялась с помощью экспериментов, которые проводились на двух общедоступных кириллических наборах данных с помощью двух различных моделей распознавания. Результаты экспериментов показали, что разработанный метод генерации изображений позволил повысить точность распознавания рукописного текста в среднем на 6%, что сравнимо с результатами других, более сложных методов. Исходный код экспериментов, предложенного метода, а также сгенерированные в процессе экспериментов наборы данных выложены в открытый доступ и готовы для скачивания.

Ключевые слова

распознавание рукописного текста, генерация рукописного текста, глубокое обучение, компьютерное зрение

Издание

Труды Института системного программирования РАН, том 35, вып. 2, 2023, 19-34

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2023-35(2)-2

Для цитирования

Анастасия Олеговна БОГАТЕНКОВА, Оксана Владимировна БЕЛЯЕВА, Андрей Игоревич ПЕРМИНОВ Генерация изображений рукописного текста на русском языке. Труды Института системного программирования РАН, том 35, вып. 2, 2023, 19-34 DOI: 10.15514/ISPRAS-2023-35(2)-2.

Полный текст статьи в формате pdf Вернуться к содержанию тома