Совмещение динамических характеристик почерка и модели ConvNeXtV2 для распознавания рукописных символов на русскоязычных и англоязычных наборах данных


Совмещение динамических характеристик почерка и модели ConvNeXtV2 для распознавания рукописных символов на русскоязычных и англоязычных наборах данных

Яценко Д.В. (ИВТиПТ ЮФУ, Ростов-на-Дону, Россия)

Аннотация

Представленная работа развивает результаты исследования автора по использованию динамических характеристик движения пера для повышения качества распознавания рукописного текста. В настоящей статье мы объединяем ранее предложенную динамическую компоненту (угловые и спектральные признаки траекторий) с флагманской моделью глубокой нейронной сети распознавания изображений ConvNeXtV2 tiny, и проводим исследование на трех наборах данных: EMNIST (by_class), UJI Pen Characters 2 и собственном наборе Russian Handwritings Tracked. Показано, что после умеренной настройки аугментаций визуальная ветвь достигает на наборе EMNIST результата уровня SOTA среди сравниваемых моделей, тогда как динамическая ветвь и их ансамбль обеспечивают прирост устойчивости на наборах с большей вариативностью почерка (UJI, Russian Handwritings Tracked). Итоги подтверждают комплементарность визуальных и кинематических признаков и указывают на перспективность метода для сценариев «сложного почерка».

Ключевые слова

распознавание рукописного текста; онлайн-почерк; кинематические признаки; траектория пера; спектральные признаки; модель ConvNeXtV2; набор данных EMNIST; набор данных UJI2; набор данных Russian Handwritings Tracked; ансамблирование.

Издание

Труды Института системного программирования РАН, том 38, вып. 2, 2026, стр. 195-203.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2026-38(2)-13

Для цитирования

Яценко Д.В. Совмещение динамических характеристик почерка и модели ConvNeXtV2 для распознавания рукописных символов на русскоязычных и англоязычных наборах данных. Труды Института системного программирования РАН, том 38, вып. 2, 2026, стр. 195-203. DOI: 10.15514/ISPRAS-2026-38(2)-13.

Полный текст статьи в формате pdf Вернуться к содержанию тома