Совмещение динамических характеристик почерка и модели ConvNeXtV2 для распознавания рукописных символов на русскоязычных и англоязычных наборах данных
Новости
Совмещение динамических характеристик почерка и модели ConvNeXtV2 для распознавания рукописных символов на русскоязычных и англоязычных наборах данных
Аннотация
Представленная работа развивает результаты исследования автора по использованию динамических характеристик движения пера для повышения качества распознавания рукописного текста. В настоящей статье мы объединяем ранее предложенную динамическую компоненту (угловые и спектральные признаки траекторий) с флагманской моделью глубокой нейронной сети распознавания изображений ConvNeXtV2 tiny, и проводим исследование на трех наборах данных: EMNIST (by_class), UJI Pen Characters 2 и собственном наборе Russian Handwritings Tracked. Показано, что после умеренной настройки аугментаций визуальная ветвь достигает на наборе EMNIST результата уровня SOTA среди сравниваемых моделей, тогда как динамическая ветвь и их ансамбль обеспечивают прирост устойчивости на наборах с большей вариативностью почерка (UJI, Russian Handwritings Tracked). Итоги подтверждают комплементарность визуальных и кинематических признаков и указывают на перспективность метода для сценариев «сложного почерка».
Ключевые слова
Издание
Труды Института системного программирования РАН, том 38, вып. 2, 2026, стр. 195-203.
ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).
DOI: 10.15514/ISPRAS-2026-38(2)-13
Для цитирования
Полный текст статьи в формате pdf
Вернуться к содержанию тома