В России планируют автоматизировать обработку исторических рукописных документов

freepik.com
Учёные МГУ создают алгоритм для автоматизации работы с историческими рукописями
Факультет вычислительной математики и кибернетики МГУ разработал алгоритм для поиска ключевых слов в рукописных текстах. Система предназначена для упрощения работы с архивными и историческими документами. Об этом сообщает ТАСС.
Как работает алгоритм
Метод рассматривает рукописный текст как набор штрихов, формируемых движением пера. Алгоритм сегментирует изображение, нормализует штрихи и классифицирует их с математическим описанием формы. Сопоставление последовательностей штрихов запроса и документа позволяет находить совпадения и оценивать точность.
Преимущества для архивов
В отличие от стандартного распознавания текста, система работает напрямую с изображением, сохраняя визуальные особенности текста. Это особенно важно для исторических рукописей и сканов архивных материалов.
Результаты и применение
Эксперименты показали высокую точность обнаружения заданных элементов. Разработка применима для архивов, исторических документов и материалов в виде сканов и фотографий.
Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.


