Аспирант из Новосибирска разработала программу для сохранения тибетских текстов

freepik
Студентка аспирантуры создала новаторскую ML-платформу для автоматического выявления и перевода в цифровой формат старинных тибетских рукописей. Эта инициатива имеет своей целью сохранить свыше 70 тысяч манускриптов XVIII–XX столетий из хранилищ Сибирского филиала Российской академии наук, которые находятся в опасности исчезновения.
В основе приложения – нейросеть, прошедшая обучение на текстах, взятых из собрания Института монголоведения, буддологии и тибетологии СО РАН. Это дало возможность создать систему, приспособленную к особенностям тибетской письменности и лингвистическим тонкостям текстов.
Разработчик осуществила лингвистическую атрибуцию, что гарантировало адекватность расшифрованных символов их истинному значению. Также она разработала алгоритм оценки качества распознавания, позволяющий свести к минимуму погрешности и увеличить точность обработки текстов.
Созданный комплекс демонстрирует повышенную точность распознавания символов тибетского письма брахми в сопоставлении с известными решениями. Автоматизация процесса перевода в цифровой формат включает в себя стадии сегментирования изображений, предварительной обработки сведений и отождествления символов.
Тексты, предназначенные для оцифровки, заключают в себе бесценные данные по философии, медицине и истории Тибета, что представляет для научного мира и культурного достояния высокую степень важности. Естественное обветшание бумаги и ухудшение качества чернил угрожают сохранности этих источников. Эта разработка способствует консервации знаний для грядущих поколений, гарантируя доступность и сохранность текстов.
Предполагается внедрение системы в архивные организации Сибирского отделения РАН, что обеспечит автоматизацию процедуры оцифровки и поднимет её продуктивность.
Обратите внимание: У россиян глаза по полтиннику: Названа точная стоимость перелета семьи в аэропорт Геленджика и обратно
Пишет ТАСС