Аспирант из Новосибирска разработала программу для сохранения тибетских текстов

Аспирант разработала программу для сохранения т...

freepik

Студентка аспирантуры создала новаторскую ML-платформу для автоматического выявления и перевода в цифровой формат старинных тибетских рукописей. Эта инициатива имеет своей целью сохранить свыше 70 тысяч манускриптов XVIII–XX столетий из хранилищ Сибирского филиала Российской академии наук, которые находятся в опасности исчезновения.

В основе приложения – нейросеть, прошедшая обучение на текстах, взятых из собрания Института монголоведения, буддологии и тибетологии СО РАН. Это дало возможность создать систему, приспособленную к особенностям тибетской письменности и лингвистическим тонкостям текстов.

Разработчик осуществила лингвистическую атрибуцию, что гарантировало адекватность расшифрованных символов их истинному значению. Также она разработала алгоритм оценки качества распознавания, позволяющий свести к минимуму погрешности и увеличить точность обработки текстов.

Созданный комплекс демонстрирует повышенную точность распознавания символов тибетского письма брахми в сопоставлении с известными решениями. Автоматизация процесса перевода в цифровой формат включает в себя стадии сегментирования изображений, предварительной обработки сведений и отождествления символов.

Тексты, предназначенные для оцифровки, заключают в себе бесценные данные по философии, медицине и истории Тибета, что представляет для научного мира и культурного достояния высокую степень важности. Естественное обветшание бумаги и ухудшение качества чернил угрожают сохранности этих источников. Эта разработка способствует консервации знаний для грядущих поколений, гарантируя доступность и сохранность текстов.

Предполагается внедрение системы в архивные организации Сибирского отделения РАН, что обеспечит автоматизацию процедуры оцифровки и поднимет её продуктивность.

Обратите внимание: У россиян глаза по полтиннику: Названа точная стоимость перелета семьи в аэропорт Геленджика и обратно

Пишет ТАСС