
В Бурятии оцифруют коллекции книг на восточных языках
Проект по оцифровке древних книг на тибетском и старописьменном монгольском языках реализуется в Бурятии по нацпроекту «Наука и университеты». Работа ведется в Центре восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН. Об этом сообщили в республиканском министерстве образования и науки.
«Пилотный проект заложил базу для создания полнофункциональной системы оптического распознавания символов тибетской письменности, на основе которой происходит поточное декодирование сканированного текста. После обработки 500 текстов полученный алгоритм достиг точности распознавания символов 94%, что дает около 80% правильности декодирования символов», — сообщили в министерстве.
Работа по оцифровке поможет создать цифровой «текстовый корпус», он, в свою очередь, станет основой для систем автоматизированного перевода искусственным интеллектом.
«Мы должны выйти на машинный перевод текстов с тибетского языка и старописьменного монгольского, пока создается система оптического распознавания символов, — отметил доктор исторических наук, кандидат физико-математических наук, координатор Центра восточной рукописи и ксилографов института монголоведения, буддологии и тибетологии Олег Ринчинов. — Получив электронные тексты, мы приступим к развитию машинного перевода».
В Институте монголоведения, буддологии и тибетологии СО РАН ведутся уникальные исследования в области тибетской и восточной медицины, создаются современные биологические добавки, лекарства и средства для сохранения долголетия. В Центре восточных рукописей и ксилографов хранятся 100 тыс. книг и документов на тибетском языке и 7 тыс. — на старописьменном монгольском.
Согласно целям национального проекта «Наука и университеты», Россия должна войти в пятерку стран, ведущих разработки в приоритетных областях. Нацпроекты, инициированные президентом РФ Владимиром Путиным, стартовали в 2019 году.
Подпишитесь на новости национального проекта