Система делает понимание древнеегипетского письма доступным независимо от уровня знаний.
Ученые Института AIRI, ИСП РАН и ИТМО разработали систему, которая может точно распознавать и переводить иероглифические тексты. Основным источником данных при обучении модели стал «Thesaurus Linguae Aegyptiae» – самое полное собрание древнеегипетских текстов с переводами. Точность работы модели оценивалась в два этапа. Сначала применялись автоматические метрики, затем тексты оценивали профессиональные египтологи из НИУ ВШЭ.
В перспективе разработку можно будет использовать, например, в мобильных приложениях дополненной реальности. Туристы, которые приходят в музей или видят древнеегипетский артефакт, смогут навести на него камеру и понять, что там написано. Кроме того, ресурс поможет исследователям усовершенствовать процесс дешифровки и интерпретации новых материалов, а студентам-египтологам, которые только начинают изучать язык, облегчить процесс обучения. Еще одно перспективное применение созданной системы — обогащение больших языковых моделей знаниями в области археологии и применение разработанных методов генерации синтетических данных для распознавания рукописных текстов на других языках.
Распознавание иероглифов более сложная задача по сравнению с алфавитным письмом: вместо 30-40 букв алфавита требуется «понимание» сотен уникальных символов. Многие из них визуально очень похожи. Кроме того, важен точный перевод специфической лексики, используемой в египтологии.
Для решения этих вопросов ученые использовали OCR-модели, которые учитывают контекст. Это помогло снимать неоднозначность при рассмотрении иероглифов, которые выглядят похоже, но означают разные вещи. Для увеличения размера обучающего набора данных применялись диффузионные модели, генерирующие реалистичные изображения иероглифических текстов.

«Средняя строка древнеегипетского текста из нашего датасета содержит примерно 35 иероглифов. Это наглядно показывает, насколько информационно плотным является иероглифическое письмо, и подчеркивает важность точного распознавания каждого символа», – отметил Иннокентий Хумонен, научный сотрудник Института AIRI.
«Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвященную разработке метода, мы уже представили на международной конференции SIGGRAPH 2025. Четыре другие статьи приняты к публикации на конференциях уровня A* — ICCV, IEEE ISMAR и ACM Multimedia. На данный момент доступ к системе открыт по запросу для заинтересованных специалистов», – отметил PhD, ведущий научный сотрудник Института AIRI и руководитель проекта Илья Макаров.
Читать далее:
Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу
Испытания ракеты Starship Илона Маска вновь закончились взрывом в небе
Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды
Обложка: freepik