Google DeepMind обучила ИИ восстанавливать утраченные части латинских надписей
Компания Google DeepMind создала открытую нейросеть Aeneas, способную восстанавливать утраченные фрагменты древних латинских надписей. Информация опубликована на официальном сайте проекта. Разработка ориентирована на помощь историкам и эпиграфистам в интерпретации поврежденных памятников римской письменности.
Aeneas работает на основе анализа контекста: учитываются период и место обнаружения артефакта, что позволяет сузить круг возможных вариантов. Модель сопоставляет словарный запас, типичный для конкретной эпохи и региона, а также актуальные события того времени. Это помогает алгоритму максимально точно «предсказать» утраченные слова. При этом разработчики подчёркивают, что модель не гарантирует абсолютную точность, особенно в случаях, когда неизвестна длина утраченного фрагмента. Точность восстановления при повреждении до 10 % — 73 %; при неизвестной длине — 58 %
Aeneas названа в честь Энея из древнеримского эпоса. Она создана командой DeepMind совместно с учеными из университетов Ноттингема, Уорвика, Оксфорда и Афин.
Алгоритм обучили на ~176 000 латинских надписях (всего 16 млн символов). Он обрабатывает текстовые и визуальные данные, определяет, где (зависит от одной из 62 провинций) и когда (с точностью до ±13 лет) была создана надпись. При этом он находит аналогии текста по стилю, форме и контексту.
Интерактивная версия Aeneas доступна на сайте predictingthepast.com. Код и база данных открыты для исследовательского использования.
По мнению разработчиков, использование ИИ в эпиграфике позволит восстанавливать больше исторической информации даже при частичных утраченных данных. Ведь даже ошибаясь в конкретных словах, Aeneas может подсказать основной посыл текста.