Американські вчені відновили фрагменти древніх месопотамських текстів — в цьому допомогла нейромережа

Журналістка

18 вересня 2020 07:29

Фрагменти текстів епохи Стародавньої МесопотаміїНаціональна академія наук США

Дослідники Каліфорнійського університету в Лос—Анджелесі використали технологію штучного інтелекту, щоб відновити пошкоджені фрагменти текстів епохи Стародавньої Месопотамії.

Про це повідомляють на сайті Національної академії наук США.

Вчені повідомили, що документальні джерела політичної, економічної та соціальної історії Стародавньої Месопотамії — це сотні тисяч глиняних табличок тексту, написаного клинописом. Більшість із них пошкоджені та мають прогалини у реченнях, відсутні частини якраз відновлюють експерти.

Месопотамський клинопис, що?

Це одна з перших відомих форм письма. Ймовірно, її винайшли у південній частині Месопотамії наприкінці четвертого тисячоліття до нашої ери й спочатку використовували для запису щоденного бухгалтерського обліку на глиняних дощечках.

З часом вони пошкоджуються, на них з’являються тріщини та плями, що ускладнює повне відтворення інформації вручну.

Відновлені тексти епохи Стародавньої МесопотаміїНаціональна академія наук США

Що прочитала нейромережа?

Вченим вдалося з'ясувати, що архівні тексти мали щонайменше три основні частини: розділ, що складався з одного або декількох формальних пунктів; список свідків, іноді супроводжувався їхніми печатками на табличці; письмовий підпис, який включав ім'я та походження писаря, місце та точну дату.

Адміністративні тексти, навпаки, представлені переважно у формі списку, де детально описували об'єкти та сторони. Використовували скорочені формули та конкретні ключові слова. Вони, як правило, датовані, але не мають підписів автора і практично не мають списків свідків.

Як їм це вдалося?

Вчені використали доступні оцифровані тексти для тренування вдосконалених алгоритмів машинного навчання, щоб реставрувати економічні та адміністративні документи Перської імперії (XI-IV ст. до н.е.).

Дослідники зібрали транслітеровані тексти сайту Achemenet та розробили метод, за яким нейронна мережа автоматично заповнює у них пропуски. В основі методу — модель, яка має назву 2-gram. Принцип її роботи полягає у передбаченні кожного слова на основі того, як часто воно з’являється у тексті перед попереднім.

Оскільки кількість оцифрованих текстів збільшуватиметься, штучний інтелект можна навчити відновлювати пошкоджені матеріали інших жанрів, як-от наукові чи літературні. Вчені наголосили, що дослідження — перший крок у реставрації втраченої стародавньої спадщини.