geektimes

Специалист по ИИ утверждает, что ему удалось понять, на каком языке написан манускрипт Войнича

  • вторник, 30 января 2018 г. в 03:13:51
https://geektimes.ru/post/297623/
  • Научно-популярное




Манускрипт Войнича — весьма интересный артефакт средневекового прошлого. Это рукописная книга, которая была написана около 500 лет назад неизвестным автором, на неизвестном языке, с использованием неизвестного алфавита. С того момента, как информация о ней появилась в широком доступе, ее пытались расшифровать не один десяток раз, но успеха никто не добился. Некоторые криптографы, которые потратили не один год на расшифровку, считают, что эта книга вообще является мистификацией, в которой вообще нет никакого смысла.

Рукопись Войнича стала известной благодаря американскому книготорговцу литовского происхождения Вифриду Войничу. Он ее приобрел в 1912 году. В настоящее время книга находится в Библиотеке редких книг Байнеке (Beinecke Rare Book And Manuscript Library) Йельского университета. Она состоит из 240 страниц тонкого пергамента, размер страницы составляет 15*23 см. Толщина книги — около 3 см. В книге есть большое количество иллюстраций, почти на всех страницах.

За время проб и попыток разгадать манускрипт сообщалось о множестве разных версий как о происхождении книги, так и о ее наполнении. Но, к сожалению, подтверждения сказанному ни в одном из случаев привести не удалось. Больше всего продвинулись в том, чтобы рассказать о наполнении манускрипта не криптографы, а ботаник Артур Такер (Arthur O. Tucker) из Университета Делавэра и IT-специалист Рексфорд Толберт (Rexford H. Talbert). Результаты своих изысканий ученые опубликовали в 2014 году в журнале HerbalGram — The Journal of the American Botanical Council.

Ученые смогли идентифицировать несколько десятков растений из 303 представленных, 6 животных и один минерал. Почти все, что было указано в манускрипте, произрастает и обитает в Центральной Америке. Ученые пришли к выводу, что книга написана на одном из диалектов Ацтекского языка, а в ней описывается содержимое «ботанического сада» в Центральной Мексике.

Сейчас об очередном сдвиге в этом деле сообщил специалист по искусственному интеллекту Грег Кондрак из Альбертского университета. Рассказывая о том, почему он начал заниматься расшифровкой манускрипта, Кондрак сообщил, что это в природе человека — узнать о загадке и начать ее разгадывать. «Мне было интересно и я решил заняться этим делом».

Поскольку ранее расшифровкой манускрипта занимались лишь отдельные люди (или группы специалистов), то Кондрак принял решение использовать в качестве вспомогательного инструмента то, в чем он хорошо разбирается — искусственный интеллект. Его университет как раз создал программное обеспечение, способное решать многие задачи, включая расшифровку закодированных сообщений.

Кондракт со своим коллегой перевели Всеобщую декларацию прав человека на 380 языков. Затем, используя специальные алгоритмы, они обучили компьютерную систему распознавать разные языки. И она смогла правильно определить язык в 97 случаях из ста.

После того, как этот алгоритм ознакомили с манускриптом Войнича, система сообщила, что книга, вероятнее всего, написана на иврите, и при этом зашифрована (в последнем утверждении нет ничего нового). Следующим шагом была расшифровка самого текста. Ученые считают, что буквы в словах переставлены, и для понимания того, о чем говорится в манускрипте, необходимо расположить их правильно.

Так ученые и поступили, правда, не со всем текстом, а с его начальными предложениями. Как оказалось, первое из них гласило: «Она дала рекомендации священнику, главе дома, мне и людям». Также из 72 первых слов текста ученые выделили такие, как «фермер » (или крестьянин), «свет», «воздух» и «огонь».

Что касается дальнейшей расшифровки, то ученые говорят, что это требует времени. И для работы над манускриптом желательно привлечь специалистов, которые знают иврит и одновременно являются специалистами по истории. В этом случае текст можно будет расшифровать и наконец, рассказать миру, о чем говорится в манускрипте. Правда, теперь другим специалистам придется проверить правильность предположений Кондрака и его коллег.