пн-пт: 9:00 - 18:00
8 (812) 386-99-80
Санкт-Петербург
8 (495) 988-99-80
Москва
обратный звонок

24 октября 2011  С помощью машинного перевода расшифрован таинственный манускрипт 18 века

Прошло более 60 лет с того момента, как Уоррен Уивер, первооткрыватель машинного перевода, предложил применение дешифрации сообщений для решения задач перевода с иностранного языка.
В своем неоднократно цитируемом письме, написанном в 1947 году математику Норберту Винеру, Уивер завил: «Все обычно удивляются, каким образом проблемы перевода могут быть связаны с криптографией. Когда я смотрю на статью, написанную на русском языке, я обычно говорю: «На самом деле это написано на английском, только зашифровано с помощью каких-то странных символов. Сейчас попробую расшифровать».
Подобный взгляд на предмет и лежит в основе зарождения таких статистических языковых программ как GoogleTranslate – и появления новых инструментов дешифровки сообщений, дошедших до нас со времен Средневековья.
Современные лингвисты из Швеции и США применили технику перевода, основанную на законах статистики для расшифровки одного из самых загадочных в истории посланий 18 века Copiale Cipher, которое представляет собой написанный от руки манускрипт на 105 страницах. Ученые рассказали о проделанной работе на заседании Ассоциации Вычислительной Лингвистики в Портленде, штат Орегон.
Обнаруженный в академическом архиве бывшей Восточной Германии в великолепном переплете из золотой и зеленой парчи, этот манускрипт состоит из 75000 знаков и представляет собой причудливую смесь загадочных символов и латинских букв. Свое название манускрипт получил по одной из всего лишь двух надписей, оставшихся нерасшифрованными во всем документе.
Кевин Найт, ученый и программист Института информатики Университета Южной Калифорнии, совместно с Беатой Мегьяши и Кристиан Шэфер из Упсальского университета (Швеция), сумели расшифровать первые 16 страниц. Эти страницы содержали детальное описание ритуала некого тайного общества, которое имело отношение к офтальмологии и хирургии глаза.
«Все началось, как занимательное времяпрепровождение на выходные», - рассказал доктор Найт в одном из интервью, добавив: «У меня нет особого опыта в криптографии. Мой профиль – вычислительная лингвистика и машинный перевод».
Не будучи до конца уверенными, какой язык используется в манускрипте, ученые продирались через дебри древнего документа, следуя своей интуиции. Сначала им показалось, что вся информация кроется в латинских буквах, а не в абстрактных символах.
Но затем, их теория провалилась: они поняли, что информация была зашифрована с помощью так называемого омофонического шифра (шифрование одного и того же символа открытого текста разными символами из некоторого набора), применение которого не предполагает наличие прямой взаимосвязи между оригинальным языком и шифром. Исследователи пришли к выводу, что манускрипт написан на немецком языке.
В конце концов, ученые пришли к заключению, что латинские буквы были пустышкой, предназначенной для того, чтобы сбить с толку шифровальщиков, а некоторые символы обозначают пробелы между словами. Еще одним потрясающим открытием стала роль двоеточия, как знака повтора предыдущего согласного. Исследователи использовали технику машинного перевода с иностранного языка, чтобы понять, что означает тот или иной символ на немецком.
«Выяснилось, что техника машинного перевода очень эффективно работает в процессе дешифрования», - прокомментировал доктор Найт.
Работу над манускриптом продолжили и другие исследователи. «Расшифровка CopialeCipher – это огромная заслуга Кевина Найта и его коллег», признается Ник Пиллинг, английский дизайнер и программист, основавший Cipher Mysteries, новостной блог о криптографии.
Когда успех в дешифровке манускрипта стал очевидным, доктор Найт и его коллеги занялись и другими шифрами.
«Существует столько древних книг и языков, имеющих поистине огромное историческое значение, окоторых мы даже не подозреваем и которые представляют огромный интерес для множества людей», - рассказывает доктор Найт в документальном фильме, посвященном работе над Copiale.
Работа над манускриптом представляет особую ценность для историков, которые интересуются распространением политических веяний того времени. Секретные общества возникали в 18 веке повсеместно, рассказывает доктор Найт, и они, безусловно, повлияли на революции во Франции и США. Расшифровав манускрипт, Найт немедленно поделился своим открытием с Андреасом Оннерфорсом, историком Лундского Университета (Швеция), специалиста по тайным обществам.
«Когда он увидел книгу и ее расшифрованную версию, это действительно взволновало его», - рассказывает доктор Найт. «Ученый обнаружил в конце манускрипта важнейшие комментарии, повествующие о правах человека. Это представляло огромный интерес для историка».
Среди примеров разгадки шифров дешифрация посланий серийного убийцы Зодиака калифорнийской полиции в 60-70-х годах 20 века и знаменитый Криптос (скульптура с зашифрованным текстом) , установленный перед центральным офисом ЦРУ, расшифровать текст на котором удалось только частично. Камнем преткновения в мире криптографии и дешифрации остается Рукопись Войнича. Состоящая из 240 богато иллюстрированных пергаментных страниц, эта рукопись оказалась не по зубам самым знаменитым дешифровщикам. Несмотря на то, что многие криптографы считают эту рукопись мистификацией, большинство исследователей полагают, что она датируется началом 15 века.
Совместно с Чикагским университетом в 2011 году доктор Найт опубликовал подробный анализ манускрипта, в котором содержатся новые факты и открытия, касающиеся структуры текста, соответствующей реальному языку, хотя и не развенчивается полностью теория о мистификации.
«Это (Рукопись Войнича) один из самых загадочных манускриптов Войнича», - утверждает Найт. «Он полон таинственных и сложных символов, тому, кто создал его, пришлось немало поработать. Я полагаю, что это, безусловно, шифр»
Статья в оригинале находится на Интернет-ресурсе:http://www.nytimes.com/2011/10/25/science/25code.html?_r=1