stringtranslate.com

Расшифровка

В филологии дешифровка — это открытие значения символов, обнаруженных в вымерших языках и /или алфавитах . [1]

Дешифрование пересекается с другой технической областью, известной как криптоанализ , областью, которая направлена ​​на расшифровку записей, используемых в секретной связи, известной как шифротекст . Известный случай этого был в криптоанализе Энигмы во время Второй мировой войны . Многие другие шифры прошлых войн были взломаны только недавно. [2] Однако, в отличие от расшифровки языка, субъекты, использующие шифротекст, намеренно создают препятствия, чтобы помешать посторонним раскрыть смысл системы связи. [3]

На сегодняшний день не менее дюжины языков остаются нерасшифрованными. [4] Знаменательной недавней расшифровкой стала расшифровка линейного эламского письма. [5]

Категории

По мнению Гельба и Уайтинга, подход к дешифрованию зависит от четырех категорий ситуаций в нерасшифрованном языке: [3] [6]

Методы

Существует ряд методов, позволяющих расшифровать вымершую письменность или язык. Их можно разделить на подходы, использующие внешнюю или внутреннюю информацию. [3]

Внешняя информация

Многие успешные шифровки исходили из открытия внешней информации, распространенным примером является использование многоязычных надписей , таких как Розеттский камень (с одним и тем же текстом в трех письменностях: демотической , иероглифической и греческой ), что позволило расшифровать египетские иероглифы. В принципе, многоязычный текст может быть недостаточным для расшифровки, поскольку перевод не является линейным и обратимым процессом, а вместо этого представляет собой кодирование сообщения в другой символической системе. Перевод текста с одного языка на другой, а затем со второго языка обратно на первый редко воспроизводит в точности исходное письмо. Аналогичным образом, если только в многоязычном тексте не содержится значительного количества слов, из него можно почерпнуть ограниченную информацию. [3]

Внутренняя информация

Внутренние подходы многошаговые: сначала нужно убедиться, что рассматриваемое письмо представляет собой настоящее письмо, а не группу изобразительных изображений или современную подделку без дальнейшего смысла. Обычно к этому подходят с помощью методов из области грамматологии . Перед расшифровкой смысла можно определить количество отдельных графем (что, в свою очередь, позволяет определить, является ли система письма алфавитной, слоговой или логослоговой; это связано с тем, что такие системы письма обычно не пересекаются по количеству используемых графем [6] ), последовательность письма (будь то слева направо, справа налево, сверху вниз и т. д.) и определение того, правильно ли сегментированы отдельные слова при написании алфавита (например, с использованием пробела или другого специального знака) или нет. Если можно определить повторяющееся схематическое расположение, это может помочь в расшифровке. Например, если в последней строке текста есть небольшое число, можно обоснованно предположить, что оно относится к дате, где одно из слов означает «год», а иногда также появляется королевское имя. Другой случай — когда текст содержит много небольших чисел, за которыми следует слово, за которым следует большее число; здесь слово, вероятно, означает «итого» или «сумма». После того, как информация, которая может быть выведена из вероятного содержания, исчерпана, необходимо перейти к систематическому применению статистических инструментов. К ним относятся методы, касающиеся частоты появления каждого символа, порядка, в котором эти символы обычно появляются, появляются ли некоторые символы в начале или конце слов и т. д. Существуют ситуации, когда орфографические особенности языка затрудняют, если не делают невозможным, расшифровку определенных признаков (особенно без определенной внешней информации), например, когда алфавит не выражает двойные согласные. Существуют также дополнительные и более сложные методы. В конечном итоге применение таких статистических методов становится чрезвычайно трудоемким, и для их автоматического применения можно использовать компьютеры. [3]

Вычислительные подходы

Вычислительные подходы к расшифровке неизвестных языков начали появляться в конце 1990-х годов. [7] Обычно существует два типа вычислительных подходов, используемых при расшифровке языка: подходы, предназначенные для создания переводов на известных языках, и подходы, используемые для обнаружения новой информации, которая может позволить будущие усилия по переводу. Второй подход более распространен и включает такие вещи, как обнаружение родственных или связанных слов, обнаружение ближайшего известного языка, выравнивание слов и многое другое. [6]

Искусственный интеллект

В последние годы все больше внимания уделяется методам, использующим искусственный интеллект для расшифровки утраченных языков, особенно с помощью методов обработки естественного языка (NLP). Методы проверки концепции независимо друг от друга перерасшифровали угаритское и линейное письмо B , используя данные из похожих языков, в данном случае иврита и древнегреческого . [8]

Расшифровка произношения

Связанные с попытками расшифровать значение языков и алфавитов, включают попытки расшифровать, как произносились вымершие системы письма или более старые версии современных систем письма (например, английский в 1600-х годах). В этой связи было разработано несколько методов и критериев. Важные критерии включают (1) Рифмы и свидетельства поэзии (2) Доказательства из случайных написаний и орфографических ошибок (3) Интерпретации материала на одном языке авторами на иностранных языках (4) Информация, полученная из родственных языков (5) Грамматические изменения в написании с течением времени. [9]

Например, анализ поэзии фокусируется на использовании игры слов или литературных приемов между словами, имеющими похожее звучание. Пьеса Шекспира « Ромео и Джульетта» содержит игру слов, которая опирается на похожее звучание между словами «душа» и «подошвы», что позволяет с уверенностью утверждать, что похожее произношение между терминами сегодня также существовало во времена Шекспира. Другим распространенным источником информации о произношении является использование рифмы в более ранних текстах , например, когда последовательные строки в поэзии заканчиваются похожим или одинаковым звуком. Однако этот метод имеет некоторые ограничения, поскольку тексты могут использовать рифмы, которые опираются на визуальное сходство между словами (например, «любовь» и «удалить»), а не на слуховое сходство, и что рифмы могут быть несовершенными . Другой источник информации о произношении исходит из явного описания произношений из более ранних текстов, как в случае с Grammatica Anglicana , например, в следующем комментарии о букве <o>: «В долгое время она, естественно, звучит резко и высоко; как в chósen, hósen, hóly, fólly [...] В короткое время более ровно и похоже на u; как còsen, dòsen, mòther, bròther, lòve, pròve». [10] Другой пример исходит из подробных комментариев о произношении санскрита из сохранившихся трудов санскритских грамматистов. [9]

Вызовы

При расшифровке языков возникает множество проблем, в том числе: [4] [6]

Известные дешифровщики

Смотрите также

Расшифрованные письмена

Нерасшифрованные письмена

Нерасшифрованные тексты

Ссылки

  1. ^ Хотя письменность ливийско-берберская была почти полностью расшифрована, язык — нет.
  1. ^ Траск, Р. Л. (2000). Словарь исторической и сравнительной лингвистики . Издательство Фицроя Дирборна, стр. 82 («Процесс определения связи между исчезнувшей и неизвестной системой письма и языком, который она представляет. Строго говоря, дешифровка — это разъяснение письменности , то есть определение значений написанных символов»)
  2. ^ Бауэр, Крейг П. (2023-03-04). «Новый золотой век дешифровки». Cryptologia . 47 (2): 97–100. doi :10.1080/01611194.2023.2170158. ISSN  0161-1194.
  3. ^ abcde Gelb, IJ; Whiting, RM (1975). «Методы дешифровки». Журнал Королевского Азиатского Общества . 107 (2): 95–104. doi :10.1017/S0035869X00132769. ISSN  2051-2066.
  4. ^ ab Luo, Jiaming; Hartmann, Frederik; Santus, Enrico; Barzilay, Regina; Cao, Yuan (2021). «Расшифровка недостаточно сегментированных древних письменностей с использованием фонетического предшествующего». Труды Ассоциации компьютерной лингвистики . 9 : 69–81. arXiv : 2010.11054 . doi :10.1162/tacl_a_00354. ISSN  2307-387X.
  5. ^ аб Дессет, Франсуа; Табибзаде, Камбиз; Кервран, Матье; Баселло, Джан Пьетро; Маркези и Джанни (1 июля 2022 г.). «Расшифровка линейного эламского письма». Zeitschrift für Assyriologie und vorderasiatische Archäologie . 112 (1): 11–60. дои : 10.1515/za-2022-0003. ISSN  1613-1150.
  6. ^ abcd Браович, Майя; Крстинич, Дамир; Штула, Майя; Иванда, Антония (2024-06-01). «Систематический обзор вычислительных подходов к расшифровке эгейских и кипрских письменностей бронзового века». Компьютерная лингвистика . 50 (2): 725–779. doi : 10.1162/coli_a_00514 . ISSN  0891-2017.
  7. ^ Найт, Кевин; Ямада, Кэндзи (1999). "Вычислительный подход к расшифровке неизвестных текстов" (PDF) . Неконтролируемое обучение при обработке естественного языка .
  8. ^ Луо, Цзямин; Цао, Юань; Барзилай, Регина (2019). «Нейронное дешифрование с помощью потока с минимальной стоимостью: от угаритского к линейному B». arXiv . Ассоциация компьютерной лингвистики: 3146–3155. arXiv : 1906.06718 . doi :10.18653/v1/P19-1303.
  9. ^ ab Campbell, Lyle (2021). Историческая лингвистика: введение (4-е изд.). MIT Press. стр. 372–375. ISBN 978-0-262-53159-7.
  10. ^ Берридж, Кейт; Бергс, Александр (2017). Понимание языковых изменений . Серия «Понимание языка». Лондон, Нью-Йорк: Routledge, Taylor & Francis Group. С. 234–235. ISBN 978-0-415-71339-9.
  11. ^ «Кипро-Силлабический».
  12. ^ "Анатомия дешифровки", http://images.library.wisc.edu/WI/EFacs/transactions/WT1966/reference/wi.wt1966.adcorre.pdf"

Дальнейшее чтение