stringtranslate.com

Триграмма

Триграммы являются частным случаем n -граммы , где n равно 3. Они часто используются в обработке естественного языка для выполнения статистического анализа текстов и в криптографии для управления и использования шифров и кодов . См. результаты анализа "Letter Frequencies in the English Language".

Частота

Контекст очень важен, различные рейтинги анализа и процентные соотношения легко выводятся путем использования различных размеров выборки, разных авторов или разных типов документов: поэзия, научная фантастика, технологическая документация; и уровней написания: рассказы для детей и взрослых, военные приказы и рецепты.

Типичный криптоаналитический частотный анализ показывает, что 16 наиболее распространенных триграмм на уровне символов в английском языке: [1] [2]

Поскольку зашифрованные сообщения, отправленные по телеграфу, часто пропускают знаки препинания и пробелы, криптографический частотный анализ таких сообщений включает триграммы, которые выходят за границы слов. Это приводит к тому, что триграммы, такие как «edt», встречаются часто, даже если они могут никогда не встречаться ни в одном слове этих сообщений. [4]

Примеры

Предложение «быстрая рыжая лиса перепрыгивает через ленивую коричневую собаку» имеет следующие триграммы на уровне слов:

быстрый красныйбыстрая рыжая лисарыжая лиса прыгаетлиса перепрыгиваетперепрыгивает черезнад ленивымиленивый коричневыйленивая коричневая собака

А триграмма на уровне слов «быстрый красный» имеет следующие триграммы на уровне символов (где подчеркивание «_» обозначает пробел):

theон_е_q_куктоuicикск_к_р_рекрасный

Ссылки

  1. ^ ab Lewand, Robert (2000). Криптологическая математика. Математическая ассоциация Америки . стр. 37. ISBN 978-0-88385-719-9.
  2. ^ Линтон, Том (2001). «Относительные частоты букв в общем английском тексте». Центральный колледж . Криптография (Весеннее издание). Архивировано из оригинала 22 января 2007 г.
  3. ^ "Частоты английских букв". Практическая криптография .
  4. ^ "Голосовой поиск SEO". Fuelonline .