Триграммы являются частным случаем n -граммы , где n равно 3. Они часто используются в обработке естественного языка для выполнения статистического анализа текстов и в криптографии для управления и использования шифров и кодов . См. результаты анализа "Letter Frequencies in the English Language".
Контекст очень важен, различные рейтинги анализа и процентные соотношения легко выводятся путем использования различных размеров выборки, разных авторов или разных типов документов: поэзия, научная фантастика, технологическая документация; и уровней написания: рассказы для детей и взрослых, военные приказы и рецепты.
Типичный криптоаналитический частотный анализ показывает, что 16 наиболее распространенных триграмм на уровне символов в английском языке: [1] [2]
Поскольку зашифрованные сообщения, отправленные по телеграфу, часто пропускают знаки препинания и пробелы, криптографический частотный анализ таких сообщений включает триграммы, которые выходят за границы слов. Это приводит к тому, что триграммы, такие как «edt», встречаются часто, даже если они могут никогда не встречаться ни в одном слове этих сообщений. [4]
Предложение «быстрая рыжая лиса перепрыгивает через ленивую коричневую собаку» имеет следующие триграммы на уровне слов:
быстрый красныйбыстрая рыжая лисарыжая лиса прыгаетлиса перепрыгиваетперепрыгивает черезнад ленивымиленивый коричневыйленивая коричневая собака
А триграмма на уровне слов «быстрый красный» имеет следующие триграммы на уровне символов (где подчеркивание «_» обозначает пробел):
theон_е_q_куктоuicикск_к_р_рекрасный