Строительство Меркле – Дамгорда

В криптографии конструкция Меркла –Дамгарда или хэш-функция Меркла–Дамгарда представляет собой метод построения устойчивых к коллизиям криптографических хэш-функций из устойчивых к коллизиям односторонних функций сжатия . ^[1]^{: 145} Эта конструкция использовалась при разработке многих популярных алгоритмов хэширования, таких как MD5 , SHA-1 и SHA-2 .

Конструкция Меркла–Дамгарда была описана в докторской диссертации Ральфа Меркла в 1979 году. ^[2] Ральф Меркл и Иван Дамгард независимо друг от друга доказали, что эта структура является надежной: то есть, если используется соответствующая схема заполнения и функция сжатия устойчива к коллизиям , то хеш-функция также будет устойчива к коллизиям. ^[3]^[4]

Хэш-функция Меркла–Дамгарда сначала применяет функцию заполнения, совместимую с MD, для создания входных данных, размер которых кратен фиксированному числу (например, 512 или 1024) — это связано с тем, что функции сжатия не могут обрабатывать входные данные произвольного размера. Затем хэш-функция разбивает результат на блоки фиксированного размера и обрабатывает их по одному с помощью функции сжатия, каждый раз объединяя блок входных данных с выходными данными предыдущего раунда. ^[1]^{: 146} Чтобы сделать конструкцию безопасной, Меркл и Дамгард предложили дополнять сообщения заполнением, которое кодирует длину исходного сообщения. Это называется заполнением длины или усилением Меркла–Дамгарда .

На схеме односторонняя функция сжатия обозначена как f и преобразует два фиксированных входных значения длины в выходное значение того же размера, что и одно из входных значений. Алгоритм начинается с начального значения, вектора инициализации (IV). IV — это фиксированное значение (зависящее от алгоритма или реализации). Для каждого блока сообщения функция сжатия (или уплотнения) f берет полученный результат, объединяет его с блоком сообщения и выдает промежуточный результат. Последний блок дополняется нулями по мере необходимости, а биты, представляющие длину всего сообщения, добавляются. (Подробный пример дополнения длины см. ниже.)

Чтобы еще больше укрепить хэш, последний результат иногда передается через функцию финализации . Функция финализации может иметь несколько целей, например, сжатие большего внутреннего состояния (последнего результата) в меньший размер выходного хеша или обеспечение лучшего смешивания и лавинного эффекта на битах в сумме хэша. Функция финализации часто создается с использованием функции сжатия. ^{[ необходима цитата ]} (Обратите внимание, что в некоторых документах используется другая терминология: действие заполнения длины называется «финализацией». ^{[ необходима цитата ]} )

Характеристики безопасности

Популярность этой конструкции обусловлена фактом, доказанным Мерклем и Дамгардом , что если односторонняя функция сжатия f устойчива к коллизиям , то таковой является и хэш-функция, построенная с ее использованием. К сожалению, эта конструкция также имеет несколько нежелательных свойств:

Атаки с использованием второго прообраза против длинных сообщений всегда намного эффективнее, чем перебор. ^[5]
Мультиколлизии (множество сообщений с одинаковым хешем) можно обнаружить, затратив лишь немного больше усилий, чем коллизии. ^[6]
Они уязвимы для " атак стада ", которые объединяют каскадную конструкцию для поиска множественных коллизий (подобно вышеприведенной) с коллизиями, найденными для заданного префикса (коллизии выбранного префикса). Это позволяет конструировать высокоспецифичные коллизионные документы, и это может быть сделано за большую работу, чем поиск коллизии, но гораздо меньше, чем можно было бы ожидать для случайного оракула . ^[7]^[8]
Они уязвимы для атак расширения длины : учитывая хэш $H (X)$ неизвестного входа $X$ , легко найти значение $H (Pad(X) || Y)$ , где $Pad$ — это функция заполнения хеша. То есть, можно найти хеши входов, связанных с $X ,$ даже если $X$ остается неизвестным. ^[9] Атаки расширения длины фактически использовались для атаки на ряд коммерческих схем аутентификации веб-сообщений, таких как та, которая используется Flickr . ^[10]

Конструкция с широкой трубой

Конструкция хэша с широким каналом. Промежуточные значения цепочки удвоены.

Из-за нескольких структурных недостатков конструкции Меркла–Дамгарда, особенно проблемы расширения длины и атак с множественными коллизиями, Стефан Люкс предложил использовать хэш с широким каналом ^[11] вместо конструкции Меркла–Дамгарда. Хэш с широким каналом очень похож на конструкцию Меркла–Дамгарда, но имеет больший внутренний размер состояния, что означает, что длина бита, которая используется внутри, больше, чем длина выходного бита. Если требуется хэш из $n бит, то функция сжатия$ $f$ берет $2 n$ бит значения цепочки и $m$ бит сообщения и сжимает их до выходных $2 n$ бит.

Поэтому на последнем этапе вторая функция сжатия сжимает последнее внутреннее значение хэша ( $2 n$ бит) до конечного значения хэша ( $n$ бит). Это можно сделать так же просто, как отбросить половину последнего $2 n$ -битного вывода. SHA-512/224 и SHA-512/256 принимают эту форму, поскольку они получены из варианта SHA-512. SHA-384 и SHA-224 аналогичным образом получены из SHA-512 и SHA-256 соответственно, но ширина их канала намного меньше $2 n$ .

Быстрое строительство с использованием широких труб

Быстрая конструкция хэша с широким каналом. Половина значения цепочки используется в функции сжатия.

Мридул Нанди и Соурадьюти Пол продемонстрировали , что хеш-функцию с широким каналом можно сделать примерно в два раза быстрее, если состояние широкого канала можно разделить пополам следующим образом: одна половина является входом для последующей функции сжатия, а другая половина объединяется с выходом этой функции сжатия. ^[12]

Основная идея конструкции хэша заключается в том, чтобы переслать половину предыдущего значения цепочки вперед, чтобы выполнить XOR на выходе функции сжатия. При этом конструкция принимает более длинные блоки сообщений на каждой итерации, чем исходный широкий канал. Используя ту же функцию $f$ , что и раньше, она принимает $n$ -битные значения цепочки и $n + m$ бит сообщения. Однако цена, которую нужно заплатить, — это дополнительная память, используемая при конструкции для прямой связи.

Параллельный алгоритм

Конструкция MD по своей сути является последовательной. Существует параллельный алгоритм ^[13] , который создает устойчивую к коллизиям хэш-функцию из устойчивой к коллизиям функции сжатия. Хэш-функция PARSHA-256 ^[14] была разработана с использованием параллельного алгоритма и функции сжатия SHA-256.

Прокладка, соответствующая MD

Как упоминалось во введении, схема заполнения, используемая в конструкции Меркла–Дамгарда, должна быть тщательно выбрана, чтобы обеспечить безопасность схемы. Михир Белларе приводит достаточные условия для схемы заполнения, чтобы гарантировать безопасность конструкции MD: достаточно, чтобы схема была «совместимой с MD» (исходная схема заполнения длины, используемая Мерклом, является примером совместимой с MD заполнения). ^[1]^{: 145} Условия таковы:

$M$ — это префикс $Pad(M)$ .
Если $| M 1 | = | M 2 |$ , то $| Pad(M 1) | = | Pad(M 2) |$ .
Если $| M 1 | \neq | M 2 |$ , то последний блок $Pad(M 1)$ отличается от последнего блока $Pad(M 2)$ .

Здесь $| X |$ обозначает длину $X$ . При наличии этих условий коллизия в хэш-функции MD существует точно тогда, когда есть коллизия в базовой функции сжатия. Следовательно, конструкция Меркла–Дамгарда доказуемо безопасна, когда базовая функция сжатия безопасна. ^[1]^{: 147}

Пример заполнения длины

Чтобы передать сообщение функции сжатия, последний блок должен быть дополнен постоянными данными (обычно нулями) до полного блока. Например, предположим, что сообщение, которое нужно хешировать, — это «HashInput» (9-октетная строка, 0x48617368496e707574 в ASCII ), а размер блока функции сжатия составляет 8 байт (64 бита). Мы получаем два блока (октеты заполнения показаны на светло-голубом фоне):

48 61 73 68 49 6е 70 75, 74 00 00 00 00 00 00 00

Это подразумевает, что другие сообщения с тем же содержимым, но заканчивающиеся дополнительными нулями в конце, дадут то же значение хэша. В приведенном выше примере другое почти идентичное сообщение (0x48617368496e7075 74 00 ) сгенерирует то же значение хэша, что и исходное сообщение "HashInput" выше. Другими словами, любое сообщение, имеющее дополнительные нули в конце, делает его неотличимым от сообщения без них. Чтобы предотвратить эту ситуацию, первый бит первого октета заполнения изменяется на "1" (0x80), что дает:

48 61 73 68 49 6e 70 75, 74 80 00 00 00 00 00 00

Однако наиболее распространенные реализации используют фиксированный размер бит (обычно 64 или 128 бит в современных алгоритмах) в фиксированной позиции в конце последнего блока для вставки значения длины сообщения (см. псевдокод SHA-1 ). Дальнейшее улучшение может быть достигнуто путем вставки значения длины в последний блок, если там достаточно места. Это позволяет избежать наличия дополнительного блока для длины сообщения. Если предположить, что значение длины закодировано в 5 байтах (40 бит), сообщение становится:

48 61 73 68 49 6e 70 75, 74 80 00 00 00 00 00 09

Сохранение длины сообщения вне диапазона в метаданных или иным образом встраивание ее в начало сообщения является эффективным средством противодействия атаке с расширением длины ^{[ требуется ссылка ]} , при условии, что недействительность длины сообщения и контрольной суммы будет считаться сбоем проверки целостности.

Ссылки

Справочник по прикладной криптографии Менезеса, ван Ооршота и Ванстоуна (2001), глава 9.
Введение в современную криптографию , Джонатан Кац и Йехуда Линделл. Chapman and Hall/CRC Press, август 2007 г., стр. 134 (конструкция 4.13).
«Простая криптография» Найджела Смарта (2015), глава 14.

^ abcd Goldwasser, Shafi ; Bellare, Mihir (июль 2008 г.). "Lecture Notes on Cryptography". Архивировано из оригинала 2021-07-14 . Получено 2023-03-28 .
^ RC Merkle . Секретность, аутентификация и системы с открытым ключом. Стэнфордская докторская диссертация 1979 г., страницы 13–15.
^ RC Merkle . Сертифицированная цифровая подпись . В Advances in Cryptology – CRYPTO '89 Proceedings, Lecture Notes in Computer Science Vol. 435, G. Brassard, ed, Springer-Verlag, 1989, стр. 218-238.
^ I. Damgård . Принцип проектирования хэш-функций . In Advances in Cryptology – CRYPTO '89 Proceedings, Lecture Notes in Computer Science Vol. 435, G. Brassard, ed, Springer-Verlag, 1989, стр. 416-427.
^ Келси, Джон; Шнайер, Брюс (2004). «Вторые прообразы n-битных хэш-функций для гораздо менее чем 2^n работы» (PDF) – через Cryptology ePrint Archive: Report 2004/304. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Антуан Жу. Мультиколлизии в итерационных хэш-функциях. Применение к каскадному построению. В Advances in Cryptology – CRYPTO '04 Proceedings, Lecture Notes in Computer Science, Vol. 3152, M. Franklin, ed, Springer-Verlag, 2004, стр. 306–316.
^ Джон Келси и Тадаёси Коно. Стопка хэш-функций и атака Нострадамуса в Eurocrypt 2006, Lecture Notes in Computer Science, том 4004, стр. 183–200.
^ Стивенс, Марк; Ленстра, Арьен ; де Вегер, Бенне (30 ноября 2007 г.). «Нострадамус». Проект HashClash . ТУ/е . Проверено 30 марта 2013 г.
^ Евгений Додис, Томас Ристенпарт, Томас Шримптон. Спасение Merkle–Damgård для практических приложений . Предварительная версия в Advances in Cryptology – EUROCRYPT '09 Proceedings, Lecture Notes in Computer Science Vol. 5479, A. Joux, ed, Springer-Verlag, 2009, стр. 371–388.
^ Тай Дуонг, Джулиано Риццо, Уязвимость подделки подписи API Flickr, 2009
^ Лакс, Стефан (2004). «Принципы проектирования итерационных хэш-функций» – через Cryptology ePrint Archive, отчет 2004/253. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Мридул Нанди и Сорадьюти Пол (2010). «Ускорение Widepipe: безопасное и быстрое хеширование» — через Cryptology ePrint Archive, Paper 2010/193
^ Саркар, Палаш; Шелленберг, Пол Дж. (2001). Параллельный алгоритм для расширения криптографических хэш-функций. Lecture Notes in Computer Science. Vol. 2247. Springer-Verlag. pp. 40–49. doi :10.1007/3-540-45311-3_4. ISBN 978-3-540-45311-6.
^ Пал, Пинакпани; Саркар, Палаш (2003). PARSHA-256 – Новая параллелизуемая хэш-функция и многопоточная реализация. Lecture Notes in Computer Science. Vol. 2887. Springer-Verlag. pp. 347–361. doi :10.1007/978-3-540-39887-5_25. ISBN 978-3-540-39887-5.