stringtranslate.com

Чипкилл

Chipkill — торговая марка IBM для формы усовершенствованной технологии проверки и исправления ошибок (ECC) компьютерной памяти , которая защищает системы памяти от сбоев отдельных микросхем памяти и многобитовых ошибок из любой части одной микросхемы памяти. [1] [2] Одна простая схема для выполнения этой функции распределяет биты слова кода Хэмминга ECC по нескольким микросхемам памяти, так что сбой любой отдельной микросхемы памяти повлияет только на один бит ECC на слово. Это позволяет восстанавливать содержимое памяти, несмотря на полный сбой одной микросхемы. Типичные реализации используют более продвинутые коды, такие как код BCH , который может исправлять несколько битов с меньшими накладными расходами.

Chipkill часто сочетается с динамическим управлением битами, так что если чип выходит из строя (или превышает пороговое значение ошибок битов), другой, запасной, чип памяти используется для замены неисправного чипа. Концепция похожа на RAID , который защищает от сбоя диска, за исключением того, что теперь концепция применяется к отдельным чипам памяти. Технология была разработана корпорацией IBM в начале и середине 1990-х годов. Важная функция RAS , технология Chipkill в основном развернута на SSD , мэйнфреймах и серверах среднего уровня.

Эквивалентная система от Sun Microsystems называется Extended ECC , а эквивалентные системы от HP называются Advanced ECC [3] и Chipspare . Аналогичная система от Intel, называемая Lockstep memory , обеспечивает функциональность коррекции данных с двух устройств (DDDC). [4] Аналогичные системы от Micron , называемые избыточным массивом независимых NAND (RAIN), и от SandForce , называемые RAISE level 2 , защищают данные, хранящиеся на SSD, от любого отказа одного чипа флэш-памяти NAND. [5] [6]

В статье 2009 года, в которой использовались данные из центров обработки данных Google [7], были представлены доказательства, демонстрирующие, что в наблюдаемых системах Google ошибки DRAM повторялись в одном и том же месте, и что 8% модулей DIMM были затронуты каждый год. В частности, «в более чем 85% случаев за исправимой ошибкой следует по крайней мере еще одна исправимая ошибка в том же месяце». Модули DIMM с коррекцией ошибок Chipkill показали более низкую долю DIMM, сообщающих о неисправимых ошибках, по сравнению с модулями DIMM с кодами коррекции ошибок, которые могут исправлять только однобитовые ошибки. В статье 2010 года из Университета Рочестера также было показано, что память Chipkill привела к существенно меньшему количеству ошибок памяти, используя как трассировки реальной памяти, так и моделирование. [8]

Смотрите также

Ссылки

  1. ^ Тимоти Дж. Делл (1997-11-19). "Белая книга о преимуществах Chipkill-Correct ECC для основной памяти ПК-сервера" (PDF) . IBM . Архивировано из оригинала (PDF) 2015-09-23 . Получено 2015-02-02 .
  2. ^ "Повышение надежности сервера IBM Netfinity: память IBM Chipkill" (PDF) . IBM . 2000. Архивировано из оригинала (PDF) 2015-09-23 . Получено 2015-02-02 .
  3. ^ «Руководство по передовой практике для серверов ProLiant с процессорами серии Intel Xeon 5500. Техническая документация, 1-е издание» (PDF) . HP . Май 2009 г. стр. 8. Получено 09.09.2014 .
  4. ^ Томас Вильхальм (2014-07-11). «Независимый канал против режима Lockstep — управляйте своей памятью быстрее или безопаснее». Intel . Получено 2015-02-02 .
  5. ^ Ли Хатчинсон. «Революция твердотельных накопителей: подробное описание того, как на самом деле работают твердотельные накопители». 2012.
  6. ^ Эрик Слэк. «Как сделать надежные SSD — Надежная флэш-память NAND».
  7. ^ Шредер, Бьянка ; Пинейро, Эдуардо; Вебер, Вольф-Дитрих (2009). «Ошибки DRAM в дикой природе: крупномасштабное полевое исследование» (PDF) . Труды одиннадцатой международной совместной конференции по измерению и моделированию компьютерных систем . SIGMETRICS '09. ACM. стр. 193–204. doi :10.1145/1555349.1555372. ISBN 9781605585116. S2CID  6115552 . Получено 7 сентября 2011 г. .
  8. ^ Ли, Синь; Хуан, Майкл; Шен, Кай; Линкунь, Чу (2010). «Реалистичная оценка ошибок оборудования памяти и восприимчивости программных систем» (PDF) . Ежегодная техническая конференция Usenix 2010.

Внешние ссылки