Электрохимическая память с произвольным доступом (ECRAM) — это тип энергонезависимой памяти (NVM) с несколькими уровнями на ячейку (MLC) , предназначенный для аналогового ускорения глубокого обучения . [1] [2] [3] Ячейка ECRAM представляет собой трехполюсное устройство, состоящее из проводящего канала, изолирующего электролита , ионного резервуара и металлических контактов. Сопротивление канала модулируется ионным обменом на границе раздела канал-электролит при приложении электрического поля. Процесс переноса заряда позволяет как сохранять состояние при отсутствии подаваемой мощности, так и программировать несколько отдельных уровней, что отличает работу ECRAM от работы полевого транзистора (FET) . Операция записи является детерминированной и может привести к симметричному потенцированию и депрессии, что делает массивы ECRAM привлекательными для использования в качестве искусственных синаптических весов в физических реализациях искусственных нейронных сетей (ИНС) . Технологические проблемы включают потенциал разомкнутой цепи (OCP) и совместимость литейного производства полупроводников, связанную с энергетическими материалами. Университеты, правительственные лаборатории и корпоративные исследовательские группы внесли свой вклад в разработку ECRAM для аналоговых вычислений . Примечательно, что Sandia National Laboratories разработала элемент на основе лития, вдохновленный материалами твердотельных батарей, [4] Стэнфордский университет создал органический элемент на основе протонов, [5] и компания International Business Machines (IBM) продемонстрировала параллельную параллельную работу в памяти без селектора. программирование для задачи логистической регрессии в массиве металлооксидной памяти ECRAM, предназначенной для вставки в заднюю часть линии (BEOL) . [6] В 2022 году исследователи из Массачусетского технологического института создали неорганическую, совместимую с КМОП протонную технологию, которая достигла почти идеальных характеристик модуляции с помощью быстрых наносекундных импульсов [7]
Напряжение к затвору относительно канальных электродов может быть приложено в виде фиксированного тока или смещения, направляя ионы к границе раздела электролит/канал или от нее, где происходит перенос заряда со свободными носителями. При введении в канал ионный заряд нейтрализуется, а атомные частицы интеркалируются или связываются с проводящей матрицей-хозяином, в некоторых случаях приводя к деформации и локализованному фазовому превращению. Такие обратимые процессы эквивалентны анодным/катодным реакциям в аккумуляторных элементах или электрохромных устройствах . Хотя в ECRAM программирование элемента памяти определяется не как изменение емкости или непрозрачности, а как изменение проводимости канала, связанное с вставкой или удалением атомных частиц в результате стрессового сигнала.
Операция чтения отделена от операции записи благодаря наличию трех электродов, что ограничивает помехи при чтении. Между электродами канала прикладывается небольшое смещение, в результате чего результирующий ток считывания пропорционален проводимости канала, что позволяет определить запрограммированное состояние устройства.
Скорость программирования ячеек ECRAM не ограничивается объемной диффузией ионов. Действительно, им нужно всего лишь пересечь плоскость интерфейса между электролитом и каналом, чтобы вызвать изменение проводимости. Наносекундные импульсы записи действительно могут вызвать программирование. [8] Компромисс между емкостью затвора , электронной проводимостью и т. д. может привести к стабилизации переходных процессов, ограничивая максимальную частоту чтения-записи. [9]
Массивы ECRAM интегрированы по псевдоперекрестной схеме, при этом линия доступа к воротам является общей для всех устройств в ряду или столбце. Если изменение электрохимического потенциала , движущей силы батареи, происходит при ионном обмене между каналом и электродом затвора, на контакте затвора существует потенциал разомкнутой цепи (OCP) , который будет отличаться от устройства к устройству в зависимости от запрограммированного состояния. Чтобы предотвратить перекрестные помехи между ячейками, использующими одну линию затвора, последовательно с элементом памяти добавляется устройство доступа для изоляции каждой из них. [10] Подавление OCP в конструкции ECRAM минимизирует размер/сложность ячейки, позволяя осуществлять параллельное чтение/программирование массивов устройств без выбора селектора. [6]
Энергонезависимую память (NVM) можно использовать для вычислений в оперативной памяти , тем самым снижая частоту передачи данных между устройствами хранения и обработки. В конечном итоге это может улучшить время вычислений и повысить энергоэффективность по сравнению с иерархическими системными архитектурами за счет устранения узкого места фон Неймана . Следовательно, при использовании многоуровневых ячеек (MLC) в узлах перекрестных матриц можно выполнять аналоговые операции с данными, закодированными по времени или напряжению, такие как умножение вектора (входной сигнал строки) × матрица (массив памяти). Следуя законам Кирхгофа и Ома , результирующий вектор затем получается путем интегрирования тока, собранного в каждом столбце. Для ячеек ECRAM в каждую строку добавляется дополнительная строка для записи ячеек во время циклов программирования, тем самым создавая псевдоперекрестную архитектуру. В области искусственного интеллекта (ИИ) для задач классификации и обучения используются глубокие нейронные сети (DNN) , основанные на большом количестве операций умножения матриц. Поэтому аналоговые вычисления с технологией NVM для таких задач чрезвычайно привлекательны. Ячейки ECRAM имеют уникальные возможности для использования в аналоговых ускорителях глубокого обучения благодаря присущей им детерминированной и симметричной природе программирования по сравнению с другими устройствами, такими как резистивная ОЗУ (ReRAM или RRAM) и память с фазовым изменением (PCM) .
Физическая реализация искусственных нейронных сетей (ИНС) должна работать с изо-точностью при сравнении с весами точности с плавающей запятой в программном обеспечении. Это устанавливает границы свойств устройства, необходимые для аналоговых ускорителей глубокого обучения . При проектировании своего резистивного процессора (RPU) компания IBM Research опубликовала такие требования, [11] часть которых приведена здесь. Совместная разработка алгоритмов и аппаратного обеспечения может несколько расслабить их, но не без других компромиссов. [12]
Использование NVM в качестве синаптических весов вместо хранилища предполагает существенно разные требования, когда речь идет о целевом диапазоне сопротивления, количестве уровней, скорости программирования и симметрии. Поскольку вычисления в памяти происходят параллельно в массиве, многие устройства обрабатываются одновременно и, следовательно, должны иметь высокое среднее сопротивление для ограничения рассеивания энергии. Для выполнения высокоточных вычислений и устойчивости к шуму ячейке NVM необходимо большое количество различных состояний. Время программирования должно быть быстрым только между уровнями, а не от самого высокого до самого низкого состояния сопротивления. Во время каждого цикла программирования ( обратное распространение ошибки ) обновления весов могут быть отрицательными или положительными, и поэтому трассы вверх/вниз нуждаются в симметрии, чтобы позволить алгоритмам обучения сходиться. Все технологии NVM борются с этими целями. Отдельные ячейки ECRAM могут соответствовать таким строгим показателям [6] , но также должны демонстрировать производительность массива высокой плотности и стохастичность.
Как сообщалось в публикации в журнале Science за 2019 год Эллиотом Дж. Фуллером, Алеком А. Талином и др. из Sandia National Laboratories в сотрудничестве со Стэнфордским университетом и Массачусетским университетом в Амхерсте : [10]
Используя копланарные органические многоуровневые ячейки, изолированные устройствами памяти с проводящим мостом (CBM), команда демонстрирует параллельное программирование и адресацию в массивах размером до 3×3. В частности, двухслойная нейронная сеть сопоставляется с массивом путем передачи весов, необходимых для выполнения задачи вывода, что приводит к операции XOR над двоичным входным вектором.
Показано, что отдельные ячейки обладают следующими свойствами (не все они достигаются в одной и той же конфигурации устройства); скорость = 1 МГц, циклы чтения-записи, количество состояний > 50 (настраиваемый), диапазон сопротивления = 50-100 нС (настраиваемый), ресурс >10 8 операций записи, размер = 50×50 мкм 2 .
Как сообщалось в материалах Международной конференции по электронным устройствам IEEE (IEDM) в 2019 году Сейён Ким, Джон Розен и др. из исследования IBM: [6]
Используя металлооксидные ячейки ECRAM без селекторов, команда демонстрирует параллельное программирование и адресацию в массивах 2×2. В частности, задача логистической регрессии выполняется в памяти с использованием 1000 векторов 2×1 в качестве обучающего набора. Подгонка 2D-кривой достигается за дюжину эпох.
Показано, что отдельные ячейки обладают следующими свойствами (не все они достигаются в одной и той же конфигурации устройства); скорость = 10 нс, импульсы записи, количество состояний > 1000 (настраиваемый), диапазон сопротивления = 0–50 мкс (настраиваемый), срок службы >10 7 операций записи, размер < 1×1 мкм 2 .
Различные учреждения продемонстрировали ячейки ECRAM с совершенно разными материалами, компоновкой и характеристиками.
Пример набора дискретных ячеек приведен в таблице.
Устройства Li-ECRAM, основанные на ионах лития, продемонстрировали повторяемое и контролируемое переключение за счет применения известных материалов из аккумуляторной технологии в конструкции памяти. [4] [13] [14] Следовательно, такие ячейки могут иметь OCP, которое варьируется в пределах нескольких вольт, в зависимости от запрограммированного состояния.
Устройства H-ECRAM, основанные на ионах водорода, оказались быстрыми, поэтому для запуска программирования требуются небольшие движущие силы. [5] [15] [16] Высокие коэффициенты диффузии в различных материалах могут сопровождаться отсутствием удержания в ячейке памяти, что влияет на долговечность. В большинстве конструкций H-ECRAM используются жидкие и/или органические электролиты. В исследовании 2022 года исследователи из Массачусетского технологического института продемонстрировали КМОП-совместимую технологию на основе электролита из фосфоросиликатного стекла , которая обеспечивает сверхбыстрые характеристики модуляции с высокой энергоэффективностью. [7] В том же году исследователи из Королевского технологического института KTH продемонстрировали ECRAMS на основе интеркаляции водорода в 2D-материал MXene, что ознаменовало первую демонстрацию высокоскоростных 2D ECRAM. [18]
ECRAM на основе оксидов металлов созданы на основе материалов OxRam и технологии high-k/металлических затворов , используемых в коммерческих полупроводниковых устройствах. MO-ECRAM действительно позволяет выполнять незначительные операции записи OCP и менее микросекунды. [6]
Для современных полупроводниковых запоминающих устройств или вычислительных приложений технология должна быть совместима с очень крупномасштабной интеграцией (СБИС) . Это накладывает ограничения на используемые материалы и методы изготовления функциональных устройств. Значение для ECRAM описано здесь.
Завод по производству полупроводников может работать с несколькими технологиями и имеет строгие правила, когда дело касается материалов, используемых в его дорогостоящем наборе инструментов, чтобы избежать перекрестного загрязнения и потери производительности устройств. В частности, металлические подвижные ионы, если они присутствуют в активных областях, могут вызвать дрейф устройства и повлиять на надежность. Есть еще несколько соображений для литейных предприятий; включая безопасность, стоимость, объем и т. д. Следовательно, Li-ECRAM на основе литий-ионных аккумуляторов сталкивается с уникальными проблемами, выходящими за рамки присутствия OCP.
Массивы памяти требуют логической периферии для работы и взаимодействия с остальной частью вычислительной системы. Такая периферия основана на полевых транзисторах (FET), построенных на поверхности подложек кремниевых пластин с высоким тепловым бюджетом на переднем конце линии (FEOL) . Ячейки памяти можно вставлять между верхними металлическими уровнями на заднем конце линии (BEOL), но при этом они не должны подвергаться воздействию температур до ~ 400 °C, используемых на последующих этапах. Вместе с проблемами формирования паттернов высокой плотности эти ограничения делают органические устройства непригодными для такой интеграции. ECRAM на основе 2D-материалов MXene [18] показали, что на них не влияет нагрев при температуре 400 °C, но для интеграции ионных проводников необходимы дополнительные разработки.
Одним из способов внедрения новых материалов для памяти может быть использование гетерогенной интеграции (HI) , при которой массив устройств изготавливается независимо от логических элементов управления, а затем присоединяется к чипу, содержащему полевой транзистор, чтобы обеспечить возможность его использования в качестве памяти с высокой пропускной способностью (HBM) . Однако стоимость и сложность, связанные с такой схемой, отрицательно влияют на ценностное предложение по замене существующих технологий памяти.