Информатика материалов — это область исследований, которая применяет принципы информатики и науки о данных к материаловедению и инженерии для улучшения понимания, использования, выбора , разработки и открытия материалов. Термин «информатика материалов» часто используется сообществом взаимозаменяемо с «наукой о данных», «машинным обучением» и «искусственным интеллектом». Это новая область, целью которой является достижение высокоскоростного и надежного сбора, управления, анализа и распространения разнообразных данных о материалах с целью значительного сокращения времени и риска, необходимых для разработки, производства и развертывания новых материалов, что обычно занимает более 20 лет. [1] [2] [3] Эта область деятельности не ограничивается некоторыми традиционными пониманиями взаимосвязи между материалами и информацией. Некоторые более узкие интерпретации включают комбинаторную химию , моделирование процессов , базы данных материалов, управление данными о материалах и управление жизненным циклом продукта . Информатика материалов находится на стыке этих концепций, но также выходит за их рамки и обладает потенциалом для достижения большего понимания и более глубокого понимания путем применения уроков, полученных из данных, собранных по одному типу материала, к другим. Собирая соответствующие метаданные , можно значительно расширить ценность каждой отдельной точки данных.
Базы данных необходимы для любых исследований и приложений в области информатики. В материальной информатике существует множество баз данных, содержащих как эмпирические данные, полученные экспериментальным путем, так и теоретические данные, полученные вычислительным путем. Большие данные, которые можно использовать для машинного обучения, особенно трудно получить для экспериментальных данных из-за отсутствия стандарта для представления данных и изменчивости экспериментальной среды. Этот недостаток больших данных привел к росту усилий по разработке методов машинного обучения, которые используют данные в чрезвычайно больших наборах данных. С другой стороны, существует большая унифицированная база данных теоретических вычислений теории функционала плотности (DFT). Эти базы данных доказали свою полезность при высокопроизводительном скрининге и обнаружении материалов. Ниже перечислены некоторые распространенные базы данных DFT и высокопроизводительные инструменты:
Концепция информатики материалов рассматривается Обществом по исследованию материалов . Например, информатика материалов была темой выпуска MRS Bulletin за декабрь 2006 года . Выпуск был приглашенным редактором Джоном Роджерсом из Innovative Materials, Inc. и Дэвидом Себоном из Кембриджского университета , которые описали «высокую отдачу от разработки методологий, которые ускорят внедрение материалов, тем самым экономя миллионы инвестиционных долларов».
Редакторы сосредоточились на ограниченном определении информатики материалов, которая в первую очередь сосредоточена на вычислительных методах обработки и интерпретации данных. Они заявили, что «специализированные инструменты информатики для сбора, управления, анализа и распространения данных» и «достижения в области вычислительной мощности в сочетании с вычислительным моделированием и симуляцией и базами данных свойств материалов» позволят ускорить вставку материалов.
Более широкое определение информатики материалов выходит за рамки использования вычислительных методов для проведения того же эксперимента, [4] рассматривая информатику материалов как структуру, в которой измерение или вычисление являются одним шагом в информационно-ориентированном процессе обучения, который использует силу коллектива для достижения большей эффективности в исследовании. При правильной организации эта структура пересекает границы материалов, чтобы раскрыть фундаментальные знания об основах физических, механических и инженерных [5] свойств.
Хотя многие верят в будущее информатики в процессе разработки и масштабирования материалов, остается еще много проблем. Хилл и др. пишут, что «Сегодня сообщество материалов сталкивается с серьезными проблемами при внедрении этой парадигмы исследований, ускоренных данными, включая разнообразие областей исследований в материалах, отсутствие стандартов данных и отсутствие стимулов для обмена, среди прочего. Тем не менее, ландшафт быстро меняется способами, которые должны принести пользу всему предприятию по исследованию материалов». [6] Это сохраняющееся напряжение между традиционными методологиями разработки материалов и использованием более вычислительных, машинного обучения и аналитических подходов, вероятно, будет существовать в течение некоторого времени, поскольку индустрия материалов преодолевает некоторые культурные барьеры, необходимые для полного принятия таких новых способов мышления.
Всеобъемлющие цели биоинформатики и системной биологии могут дать полезную аналогию. Эндрю Мюррей из Гарвардского университета выражает надежду, что такой подход «спасет нас от эпохи «один аспирант, один ген, одна докторская степень» [7] . Аналогично, цель информатики материалов — спасти нас от одного аспиранта, одного сплава, одной докторской степени. Такие цели потребуют более сложных стратегий и исследовательских парадигм, чем применение методов науки о данных к тем же задачам, которые в настоящее время решают студенты.