Компьютерный эксперимент или имитационный эксперимент — это эксперимент, используемый для изучения компьютерной симуляции, также называемой системой in silico . Эта область включает в себя вычислительную физику , вычислительную химию , вычислительную биологию и другие подобные дисциплины.
Компьютерные симуляции создаются для имитации физической системы. Поскольку они предназначены для детального воспроизведения некоторых аспектов системы, они часто не дают аналитического решения. Поэтому используются такие методы, как дискретно-событийное моделирование или решатели конечных элементов . Компьютерная модель используется для того, чтобы делать выводы о системе, которую она воспроизводит. Например, климатические модели часто используются, поскольку экспериментирование на объекте размером с Землю невозможно.
Компьютерные эксперименты использовались с разными целями. Вот некоторые из них:
Моделирование компьютерных экспериментов обычно использует байесовскую структуру. Байесовская статистика — это интерпретация области статистики , где все свидетельства об истинном состоянии мира явно выражены в форме вероятностей . В сфере компьютерных экспериментов байесовская интерпретация подразумевает, что мы должны сформировать априорное распределение , которое представляет наше априорное убеждение в структуре компьютерной модели. Использование этой философии для компьютерных экспериментов началось в 1980-х годах и хорошо обобщено Саксом и др. (1989) [1]. Хотя байесовский подход широко используется, недавно обсуждались частотные подходы [2].
Основная идея этой структуры заключается в моделировании компьютерного моделирования как неизвестной функции набора входных данных. Компьютерное моделирование реализовано как фрагмент компьютерного кода, который может быть оценен для получения набора выходных данных. Примерами входных данных для этих симуляций являются коэффициенты в базовой модели, начальные условия и функции принуждения . Естественно рассматривать моделирование как детерминированную функцию, которая отображает эти входные данные в набор выходных данных . На основе такого видения нашего симулятора принято называть набор входных данных , само компьютерное моделирование , а полученный выходной сигнал . Оба являются векторными величинами, и они могут быть очень большими наборами значений, часто индексированными по пространству или по времени, или как по пространству, так и по времени.
Хотя это известно в принципе, на практике это не так. Многие симуляторы включают десятки тысяч строк высокоуровневого компьютерного кода, который недоступен интуиции. Для некоторых симуляций, таких как климатические модели, оценка выходных данных для одного набора входных данных может потребовать миллионы компьютерных часов [3].
Типичная модель для выходного компьютерного кода — это гауссовский процесс. Для простоты записи предположим, что — скаляр. Благодаря байесовскому фреймворку мы фиксируем наше убеждение, что функция следует гауссовскому процессу , где — средняя функция, а — ковариационная функция. Популярные средние функции — это полиномы низкого порядка, а популярная ковариационная функция — это ковариация Матерна , которая включает как экспоненциальную ( ), так и гауссовскую ковариацию (как ).
Планирование компьютерных экспериментов имеет существенные отличия от планирования экспериментов для параметрических моделей. Поскольку гауссовский процесс априорно имеет бесконечномерное представление, концепции критериев A и D (см. Оптимальный план ), которые фокусируются на уменьшении ошибки в параметрах, не могут быть использованы. Повторения также были бы расточительны в случаях, когда компьютерное моделирование не имеет ошибки. Критерии, которые используются для определения хорошего экспериментального плана, включают интегрированную среднеквадратичную ошибку предсказания [4] и критерии, основанные на расстоянии [5].
Популярные стратегии проектирования включают выборку латинского гиперкуба и последовательности с низким расхождением .
В отличие от физических экспериментов, для компьютерных экспериментов характерно наличие тысяч различных комбинаций входных данных. Поскольку стандартный вывод требует инверсии квадратной матрицы размером с число образцов ( ), стоимость растет с . Инверсия больших плотных матриц также может вызывать числовые неточности. В настоящее время эта проблема решается с помощью методов жадного дерева решений, что позволяет проводить эффективные вычисления для неограниченной размерности и размера образца патент WO2013055257A1, или обходится с помощью методов аппроксимации, например [6].