В вычислительной физике вариационный Монте-Карло (ВМК) — это квантовый метод Монте-Карло , который применяет вариационный метод для аппроксимации основного состояния квантовой системы. [1]
Базовым строительным блоком является общая волновая функция, зависящая от некоторых параметров . Оптимальные значения параметров затем находятся путем минимизации полной энергии системы.
В частности, учитывая гамильтониан и обозначая многочастичную конфигурацию , математическое ожидание энергии можно записать как: [2]
Следуя методу Монте-Карло для оценки интегралов , мы можем интерпретировать как функцию распределения вероятностей , сделать выборку и оценить ожидаемое значение энергии как среднее значение так называемой локальной энергии . Как только становится известным для заданного набора вариационных параметров , выполняется оптимизация с целью минимизации энергии и получения наилучшего возможного представления волновой функции основного состояния.
VMC ничем не отличается от любого другого вариационного метода, за исключением того, что многомерные интегралы оцениваются численно. Интеграция Монте-Карло особенно важна в этой проблеме, поскольку размерность многочастичного гильбертова пространства, включающего все возможные значения конфигураций , обычно растет экспоненциально с размером физической системы. Поэтому другие подходы к численной оценке значений ожидаемой энергии, как правило, ограничивают приложения гораздо меньшими системами, чем те, которые можно проанализировать благодаря подходу Монте-Карло.
Точность метода в значительной степени зависит от выбора вариационного состояния. Самый простой выбор обычно соответствует форме среднего поля , где состояние записывается как факторизация по гильбертову пространству. Эта особенно простая форма обычно не очень точна, поскольку она пренебрегает многочастичными эффектами. Один из самых больших выигрышей в точности по сравнению с раздельной записью волновой функции достигается введением так называемого фактора Ястрова. В этом случае волновая функция записывается как , где — расстояние между парой квантовых частиц, а — вариационная функция, которую необходимо определить. С помощью этого фактора мы можем явно учесть корреляцию частица-частица, но многочастичный интеграл становится неразделимым, поэтому Монте-Карло — единственный способ его эффективной оценки. В химических системах немного более сложные версии этого фактора могут получить 80–90% энергии корреляции (см. электронную корреляцию ) с менее чем 30 параметрами. Для сравнения, расчет взаимодействия конфигураций может потребовать около 50 000 параметров для достижения такой точности, хотя это сильно зависит от конкретного рассматриваемого случая. Кроме того, VMC обычно масштабируется как небольшая степень числа частиц в моделировании, обычно около N 2−4 для расчета ожидаемого значения энергии, в зависимости от формы волновой функции.
Расчеты QMC в решающей степени зависят от качества пробной функции, поэтому важно иметь оптимизированную волновую функцию как можно ближе к основному состоянию. Проблема оптимизации функции является очень важной темой исследований в численном моделировании. В QMC, в дополнение к обычным трудностям нахождения минимума многомерной параметрической функции, статистический шум присутствует в оценке функции стоимости (обычно энергии) и ее производных, необходимых для эффективной оптимизации.
Для оптимизации многочастичной пробной функции использовались различные функции стоимости и различные стратегии. Обычно в оптимизации QMC использовались три функции стоимости: энергия, дисперсия или их линейная комбинация. Метод оптимизации дисперсии имеет то преимущество, что известна точная дисперсия волновой функции. (Поскольку точная волновая функция является собственной функцией гамильтониана, дисперсия локальной энергии равна нулю). Это означает, что оптимизация дисперсии идеальна в том смысле, что она ограничена снизу, положительно определена и ее минимум известен. Минимизация энергии может в конечном итоге оказаться более эффективной, однако, поскольку разные авторы недавно показали, что оптимизация энергии более эффективна, чем оптимизация дисперсии.
Для этого есть разные мотивы: во-первых, как правило, интерес представляет наименьшая энергия, а не наименьшая дисперсия как в вариационном, так и в диффузионном Монте-Карло; во-вторых, оптимизация дисперсии требует много итераций для оптимизации параметров детерминанты, и часто оптимизация может застрять в нескольких локальных минимумах, и она страдает от проблемы «ложной сходимости»; в-третьих, волновые функции с минимизацией энергии в среднем дают более точные значения других ожидаемых значений, чем волновые функции с минимизацией дисперсии.
Стратегии оптимизации можно разделить на три категории. Первая стратегия основана на коррелированной выборке вместе с детерминированными методами оптимизации. Даже если эта идея дала очень точные результаты для атомов первой строки, эта процедура может иметь проблемы, если параметры влияют на узлы, и, кроме того, отношение плотности текущей и начальной пробной функции увеличивается экспоненциально с размером системы. Во второй стратегии используется большой бин для оценки функции стоимости и ее производных таким образом, что шумом можно пренебречь и можно использовать детерминированные методы.
Третий подход основан на итеративной технике для прямой работы с шумовыми функциями. Первым примером этих методов является так называемая стохастическая градиентная аппроксимация (SGA), которая также использовалась для оптимизации структуры. Недавно был предложен улучшенный и более быстрый подход такого рода — так называемый метод стохастической реконфигурации (SR).
В 2017 году Джузеппе Карлео и Маттиас Тройер [3] использовали целевую функцию VMC для обучения искусственной нейронной сети нахождению основного состояния квантово-механической системы. В более общем смысле искусственные нейронные сети используются в качестве волновой функции ansatz (известной как квантовые состояния нейронной сети ) в рамках VMC для нахождения основных состояний квантово-механических систем. Использование нейронных сетевых ansatz для VMC было распространено на фермионы , что позволяет проводить расчеты электронной структуры , которые значительно точнее расчетов VMC, не использующих нейронные сети. [4] [5] [6]