stringtranslate.com

Статистическая сумма (математика)

Статистическая сумма или конфигурационный интеграл , используемый в теории вероятностей , теории информации и динамических системах , является обобщением определения статистической суммы в статистической механике . Это частный случай нормализующей константы в теории вероятностей для распределения Больцмана . Статистическая сумма встречается во многих задачах теории вероятностей, поскольку в ситуациях, когда существует естественная симметрия, связанная с ней вероятностная мера , мера Гиббса , обладает марковским свойством . Это означает, что статистическая сумма возникает не только в физических системах с трансляционной симметрией, но также в таких различных средах, как нейронные сети (сеть Хопфилда ) и такие приложения, как геномика , корпусная лингвистика и искусственный интеллект , которые используют сети Маркова и Марковские сети. логические сети . Мера Гиббса также является уникальной мерой, обладающей свойством максимизировать энтропию при фиксированном математическом ожидании энергии; это лежит в основе появления статистической суммы в методах максимальной энтропии и производных от них алгоритмах.

Статистическая сумма связывает воедино множество различных концепций и, таким образом, предлагает общую основу, в которой можно рассчитать множество различных видов величин. В частности, он показывает, как вычислять средние значения и функции Грина , образуя мост к теории Фредгольма . Это также обеспечивает естественную основу для подхода информационной геометрии к теории информации, где информационную метрику Фишера можно понимать как корреляционную функцию , полученную из статистической суммы; случается, что оно определяет риманово многообразие .

Когда случайные величины заданы в комплексном проективном пространстве или проективном гильбертовом пространстве , геометризированном с помощью метрики Фубини-Студи , возникает теория квантовой механики и, в более общем смысле, квантовая теория поля . В этих теориях статистическая сумма с большим успехом активно используется в формулировке интеграла по траекториям , что приводит ко многим формулам, почти идентичным рассмотренным здесь. Однако, поскольку базовое пространство меры является комплекснозначным, в отличие от вещественнозначного симплекса теории вероятностей, во многих формулах появляется дополнительный коэффициент i . Отслеживание этого фактора затруднительно, и здесь это не делается. Эта статья посвящена в первую очередь классической теории вероятностей, где сумма вероятностей равна единице.

Определение

Учитывая набор случайных величин, принимающих значения , и некоторую потенциальную функцию или гамильтониан , статистическая сумма определяется как

Под функцией H понимается вещественная функция на пространстве состояний , а под вещественным свободным параметром (условно — обратная температура ). Под суммой по понимается сумма по всем возможным значениям, которые может принимать каждая из случайных величин. Таким образом, сумму следует заменить интегралом, если они непрерывны, а не дискретны. Таким образом, пишут

для случая непрерывного изменения .

Когда H является наблюдаемой величиной , такой как конечномерная матрица , оператор бесконечномерного гильбертова пространства или элемент C-звездной алгебры , суммирование принято выражать в виде следа , так что

Когда H бесконечномерен, то для того, чтобы приведенные выше обозначения были действительными, аргумент должен быть трассовым классом , то есть иметь такую ​​форму, что суммирование существует и ограничено.

Число переменных не обязательно должно быть счетным , в этом случае суммы следует заменять функциональными интегралами . Хотя существует множество обозначений функциональных интегралов, наиболее распространенным из них будет следующее:

Так обстоит дело со статистической суммой в квантовой теории поля .

Распространенной полезной модификацией функции распределения является введение вспомогательных функций. Это позволяет, например, использовать статистическую сумму в качестве производящей функции для корреляционных функций . Более подробно это обсуждается ниже.

Параметр β

Роль или значение параметра можно понимать по-разному. В классической термодинамике это обратная температура . В более общем смысле можно было бы сказать, что это переменная, сопряженная с некоторой (произвольной) функцией случайных величин . Слово сопряженное здесь используется в смысле сопряженных обобщенных координат в лагранжевой механике , таким образом, собственно является множителем Лагранжа . Ее нередко называют обобщенной силой . Все эти концепции объединяет идея о том, что одно значение должно оставаться неизменным, тогда как другие, каким-то сложным образом взаимосвязанные, могут изменяться. В данном случае значение, которое должно оставаться фиксированным, — это математическое ожидание , даже если множество различных распределений вероятностей могут привести к одному и тому же (фиксированному) значению.

В общем случае рассматривается набор функций , каждая из которых зависит от случайных величин . Эти функции выбраны потому, что по той или иной причине хочется сохранить их ожидаемые значения постоянными. Чтобы таким образом ограничить ожидаемые значения, применяется метод множителей Лагранжа . В общем случае методы максимальной энтропии иллюстрируют, как это делается.

Уместно привести несколько конкретных примеров. В основных задачах термодинамики при использовании канонического ансамбля использование только одного параметра отражает тот факт, что существует только одно математическое ожидание, которое должно оставаться постоянным: свободная энергия (из-за сохранения энергии ). Для задач химии, связанных с химическими реакциями, большой канонический ансамбль обеспечивает подходящую основу, и существуют два множителя Лагранжа. Один из них заключается в поддержании постоянной энергии, а другой, фугитивность , заключается в поддержании постоянного количества частиц (поскольку химические реакции включают рекомбинацию фиксированного числа атомов).

Для общего случая имеется

с точкой в ​​пространстве.

Для набора наблюдаемых можно было бы написать

Как и раньше, предполагается, что аргументом tr является класс трассировки .

Затем соответствующая мера Гиббса обеспечивает такое распределение вероятностей, что математическое ожидание каждой из них является фиксированным значением. Точнее, у человека есть

угловые скобки обозначают ожидаемое значение и являются обычным альтернативным обозначением. Точное определение этого ожидаемого значения дано ниже.

Хотя стоимость обычно считается реальной, в целом это не обязательно; это обсуждается в разделе «Нормализация» ниже. Под значениями можно понимать координаты точек в пространстве; это пространство на самом деле является многообразием , как показано ниже. Изучение этих пространств как многообразий составляет область информационной геометрии .

Симметрия

Сама потенциальная функция обычно принимает форму суммы:

где сумма по s является суммой по некоторому подмножеству набора мощности P ( X ) этого набора . Например, в статистической механике , такой как модель Изинга , сумма ведется по парам ближайших соседей. В теории вероятностей, такой как сети Маркова , сумма может быть по кликам графа; Итак, для модели Изинга и других решетчатых моделей максимальные клики являются ребрами.

Тот факт, что потенциальную функцию можно записать в виде суммы, обычно отражает тот факт, что она инвариантна под действием групповой симметрии , например трансляционной инвариантности . Такие симметрии могут быть дискретными или непрерывными; они материализуются в корреляционных функциях случайных величин (обсуждаемых ниже). Таким образом, симметрия гамильтониана становится симметрией корреляционной функции (и наоборот).

Эта симметрия имеет критически важную интерпретацию в теории вероятностей: из нее следует, что мера Гиббса обладает марковским свойством ; то есть она определенным образом не зависит от случайных величин или, что то же самое, мера идентична на классах эквивалентности симметрии. Это приводит к широкому появлению статистической суммы в задачах с марковским свойством, таких как сети Хопфилда .

В качестве меры

Значение выражения

можно интерпретировать как вероятность того, что в системе возникнет определенная конфигурация значений . Таким образом, учитывая конкретную конфигурацию ,

- это вероятность появления конфигурации в системе, которая теперь правильно нормализована так, что , и такая, что сумма по всем конфигурациям равна единице. Таким образом, статистическую сумму можно понимать как обеспечивающую меру ( вероятностную меру ) в вероятностном пространстве ; формально она называется мерой Гиббса . Он обобщает более узкие понятия большого канонического ансамбля и канонического ансамбля в статистической механике.

Существует по крайней мере одна конфигурация, для которой вероятность максимальна; эту конфигурацию условно называют основным состоянием . Если конфигурация уникальна, основное состояние называется невырожденным , а система — эргодической ; в противном случае основное состояние вырождено . Основное состояние может коммутировать, а может и не коммутировать с генераторами симметрии; если она коммутирует, то она называется инвариантной мерой . Когда он не коммутирует, говорят, что симметрия спонтанно нарушена .

Условия, при которых основное состояние существует и является единственным, задаются условиями Каруша – Куна – Такера ; эти условия обычно используются для оправдания использования меры Гиббса в задачах максимальной энтропии. [ нужна цитата ]

Нормализация

Принимаемые значения зависят от математического пространства , в котором изменяется случайное поле. Таким образом, случайные поля с действительными значениями принимают значения в симплексе : это геометрический способ сказать, что сумма вероятностей должна быть равна единице. В квантовой механике случайные величины располагаются в комплексном проективном пространстве (или комплекснозначном проективном гильбертовом пространстве ), где случайные величины интерпретируются как амплитуды вероятности . Акцент здесь делается на слове проективный , так как амплитуды по-прежнему нормированы на единицу. Нормализация потенциальной функции представляет собой якобиан для соответствующего математического пространства: она равна 1 для обычных вероятностей и i для гильбертова пространства; таким образом, в квантовой теории поля мы видим в экспоненте, а не в . Статистическая сумма очень активно и с большим эффектом используется в формулировке интеграла по путям квантовой теории поля. Теория там почти идентична представленной здесь, за исключением этого различия и того факта, что она обычно формулируется в четырехмерном пространстве-времени, а не в общем виде.

Ожидаемые значения

Статистическая сумма обычно используется как функция, генерирующая вероятность для значений математических ожиданий различных функций случайных величин. Так, например, приняв в качестве подгоночного параметра, то производную по

дает среднее значение (ожидаемое значение) H . В физике это назвали бы средней энергией системы.

Учитывая приведенное выше определение вероятностной меры, математическое ожидание любой функции f случайных величин X теперь может быть записано так, как ожидалось: поэтому для X с дискретными значениями пишут

Приведенные выше обозначения строго верны для конечного числа дискретных случайных величин, но их следует рассматривать как несколько «неформальные» для непрерывных переменных; правильно, приведенные выше суммирования следует заменить обозначениями базовой сигма-алгебры , используемой для определения вероятностного пространства . Тем не менее, тождества продолжают сохраняться, если их правильно сформулировать в пространстве меры .

Так, например, энтропия определяется выражением

Мера Гиббса — это уникальное статистическое распределение, которое максимизирует энтропию при фиксированном математическом ожидании энергии; это лежит в основе его использования в методах максимальной энтропии .

Информационная геометрия

Можно понимать, что точки образуют пространство и, в частности, многообразие . Таким образом, резонно задаться вопросом о структуре этого многообразия; это задача информационной геометрии .

Множественные производные по множителям Лагранжа приводят к положительной полуопределенной ковариационной матрице.

Эта матрица является положительно полуопределенной и может интерпретироваться как метрический тензор , в частности, риманова метрика . Оснащение таким образом пространства множителей Лагранжа метрикой превращает его в риманово многообразие . [1] Изучение таких многообразий называется информационной геометрией ; приведенная выше метрика является информационной метрикой Фишера . Здесь служит координатой на многообразии. Интересно сравнить приведенное выше определение с более простой информацией Фишера , на которой оно основано.

То, что вышеизложенное определяет информационную метрику Фишера, можно легко увидеть, явно подставив математическое ожидание:

где мы написали , и под суммированием понимается все значения всех случайных величин . Для случайных величин с непрерывными значениями суммы, конечно, заменяются интегралами.

Любопытно, что информационную метрику Фишера можно также понимать как евклидову метрику плоского пространства , после соответствующей замены переменных, как описано в основной статье о ней. Если они комплекснозначны, результирующая метрика представляет собой метрику Фубини–Студи . Когда оно записано в терминах смешанных состояний , а не чистых состояний , оно известно как метрика Буреса .

Корреляционные функции

Вводя в статистическую сумму искусственные вспомогательные функции, ее затем можно использовать для получения математического ожидания случайных величин. Так, например, написав

тогда у человека есть

как математическое ожидание . В формулировке квантовой теории поля в виде интеграла по путям эти вспомогательные функции обычно называются исходными полями .

Множественные дифференцирования приводят к связанным корреляционным функциям случайных величин. Таким образом, корреляционная функция между переменными и определяется выражением:

Гауссовы интегралы

Для случая, когда H можно записать в виде квадратичной формы , включающей дифференциальный оператор , то есть как

тогда статистическую сумму можно понимать как сумму или интеграл по гауссианам. Корреляционную функцию можно понимать как функцию Грина для дифференциального оператора (и, как правило, дающую начало теории Фредгольма ). В рамках квантовой теории поля такие функции называются пропагаторами ; корреляторы более высокого порядка называются n-точечными функциями; работа с ними определяет эффективное действие теории.

Когда случайные величины являются антикоммутирующими числами Грассмана , тогда статистическая сумма может быть выражена как определитель оператора D. Это делается путем записи его в виде интеграла Березина (также называемого интегралом Грассмана).

Общие свойства

Функции статистического распределения используются для обсуждения критического масштабирования , универсальности и подлежат ренормгруппе .

Смотрите также

Рекомендации

  1. ^ Крукс, Гэвин Э. (2007). «Измерение термодинамической длины». Физ. Преподобный Летт. 99 (10): 100602. arXiv : 0706.0559 . Бибкод : 2007PhRvL..99j0602C. doi : 10.1103/PhysRevLett.99.100602. PMID  17930381. S2CID  7527491.