Алгебраическая статистика — это использование алгебры для развития статистики . Алгебра была полезна для экспериментального проектирования , оценки параметров и проверки гипотез .
Традиционно алгебраическая статистика ассоциировалась с разработкой экспериментов и многомерным анализом (особенно временных рядов ). В последние годы термин «алгебраическая статистика» иногда ограничивался, иногда его использовали для обозначения использования алгебраической геометрии и коммутативной алгебры в статистике.
В прошлом статистики использовали алгебру для продвижения исследований в области статистики. Некоторые алгебраические статистики привели к развитию новых тем в алгебре и комбинаторике, таких как схемы ассоциаций .
Например, Рональд А. Фишер , Генри Б. Манн и Розмари А. Бейли применили абелевы группы к планированию экспериментов . Экспериментальные планы также изучались с помощью аффинной геометрии над конечными полями , а затем с введением схем ассоциации Р. К. Бозе . Ортогональные массивы были введены Ч. Р. Рао также для экспериментальных планов.
[ соответствующий? ]
Инвариантные меры на локально компактных группах давно используются в статистической теории , особенно в многомерном анализе . Теорема о факторизации Берлинга и большая часть работ по (абстрактному) гармоническому анализу направлены на лучшее понимание разложения Вольда стационарных случайных процессов , что важно в статистике временных рядов .
Охватывая предыдущие результаты теории вероятностей на алгебраических структурах, Ульф Гренандер разработал теорию «абстрактного вывода». Абстрактный вывод Гренадера и его теория закономерностей полезны для пространственной статистики и анализа изображений ; эти теории опираются на теорию решеток .
Частично упорядоченные векторные пространства и векторные решетки используются во всей статистической теории. Гаррет Биркгоф метризировал положительный конус, используя проективную метрику Гильберта , и доказал теорему Йенча , используя теорему о сжимающем отображении . [1] Результаты Биркгофа были использованы для оценки максимальной энтропии (которую можно рассматривать как линейное программирование в бесконечных измерениях ) Джонатаном Борвейном и его коллегами.
Векторные решетки и конические меры были введены в статистическую теорию принятия решений Люсьеном Ле Камом .
В последние годы термин «алгебраическая статистика» стал использоваться более ограниченно, чтобы обозначить использование алгебраической геометрии и коммутативной алгебры для изучения проблем, связанных с дискретными случайными величинами с конечными пространствами состояний. Коммутативная алгебра и алгебраическая геометрия имеют приложения в статистике, поскольку многие обычно используемые классы дискретных случайных величин можно рассматривать как алгебраические многообразия .
Рассмотрим случайную величину X , которая может принимать значения 0, 1, 2. Такая переменная полностью характеризуется тремя вероятностями
и эти цифры удовлетворяют
Наоборот, любые три таких числа однозначно определяют случайную величину, поэтому мы можем идентифицировать случайную величину X с кортежем ( p 0 , p 1 , p 2 )∈ R 3 .
Теперь предположим, что X — это биномиальная случайная величина с параметром q и n = 2 , т. е. X представляет собой число успехов при повторении определенного эксперимента два раза, где каждый эксперимент имеет индивидуальную вероятность успеха q . Тогда
и нетрудно показать, что кортежи ( p 0 , p 1 , p 2 ), которые возникают таким образом, являются именно теми, которые удовлетворяют
Последнее представляет собой полиномиальное уравнение, определяющее алгебраическое многообразие (или поверхность) в R 3 , и это многообразие при пересечении с симплексом , заданным формулой
дает часть алгебраической кривой , которая может быть идентифицирована с набором всех 3-х ступенчатых переменных Бернулли. Определение параметра q равнозначно нахождению одной точки на этой кривой; проверка гипотезы о том, что заданная переменная X является бернуллиевской, равнозначна проверке того, лежит ли определенная точка на этой кривой или нет.
Алгебраическая геометрия также недавно нашла применение в статистической теории обучения , включая обобщение информационного критерия Акаике на сингулярные статистические модели . [2]