stringtranslate.com

Проблема Беренса–Фишера

Нерешенная проблема в статистике :
Необходимо ли приближение, аналогичное рассуждению Фишера, для решения проблемы Беренса–Фишера?

В статистике проблема Беренса –Фишера , названная в честь Вальтера-Ульриха Беренса и Рональда Фишера , представляет собой задачу интервальной оценки и проверки гипотез относительно разницы между средними значениями двух нормально распределенных совокупностей, когда дисперсии двух совокупностей не предполагаются равными, на основе двух независимых выборок.

Спецификация

Одна из трудностей при обсуждении проблемы Беренса–Фишера и предлагаемых решений заключается в том, что существует множество различных интерпретаций того, что подразумевается под «проблемой Беренса–Фишера». Эти различия касаются не только того, что считается релевантным решением, но даже основного утверждения рассматриваемого контекста.

Контекст

Пусть X 1 , ...,  X n и Y 1 , ...,  Y m будут выборками iid из двух совокупностей, которые обе принадлежат к одному и тому же семейству распределений «местоположение–масштаб» . Предполагается, что параметры масштаба неизвестны и не обязательно равны, и проблема состоит в том, чтобы оценить, можно ли обоснованно считать параметры местоположения равными. Леманн [1] утверждает, что «проблема Беренса–Фишера» используется как для этой общей формы модели, когда семейство распределений произвольно, так и для случая, когда делается ограничение нормальным распределением . В то время как Леманн обсуждает ряд подходов к более общей проблеме, в основном основанных на непараметрике, [2] большинство других источников, по-видимому, используют «проблему Беренса–Фишера» для обозначения только случая, когда распределение предполагается нормальным: большая часть этой статьи делает это предположение.

Требования к решениям

Были представлены решения проблемы Беренса–Фишера, которые используют либо классическую , либо байесовскую точку зрения вывода, и любое решение будет теоретически недействительным с точки зрения другой точки зрения. Если рассмотрение ограничивается только классическим статистическим выводом, можно искать решения проблемы вывода, которые просты в применении в практическом смысле, отдавая предпочтение этой простоте перед любой неточностью в соответствующих вероятностных утверждениях. Когда требуется точность уровней значимости статистических тестов, может быть дополнительное требование, чтобы процедура максимально использовала статистическую информацию в наборе данных. Хорошо известно, что точный тест может быть получен путем случайного отбрасывания данных из большего набора данных до тех пор, пока размеры выборок не станут равными, собирая данные попарно и беря различия, а затем используя обычный t-тест для проверки того, что среднее-разность равна нулю: очевидно, что это не будет «оптимальным» ни в каком смысле.

Задача указания интервальных оценок для этой проблемы — это задача, в которой частотный подход не может предоставить точное решение, хотя некоторые приближения доступны. Стандартные байесовские подходы также не могут предоставить ответ, который можно выразить в виде простых простых формул, но современные вычислительные методы байесовского анализа позволяют находить по существу точные решения. [ необходима цитата ] Таким образом, изучение проблемы может быть использовано для выяснения различий между частотным и байесовским подходами к интервальной оценке.

Краткое описание различных подходов

Подход Беренса и Фишера

Рональд Фишер в 1935 году ввел фидуциальный вывод [3] [4] , чтобы применить его к этой проблеме. Он сослался на более раннюю работу Вальтера-Ульриха Беренса от 1929 года. Беренс и Фишер предложили найти распределение вероятностей

где и — два выборочных средних значения , а s 1 и s 2 — их стандартные отклонения . См. распределение Беренса–Фишера . Фишер аппроксимировал распределение этого, игнорируя случайную вариацию относительных размеров стандартных отклонений,

Решение Фишера вызвало споры, поскольку оно не обладало свойством, согласно которому гипотеза о равных средних значениях была бы отклонена с вероятностью α, если бы средние значения были на самом деле равны. С тех пор было предложено много других методов решения этой проблемы, и было исследовано влияние на полученные доверительные интервалы. [5]

Приближенное решение Уэлча t

Широко используемый метод — метод Б. Л. Уэлча , [6], который, как и Фишер, работал в Лондонском университетском колледже . Дисперсия средней разности

результаты в

Уэлч (1938) аппроксимировал распределение распределением Пирсона типа III (масштабированное распределение хи-квадрат ), первые два момента которого согласуются с моментом . Это относится к следующему числу степеней свободы (df), которое, как правило, не является целым числом:

При нулевой гипотезе равных ожиданий, μ 1 = μ 2 , распределение статистики Беренса–Фишера T , которое также зависит от отношения дисперсии σ 1 2 / σ 2 2 , теперь может быть аппроксимировано распределением Стьюдента с этими ν степенями свободы. Но это ν содержит дисперсии совокупности σ i 2 , а они неизвестны. Следующая оценка заменяет только дисперсии совокупности на дисперсии выборки:

Это случайная величина. Распределение t со случайным числом степеней свободы не существует. Тем не менее, распределение Беренса–Фишера T можно сравнить с соответствующим квантилем распределения Стьюдента t с этими оценочными числами степеней свободы, , которое, как правило, не является целым числом. Таким образом, граница между областью принятия и отклонения тестовой статистики T вычисляется на основе эмпирических дисперсий s i 2 таким образом, что является их гладкой функцией.

Этот метод также не дает точной номинальной ставки, но, как правило, не слишком далек от истины. [ требуется ссылка ] Однако, если дисперсии генеральной совокупности равны или если выборки довольно малы и дисперсии генеральной совокупности можно считать приблизительно равными, более точным будет использование t-критерия Стьюдента . [ требуется ссылка ]

Другие подходы

Было предложено несколько различных подходов к общей проблеме, некоторые из которых претендуют на «решение» некоторой версии проблемы. Среди них [7]

  • Чепмен в 1950 году, [8]
  • Прокофьева и Шишкина в 1974 году, [9]
  • Дудевич и Ахмед в 1998 году. [10]
  • Чан Вана в 2022 году. [11]

В сравнении выбранных методов, проведенном Дудевичем [7], было обнаружено, что процедура Дудевича–Ахмеда рекомендуется для практического использования.

Точные решения общих и обобщенных задач Беренса–Фишера

В течение нескольких десятилетий считалось, что точного решения общей проблемы Беренса–Фишера не существует. [ необходима цитата ] Однако в 1966 году было доказано, что у нее есть точное решение. [12] В 2018 году была доказана функция плотности вероятности обобщенного распределения Беренса–Фишера m средних значений и m различных стандартных ошибок из m выборок различных размеров из независимых нормальных распределений с различными средними значениями и дисперсиями, и в статье также были исследованы ее асимптотические приближения. [13] В последующей статье было показано, что классический парный t -тест является центральной проблемой Беренса–Фишера с ненулевым коэффициентом корреляции популяции, и была выведена ее соответствующая функция плотности вероятности путем решения связанной с ней нецентральной проблемы Беренса–Фишера с ненулевым коэффициентом корреляции популяции. [14] В ней также была решена более общая нецентральная проблема Беренса–Фишера с ненулевым коэффициентом корреляции популяции в приложении. [14]

Варианты

Был изучен небольшой вариант проблемы Беренса–Фишера. [15] В этом случае проблема заключается в том, чтобы, предположив, что два средних значения совокупности фактически одинаковы, сделать выводы об общем среднем значении: например, можно потребовать доверительный интервал для общего среднего значения.

Обобщения

Одно из обобщений проблемы включает многомерные нормальные распределения с неизвестными ковариационными матрицами и известно как многомерная проблема Беренса–Фишера . [16]

Непараметрическая задача Беренса–Фишера не предполагает , что распределения являются нормальными. [17] [18] Тесты включают тест Куккони 1968 года и тест Лепажа 1971 года.

Примечания

  1. ^ Леманн (1975) стр.95
  2. ^ Леманн (1975) Раздел 7
  3. ^ Фишер, РА (1935). «Фидуциальный аргумент в статистическом выводе». Annals of Eugenics . 8 (4): 391–398. doi :10.1111/j.1469-1809.1935.tb02120.x. hdl : 2440/15222 .
  4. ^ «Фидуциальный аргумент Р. А. Фишера и теорема Байеса Тедди Сейденфельда» (PDF) .
  5. ^ "Sezer, A. et al. Сравнение доверительных интервалов для проблемы Беренса–Фишера. Статистика. 2015".
  6. Уэлч (1938, 1947)
  7. ^ Аб Дудевич, Ма, Май и Су (2007)
  8. ^ Чепмен, Д. Г. (1950). «Некоторые два выборочных теста». Annals of Mathematical Statistics . 21 (4): 601–606. doi : 10.1214/aoms/1177729755 .
  9. ^ Прокофьев, В. Н.; Шишкин, А. Д. (1974). «Последовательная классификация нормальных множеств с неизвестными дисперсиями». Радиоинженерия. Электрон. Физика . 19 (2): 141–143.
  10. ^ Дудевич и Ахмед (1998, 1999)
  11. ^ Ван, Чан (2022). «Новый неасимптотический t-тест для задач Беренса-Фишера». arXiv : 2210.16473 [math.ST].
  12. ^ Кабе, Д. Г. (декабрь 1966 г.). «О точном распределении статистики Фишера-Бехрена-Велча». Метрика . 10 (1): 13–15. doi :10.1007/BF02613414. S2CID  120965543.
  13. ^ Сяо, Юншунь (22 марта 2018 г.). «О решении обобщенной проблемы Беренса-Фишера». Far East Journal of Theoretical Statistics . 54 (1): 21–140. doi :10.17654/TS054010021 . Получено 21 мая 2020 г. .
  14. ^ ab Xiao, Yongshun (12 декабря 2018 г.). «О решении нецентральной проблемы Беренса-Фишера с ненулевым коэффициентом корреляции населения». Far East Journal of Theoretical Statistics . 54 (6): 527–600. doi :10.17654/TS054060527. S2CID  125245802 . Получено 21 мая 2020 г. .
  15. ^ Янг, GA, Смит, RL (2005) Основы статистического вывода , CUP. ISBN 0-521-83971-8 (стр. 204) 
  16. ^ Беллони и Дидье (2008)
  17. ^ Бруннер, Э. (2000). «Непараметрическая задача Беренса–Фишера: асимптотическая теория и приближение малой выборки». Биометрический журнал . 42 : 17–25. doi :10.1002/(SICI)1521-4036(200001)42:1<17::AID-BIMJ17>3.0.CO;2-U.
  18. ^ Коничек, Франк (2015). "nparcomp: Программный пакет R для непараметрических множественных сравнений и одновременных доверительных интервалов". Журнал статистического программного обеспечения . 64 (9). doi : 10.18637/jss.v064.i09 . Получено 26 сентября 2016 г.

Ссылки

Внешние ссылки