В математике существует множество давних нерешенных проблем , для которых решение до сих пор не найдено. Известные нерешенные проблемы в статистике , как правило, имеют разный характер; по словам Джона Тьюки, [1] «трудности в определении проблем задержали статистику гораздо больше, чем трудности в решении проблем». Список «одной или двух открытых проблем» (фактически 22 из них) был предоставлен Дэвидом Коксом . [2]
Вывод и тестирование
- Как обнаружить и исправить систематические ошибки , особенно в науках, где случайные ошибки велики (ситуация, которую Тьюки назвал «неудобной наукой» ).
- Оценщик Грейбилла–Дила часто используется для оценки общего среднего двух нормальных совокупностей с неизвестными и, возможно, неравными дисперсиями. Хотя этот оценщик в целом непредвзят, его приемлемость еще предстоит доказать. [3]
- Метаанализ : Хотя независимые p-значения можно объединять с помощью метода Фишера , методы обработки зависимых p-значений все еще разрабатываются.
- Проблема Беренса–Фишера : Юрий Линник показал в 1966 году, что не существует равномерно наиболее мощного теста для разности двух средних значений, когда дисперсии неизвестны и, возможно, не равны. То есть, не существует точного теста (то есть, если средние значения фактически равны, то такой, который отвергает нулевую гипотезу с вероятностью ровно α ), который также является наиболее мощным для всех значений дисперсий (которые, таким образом, являются нежелательными параметрами ). Хотя существует множество приближенных решений (например, t-тест Уэлча ), проблема продолжает привлекать внимание [4] как одна из классических проблем в статистике.
- Множественные сравнения : существуют различные способы корректировки p-значений для компенсации одновременной или последовательной проверки гипотез. Особый интерес представляет то, как одновременно контролировать общую частоту ошибок, сохранять статистическую мощность и включать зависимость между тестами в корректировку. Эти вопросы особенно актуальны, когда количество одновременных тестов может быть очень большим, как это все чаще случается при анализе данных с ДНК-микрочипов . [ необходима цитата ]
- Байесовская статистика : Был предложен список открытых проблем в байесовской статистике. [5]
Экспериментальный дизайн
Проблемы более философского характера
Примечания
- ^ Тьюки, Джон У. (1954). «Нерешенные проблемы экспериментальной статистики». Журнал Американской статистической ассоциации . 49 (268): 706–731. doi :10.2307/2281535. JSTOR 2281535.
- ^ Кокс, DR (1984). «Текущее положение и потенциальные разработки: некоторые личные взгляды: дизайн экспериментов и регрессия». Журнал Королевского статистического общества. Серия A (общая) . 147 (2): 306–315. doi :10.2307/2981685. JSTOR 2981685.
- ^ Пал, Набенду; Лим, Вуи К. (1997). «Заметка о допустимости второго порядка оценки Грейбилла-Дила общего среднего нескольких нормальных совокупностей». Журнал статистического планирования и вывода . 63 : 71–78. doi :10.1016/S0378-3758(96)00202-9.
- ^ Фрейзер, DAS; Руссо, Дж. (2008). «Студентизация и получение точных p-значений» (PDF) . Biometrika . 95 : 1–16. doi :10.1093/biomet/asm093.
- ^ Jordan, MI (2011). «Каковы открытые проблемы в байесовской статистике?» (PDF) . Бюллетень ISBA . 18 (1): 1–5.
- ^ Забелл, СЛ (1992). «Предсказание непредсказуемого». Synthese . 90 (2): 205. doi :10.1007/bf00485351. S2CID 9416747.
Ссылки
- Линник, Юрий (1968). Статистические задачи с мешающими параметрами . Американское математическое общество. ISBN 0-8218-1570-9.
- Sawilowsky, Shlomo S. (2002). "Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable Difference Between Two Means When σ1 ≠ σ2". Журнал современных прикладных статистических методов . 1 (2). doi : 10.22237/jmasm/1036109940 .