stringtranslate.com

Статистические выводы

Статистический вывод — это процесс использования анализа данных для вывода свойств основного распределения вероятностей . [1] Инференциальный статистический анализ выводит свойства популяции , например, путем проверки гипотез и получения оценок. Предполагается, что наблюдаемый набор данных выбран из более крупной совокупности.

Инференциальную статистику можно противопоставить описательной статистике . Описательная статистика занимается исключительно свойствами наблюдаемых данных и не основывается на предположении, что данные поступают от более широкой совокупности. В машинном обучении вместо этого иногда используется термин « вывод» для обозначения «сделать прогноз путем оценки уже обученной модели»; [2] в этом контексте вывод о свойствах модели называется обучением или обучением (а не выводом ), а использование модели для прогнозирования называется выводом (вместо предсказания ); см. также прогнозирующий вывод .

Введение

Статистический вывод делает предположения о совокупности, используя данные, полученные от совокупности с помощью той или иной формы выборки . Учитывая гипотезу о популяции, для которой мы хотим сделать выводы, статистический вывод состоит из (во-первых) выбора статистической модели процесса , который генерирует данные, и (во-вторых) вывода предложений из модели. [3]

Кониси и Китагава утверждают: «Большинство проблем статистического вывода можно считать проблемами, связанными со статистическим моделированием». [4] В связи с этим сэр Дэвид Кокс сказал: «Как осуществляется перевод предметной задачи в статистическую модель, часто является наиболее важной частью анализа». [5]

Заключение статистического вывода является статистическим утверждением . [6] Ниже приведены некоторые распространенные формы статистических предположений:

Модели и предположения

Любой статистический вывод требует некоторых предположений. Статистическая модель — это набор предположений, касающихся формирования наблюдаемых данных и аналогичных данных. В описаниях статистических моделей обычно подчеркивается роль интересующих нас величин населения, о которых мы хотим сделать выводы. [7] Описательная статистика обычно используется в качестве предварительного шага перед тем, как будут сделаны более формальные выводы. [8]

Степень моделей/предположений

Статистики различают три уровня допущений моделирования;

Важность действительных моделей/предположений

На изображении выше показана гистограмма, оценивающая предположение о нормальности, которую можно проиллюстрировать равномерным разбросом под колоколообразной кривой.

Какой бы уровень предположений ни был сделан, правильно калиброванный вывод, как правило, требует, чтобы эти предположения были правильными; то есть, что механизмы генерации данных действительно были правильно определены.

Неправильные предположения о «простой» случайной выборке могут сделать статистические выводы недействительными. [10] Более сложные полу- и полностью параметрические предположения также вызывают беспокойство. Например, неправильное предположение о модели Кокса может в некоторых случаях привести к ошибочным выводам. [11] Неправильные предположения о нормальности популяции также делают недействительными некоторые формы выводов, основанных на регрессии. [12] Использование любой параметрической модели рассматривается скептически большинством экспертов по выборке человеческих популяций: «большинство статистиков, занимающихся выборкой, когда они вообще имеют дело с доверительными интервалами, ограничиваются утверждениями об [оценщиках], основанных на очень больших выборках, где Центральная предельная теорема гарантирует, что эти [оценщики] будут иметь почти нормальное распределение». [13] В частности, нормальное распределение «было бы совершенно нереалистичным и катастрофически неразумным предположением, если бы мы имели дело с каким-либо экономическим населением». [13] Здесь центральная предельная теорема утверждает, что распределение выборочного среднего «для очень больших выборок» имеет приблизительно нормальное распределение, если распределение не имеет «тяжелого хвоста».

Приблизительные распределения

Учитывая сложность определения точных распределений выборочной статистики, было разработано множество методов их аппроксимации.

При использовании конечных выборок результаты аппроксимации измеряют, насколько близко предельное распределение приближается к выборочному распределению статистики : например, при 10 000 независимых выборках нормальное распределение аппроксимирует (с точностью до двух цифр) распределение выборочного среднего для многих распределений совокупности по методу Берри . – Теорема Эссеена . [14] Тем не менее, согласно исследованиям моделирования и опыту статистиков, для многих практических целей нормальное приближение обеспечивает хорошее приближение к распределению выборочного среднего, когда имеется 10 (или более) независимых выборок. [14] Следуя работам Колмогорова в 1950-х годах, передовая статистика использует теорию аппроксимации и функциональный анализ для количественной оценки ошибки аппроксимации. В этом подходе изучается метрическая геометрия вероятностных распределений ; этот подход количественно определяет ошибку аппроксимации, например, с помощью дивергенции Кульбака-Лейблера , дивергенции Брегмана и расстояния Хеллингера . [15] [16] [17]

В случае неопределенно больших выборок предельные результаты , такие как центральная предельная теорема, описывают предельное распределение выборочной статистики, если таковое существует. Ограничивающие результаты не являются утверждениями о конечных выборках и действительно не имеют отношения к конечным выборкам. [18] [19] [20] Однако асимптотическая теория предельных распределений часто используется для работы с конечными выборками. Например, предельные результаты часто используются для обоснования обобщенного метода моментов и использования обобщенных оценочных уравнений , которые популярны в эконометрике и биостатистике . Величину разницы между предельным распределением и истинным распределением (формально «ошибка» аппроксимации) можно оценить с помощью моделирования. [21] Эвристическое применение ограничения результатов конечными выборками является обычной практикой во многих приложениях, особенно с низкоразмерными моделями с логарифмически вогнутыми правдоподобиями (например, с однопараметрическими экспоненциальными семействами ).

Модели на основе рандомизации

Для данного набора данных, созданного с помощью схемы рандомизации, распределение рандомизации статистики (при нулевой гипотезе) определяется путем оценки тестовой статистики для всех планов, которые могли быть созданы с помощью схемы рандомизации. При частотном выводе рандомизация позволяет делать выводы на основе рандомизированного распределения, а не на субъективной модели, и это особенно важно при выборке опросов и планировании экспериментов. [22] [23] Статистические выводы из рандомизированных исследований также более просты, чем во многих других ситуациях. [24] [25] [26] В байесовском выводе рандомизация также имеет важное значение: при опросной выборке использование выборки без замены обеспечивает возможность обмена выборки с населением; в рандомизированных экспериментах рандомизация гарантирует отсутствие случайного предположения о ковариатной информации. [27]

Объективная рандомизация позволяет правильно проводить индуктивные процедуры. [28] [29] [30] [31] [32] Многие статистики предпочитают анализ данных, основанный на рандомизации, который был получен с помощью четко определенных процедур рандомизации. [33] (Однако это правда, что в областях науки с развитыми теоретическими знаниями и экспериментальным контролем рандомизированные эксперименты могут увеличить затраты на экспериментирование без улучшения качества выводов. [34] [35] ) Аналогичным образом, результаты рандомизированных экспериментов рекомендуются ведущими статистическими органами как позволяющие делать выводы с большей надежностью, чем наблюдательные исследования тех же явлений. [36] Однако хорошее обсервационное исследование может быть лучше, чем плохой рандомизированный эксперимент.

Статистический анализ рандомизированного эксперимента может быть основан на схеме рандомизации, указанной в протоколе эксперимента, и не требует субъективной модели. [37] [38]

Однако в любой момент некоторые гипотезы невозможно проверить с помощью объективных статистических моделей, которые точно описывают рандомизированные эксперименты или случайные выборки. В некоторых случаях такие рандомизированные исследования неэкономичны или неэтичны.

Модельный анализ рандомизированных экспериментов

Стандартной практикой является обращение к статистической модели, например, к линейной или логистической модели, при анализе данных рандомизированных экспериментов. [39] Однако схема рандомизации определяет выбор статистической модели. Невозможно выбрать подходящую модель, не зная схемы рандомизации. [23] Серьезно вводящие в заблуждение результаты можно получить, анализируя данные рандомизированных экспериментов, игнорируя протокол эксперимента; распространенные ошибки включают в себя забывание блокировки, использованной в эксперименте, и путаницу повторных измерений на одной и той же экспериментальной установке с независимыми повторами лечения, примененного к различным экспериментальным единицам. [40]

Вывод рандомизации без модели

Безмодельные методы дополняют методы, основанные на моделях, которые используют редукционистские стратегии упрощения реальности. Первые объединяют, развивают, группируют и обучают алгоритмы, динамически адаптирующиеся к контекстуальным особенностям процесса и изучающие внутренние характеристики наблюдений. [39] [41]

Например, простая линейная регрессия без модели основана либо на

В любом случае вывод о рандомизации без модели для особенностей общего условного распределения опирается на некоторые условия регулярности, например функциональную гладкость. Например, вывод рандомизации без модели для условного среднего признака совокупности , , может быть последовательно оценен с помощью локального усреднения или аппроксимации локальным полиномом в предположении, что он является гладким. Кроме того, опираясь на асимптотическую нормальность или повторную выборку, мы можем построить доверительные интервалы для генерального признака, в данном случае условного среднего , . [42]

Парадигмы вывода

Сложились различные школы статистических выводов. Эти школы — или «парадигмы» — не являются взаимоисключающими, и методы, которые хорошо работают в одной парадигме, часто имеют привлекательные интерпретации в других парадигмах.

Бандиопадхай и Форстер описывают четыре парадигмы: классическую (или частотную ) парадигму, байесовскую парадигму, правдоподобную парадигму и парадигму, основанную на информационном критерии Акаике . [43]

Частотный вывод

Эта парадигма калибрует правдоподобие предположений, рассматривая (условную) повторную выборку распределения населения для получения наборов данных, аналогичных имеющемуся. Рассматривая характеристики набора данных при повторной выборке, можно количественно оценить частотные свойства статистического предположения, хотя на практике эта количественная оценка может быть сложной.

Примеры частотного вывода

Частотный вывод, объективность и теория принятия решений

Одна из интерпретаций частотного вывода (или классического вывода) заключается в том, что он применим только с точки зрения частотной вероятности ; то есть с точки зрения повторной выборки из совокупности. Однако подход Неймана [44] развивает эти процедуры с точки зрения предэкспериментальных вероятностей. То есть, прежде чем приступить к эксперименту, необходимо определить правило, по которому можно прийти к такому выводу, чтобы вероятность его правильности контролировалась подходящим способом: такая вероятность не обязательно должна иметь частотную интерпретацию или интерпретацию повторной выборки. Напротив, байесовский вывод работает с точки зрения условных вероятностей (т. е. вероятностей, зависящих от наблюдаемых данных) по сравнению с маргинальными (но обусловленными неизвестными параметрами) вероятностями, используемыми в частотном подходе.

Частотные процедуры проверки значимости и доверительные интервалы могут быть построены без учета функций полезности . Однако некоторые элементы частотной статистики, такие как теория статистических решений , действительно включают функции полезности . [ нужна цитата ] В частности, частотные разработки оптимального вывода (такие как несмещенные оценки с минимальной дисперсией или равномерно наиболее мощное тестирование ) используют функции потерь , которые играют роль (отрицательных) функций полезности. Функции потерь не обязательно указывать явно, чтобы теоретики статистики могли доказать, что статистическая процедура обладает свойством оптимальности. [45] Однако функции потерь часто полезны для определения свойств оптимальности: например, несмещенные по медиане оценки оптимальны при функциях потерь абсолютных значений , поскольку они минимизируют ожидаемые потери, а оценки методом наименьших квадратов оптимальны при функциях потерь квадратичных ошибок, в том, что они минимизируют ожидаемые потери.

В то время как статистики, использующие частотный вывод, должны сами выбирать интересующие параметры, а также оценщики / тестовые статистические данные , которые будут использоваться, отсутствие явно явных полезностей и предшествующих распределений помогло частотным процедурам широко рассматриваться как «объективные». [46]

Байесовский вывод

Байесовское исчисление описывает степени уверенности, используя «язык» вероятности; убеждения положительны, интегрируются в одно целое и подчиняются аксиомам вероятности. Байесовский вывод использует доступные апостериорные убеждения в качестве основы для создания статистических предположений. [47] Существует несколько различных обоснований использования байесовского подхода.

Примеры байесовского вывода

Байесовский вывод, субъективность и теория принятия решений

Многие неформальные байесовские выводы основаны на «интуитивно разумных» обобщениях апостериорных явлений. Например, таким образом можно мотивировать апостериорное среднее значение, медиану и моду, интервалы максимальной апостериорной плотности и факторы Байеса. Хотя для такого рода выводов не обязательно указывать функцию полезности пользователя , все эти сводки зависят (в некоторой степени) от заявленных предшествующих убеждений и обычно рассматриваются как субъективные выводы. (Методы предварительного строительства, не требующие внешнего вмешательства, были предложены , но еще не полностью разработаны.)

Формально байесовский вывод калибруется со ссылкой на явно заявленную полезность или функцию потерь; «Правило Байеса» — это правило, которое максимизирует ожидаемую полезность, усредненную по апостериорной неопределенности. Таким образом, формальный байесовский вывод автоматически обеспечивает оптимальные решения в теоретическом смысле решений. Учитывая предположения, данные и полезность, байесовский вывод может быть сделан практически для любой проблемы, хотя не каждый статистический вывод нуждается в байесовской интерпретации. Анализ, который формально не является байесовским, может быть (логически) бессвязным ; Особенностью байесовских процедур, использующих правильные априорные значения (т. е. интегрируемые до единицы), является то, что они гарантированно когерентны . Некоторые сторонники байесовского вывода утверждают, что вывод должен осуществляться в рамках теории принятия решений и что байесовский вывод не должен завершаться оценкой и обобщением апостериорных убеждений.

Вывод, основанный на правдоподобии

Вывод на основе правдоподобия — это парадигма, используемая для оценки параметров статистической модели на основе наблюдаемых данных. Правдоподобие приближается к статистике с использованием функции правдоподобия , обозначаемой как , количественно определяет вероятность наблюдения данных данных , предполагая определенный набор значений параметров . В выводе на основе правдоподобия цель состоит в том, чтобы найти набор значений параметров, который максимизирует функцию правдоподобия или, что то же самое, максимизирует вероятность наблюдения заданных данных.

Процесс вывода на основе правдоподобия обычно включает в себя следующие этапы:

  1. Формулирование статистической модели: Статистическая модель определяется на основе рассматриваемой проблемы с указанием предположений о распределении и взаимосвязи между наблюдаемыми данными и неизвестными параметрами. Модель может быть простой, например нормальное распределение с известной дисперсией, или сложной, например иерархическая модель с несколькими уровнями случайных эффектов.
  2. Построение функции правдоподобия. Учитывая статистическую модель, функция правдоподобия строится путем оценки совместной плотности вероятности или функции массы наблюдаемых данных как функции неизвестных параметров. Эта функция представляет вероятность наблюдения данных для разных значений параметров.
  3. Максимизация функции правдоподобия. Следующий шаг — найти набор значений параметров, который максимизирует функцию правдоподобия. Этого можно достичь с помощью методов оптимизации, таких как алгоритмы численной оптимизации. Оценочные значения параметров, часто обозначаемые как , представляют собой оценки максимального правдоподобия (MLE).
  4. Оценка неопределенности. После получения MLE крайне важно количественно оценить неопределенность, связанную с оценками параметров. Это можно сделать путем расчета стандартных ошибок , доверительных интервалов или проведения проверки гипотез на основе асимптотической теории или методов моделирования, таких как бутстрэппинг .
  5. Проверка модели: после получения оценок параметров и оценки их неопределенности важно оценить адекватность статистической модели. Это включает в себя проверку допущений, сделанных в модели, и оценку соответствия модели данным с использованием критериев согласия, остаточного анализа или графической диагностики.
  6. Вывод и интерпретация. Наконец, на основе предполагаемых параметров и оценки модели можно сделать статистический вывод. Это включает в себя получение выводов о параметрах популяции, составление прогнозов или проверку гипотез на основе оцененной модели.

Вывод на основе AIC

Информационный критерий Акаике ( AIC) представляет собой оценку относительного качества статистических моделей для заданного набора данных. Учитывая набор моделей данных, AIC оценивает качество каждой модели по сравнению с каждой из других моделей. Таким образом, AIC предоставляет средства выбора модели .

AIC основан на теории информации : он предлагает оценку относительной потери информации, когда данная модель используется для представления процесса, в результате которого были сгенерированы данные. (При этом речь идет о компромиссе между степенью соответствия модели и ее простотой.)

Другие парадигмы вывода

Минимальная длина описания

Принцип минимальной длины описания (MDL) был развит на основе идей теории информации [48] и теории колмогоровской сложности . [49] Принцип (MDL) выбирает статистические модели, которые максимально сжимают данные; Вывод происходит без предположения контрфактических или нефальсифицируемых «механизмов генерации данных» или вероятностных моделей для данных, как это могло бы быть сделано в частотных или байесовских подходах.

Однако если «механизм генерации данных» действительно существует, то согласно теореме Шеннона о кодировании источника он обеспечивает MDL-описание данных в среднем и асимптотически. [50] В плане минимизации длины описания (или описательной сложности) оценка MDL аналогична оценке максимального правдоподобия и максимальной апостериорной оценке (с использованием байесовских априорных априорных подходов с максимальной энтропией ). Однако MDL избегает предположения, что основная вероятностная модель известна; принцип MDL также может применяться без предположений о том, что, например, данные получены в результате независимой выборки. [50] [51]

Принцип MDL применялся в теории коммуникационного кодирования , в теории информации , в линейной регрессии [51] и в интеллектуальном анализе данных . [49]

Для оценки процедур вывода на основе MDL часто используются методы или критерии теории сложности вычислений . [52]

Фидуциальный вывод

Фидуциальный вывод — это подход к статистическому выводу, основанный на фидуциальной вероятности , также известный как «фидуциальное распределение». В последующих работах этот подход был назван нечетким, крайне ограниченным в применимости и даже ошибочным. [53] [54] Однако этот аргумент аналогичен аргументу, который показывает [55] , что так называемое доверительное распределение не является действительным распределением вероятностей , и, поскольку это не делает недействительным применение доверительных интервалов , оно не обязательно делает недействительным выводы, сделанные на основе фидуциальных аргументов. Была предпринята попытка переосмыслить раннюю работу фидуциального аргумента Фишера как частный случай теории вывода с использованием верхних и нижних вероятностей . [56]

Структурный вывод

Развивая идеи Фишера и Питмана с 1938 по 1939 год, [57] Джордж А. Барнард разработал «структурный вывод» или «основной вывод», [58] подход, использующий инвариантные вероятности в семействах групп . Барнард переформулировал аргументы в пользу фидуциального вывода для ограниченного класса моделей, на которых «фидуциальные» процедуры были бы четко определены и полезны. Дональд А.С. Фрейзер разработал общую теорию структурного вывода [59] , основанную на теории групп , и применил ее к линейным моделям. [60] Теория, сформулированная Фрейзером, тесно связана с теорией принятия решений и байесовской статистикой и может обеспечить оптимальные частотные правила принятия решений, если они существуют. [61]

Темы вывода

Приведенные ниже темы обычно относятся к области статистических выводов .

  1. Статистические предположения
  2. Статистическая теория принятия решений
  3. Теория оценки
  4. Статистическая проверка гипотез
  5. Пересмотр мнений в статистике
  6. Планирование экспериментов , дисперсионный анализ и регрессия.
  7. Выборка опроса
  8. Обобщение статистических данных

Прогнозирующий вывод

Прогнозирующий вывод — это подход к статистическому выводу, который делает упор на предсказание будущих наблюдений на основе прошлых наблюдений.

Первоначально прогнозирующий вывод был основан на наблюдаемых параметрах и был основной целью изучения вероятности , но он вышел из моды в 20-м веке из-за нового параметрического подхода, впервые предложенного Бруно де Финетти . Этот подход моделировал явления как физическую систему, наблюдаемую с ошибкой (например, небесная механика ). Идея де Финетти о взаимозаменяемости (что будущие наблюдения должны вести себя так же, как прошлые наблюдения) привлекла внимание англоязычного мира после перевода с французского в 1974 году его статьи 1937 года [62] и с тех пор продвигалась такими статистиками, как Сеймур Гейссер . . [63]

Смотрите также

Примечания

  1. По мнению Пирса, принятие означает, что расследование по этому вопросу на данный момент прекращается. В науке все научные теории подлежат пересмотру.

Рекомендации

Цитаты

  1. ^ Аптон, Г., Кук, И. (2008) Оксфордский статистический словарь , OUP. ISBN  978-0-19-954145-4 .
  2. ^ «Вывод TensorFlow Lite» . Термин «вывод» относится к процессу выполнения модели TensorFlow Lite на устройстве с целью сделать прогнозы на основе входных данных.
  3. Джонсон, Ричард (12 марта 2016 г.). "Статистические выводы". Энциклопедия математики . Спрингер: Европейское математическое общество . Проверено 26 октября 2022 г.
  4. ^ Кониси и Китагава (2008), с. 75.
  5. ^ Кокс (2006), с. 197.
  6. ^ «Статистический вывод - Математическая энциклопедия». www.энциклопедияofmath.org . Проверено 23 января 2019 г.
  7. ^ Аб Кокс (2006), стр. 2
  8. ^ Эванс, Майкл; и другие. (2004). Вероятность и статистика: наука неопределенности. Фримен и компания. п. 267. ИСБН 9780716747420.
  9. ^ ван дер Ваарт, AW (1998) Асимптотическая статистика Издательство Кембриджского университета. ISBN 0-521-78450-6 (стр. 341) 
  10. ^ Краскал 1988
  11. ^ Фридман, Д.А. (2008) «Анализ выживания: эпидемиологическая опасность?». Американский статистик (2008) 62: 110–119. (Перепечатано как глава 11 (стр. 169–192) книги Freedman (2010)).
  12. ^ Берк, Р. (2003) Регрессионный анализ: конструктивная критика (передовые количественные методы в социальных науках) (т. 11) Sage Publications. ISBN 0-7619-2904-5 
  13. ^ аб Брюэр, Кен (2002). Выводы по выборке комбинированного обследования: взвешивание слонов Басу . Ходдер Арнольд. п. 6. ISBN 978-0340692295.
  14. ^ ab Вероятность Йоргена Хоффмана-Йоргенсена с точки зрения статистики , Том I. Страница 399 [ нужна полная цитата ]
  15. ^ Le Cam (1986) [ нужна страница ]
  16. ^ Эрик Торгерсон (1991) Сравнение статистических экспериментов , том 36 Энциклопедии математики. Издательство Кембриджского университета. [ нужна полная цитата ]
  17. ^ Лизе, Фридрих и Мишке, Клаус-Дж. (2008). Статистическая теория принятия решений: оценка, тестирование и отбор . Спрингер. ISBN 978-0-387-73193-3.
  18. ^ Колмогоров (1963, стр.369): «Частотная концепция, основанная на понятии предельной частоты при увеличении числа испытаний до бесконечности, не дает ничего для обоснования применимости результатов теории вероятностей к реальным практическим задачам, где нам всегда приходится иметь дело с конечным числом испытаний».
  19. ^ «Действительно, предельные теоремы, 'при  стремлении к бесконечности' логически лишены содержания о том, что происходит в какой-либо конкретный момент  . Все, что они могут сделать, это предложить определенные подходы, эффективность которых затем должна быть проверена в рассматриваемом случае». - Ле Кам (1986) (стр. xiv)
  20. ^ Пфанзагль (1994): «Важнейший недостаток асимптотической теории: то, что мы ожидаем от асимптотической теории, - это результаты, которые верны приблизительно... Асимптотическая теория может предложить предельные теоремы». (стр. ix) «Что важно для приложений, так это приближения, а не пределы». (стр. 188)
  21. ^ Пфанзагль (1994): «Принимая предельную теорему как приблизительно верную для больших размеров выборки, мы допускаем ошибку, размер которой неизвестен. [...] Реалистичная информация об остальных ошибках может быть получена путем моделирования». (стр. ix)
  22. ^ Нейман, Дж. (1934) «О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора», Журнал Королевского статистического общества , 97 (4), 557–625 JSTOR  2342192.
  23. ^ Аб Хинкельманн и Кемпторн (2008) [ нужна страница ]
  24. ^ Рекомендации ASA для первого курса статистики для нестатистиков. (доступно на сайте АСА)
  25. ^ Статистика Дэвида А. Фридмана и других .
  26. ^ Мур и др. (2015).
  27. ^ Гельман А. и др. (2013). Байесовский анализ данных ( Чепмен и Холл ).
  28. ^ Пирс (1877-1878)
  29. ^ Пирс (1883)
  30. ^ Фридман, Пизани и Первес 1978.
  31. ^ Статистические модели Дэвида А. Фридмана .
  32. ^ Рао, CR (1997) Статистика и истина: шанс на работу , World Scientific. ISBN 981-02-3111-3 
  33. ^ Пирс; Вольноотпущенник; Мур и др. (2015). [ нужна цитата ]
  34. ^ Box, GEP и друзья (2006) Улучшение почти всего: идеи и эссе, исправленное издание , Wiley. ISBN 978-0-471-72755-2 
  35. ^ Кокс (2006), с. 196.
  36. ^ Рекомендации ASA для первого курса статистики для нестатистиков. (доступно на сайте АСА)
    • Дэвид А. Фридман и его псевдоним «Статистика» .
    • Мур и др. (2015).
  37. ^ Нейман, Ежи. 1923 [1990]. «О применении теории вероятностей к сельскохозяйственным экспериментам. Очерк принципов. Раздел 9». Статистическая наука 5 (4): 465–472. Пер. Дорота М. Дабровска и Теренс П. Спид.
  38. ^ Хинкельманн и Кемпторн (2008) [ нужна страница ]
  39. ^ аб Динов, Иво; Паланималай, Сельвам; Харе, Ашвини; Кристу, Николя (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования». Преподавание статистики . 40 (2): 64–73. дои : 10.1111/test.12156. ПМК 6155997 . ПМИД  30270947. 
  40. ^ Хинкельманн и Кемпторн (2008) Глава 6.
  41. ^ Тан, Мин; Гао, Чао; Гутман, Стивен; Калинин Александр; Мукерджи, Бхрамар; Гуань, Юаньфан; Динов, Иво (2019). «Методические и немодальные методы прогнозирования бокового амиотрофического склероза и кластеризации пациентов». Нейроинформатика . 17 (3): 407–421. doi : 10.1007/s12021-018-9406-9. ПМК 6527505 . ПМИД  30460455. 
  42. ^ Политис, DN (2019). «Безмодельный вывод в статистике: как и почему». Бюллетень ИМС . 48 .
  43. ^ Bandyopadhyay & Forster (2011). См. Введение к книге (стр. 3) и «Раздел III: Четыре парадигмы статистики».
  44. ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей». Философские труды Лондонского королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N. дои : 10.1098/rsta.1937.0005 . JSTOR  91337.
  45. ^ Предисловие к Пфанцаглю.
  46. ^ Литтл, Родерик Дж. (2006). «Калиброванный Байес: дорожная карта Байеса/частотника». Американский статистик . 60 (3): 213–223. дои : 10.1198/000313006X117837. ISSN  0003-1305. JSTOR  27643780. S2CID  53505632.
  47. ^ Ли, Се Юн (2021). «Сэмплер Гиббса и вариационный вывод по координатному восхождению: теоретико-множественный обзор». Коммуникации в статистике - теория и методы . 51 (6): 1549–1568. arXiv : 2008.01006 . дои : 10.1080/03610926.2021.1921214. S2CID  220935477.
  48. ^ Суфи (2000)
  49. ^ Аб Хансен и Ю (2001)
  50. ^ Аб Хансен и Ю (2001), стр. 747.
  51. ^ Аб Риссанен (1989), стр. 84
  52. ^ Джозеф Ф. Трауб, Г.В. Васильковски и Х. Возняковски. (1988) [ нужна страница ]
  53. ^ Нейман (1956)
  54. ^ Забелл (1992)
  55. ^ Кокс (2006), стр. 66
  56. ^ Хампель 2003.
  57. ^ Дэвисон, страница 12. [ нужна полная цитата ]
  58. ^ Барнард, Джорджия (1995) «Основные модели и фидуциальный аргумент», International Statistical Review, 63 (3), 309–323. JSTOR  1403482
  59. ^ Фрейзер, DAS (1968). Структура вывода. Нью-Йорк: Уайли. ISBN 0-471-27548-4. ОСЛК  440926.
  60. ^ Фрейзер, DAS (1979). Вывод и линейные модели. Лондон: МакГроу-Хилл. ISBN 0-07-021910-9. ОСЛК  3559629.
  61. ^ Таральдсен, Гуннар; Линдквист, Бо Генри (01 февраля 2013 г.). «Фидуциальная теория и оптимальный вывод». Анналы статистики . 41 (1). arXiv : 1301.1717 . дои : 10.1214/13-AOS1083. ISSN  0090-5364. S2CID  88520957.
  62. ^ Де Финетти, Бруно (1937). «La Prévision: ses lois logiques, ses source субъективные». Анналы Института Анри Пуанкаре . 7 (1): 1–68. ISSN  0365-320X.Переведено Де Финетти, Бруно (1992). «Форсайт: его логические законы, его субъективные источники». Прорывы в статистике . Серия Спрингера по статистике. стр. 134–174. дои : 10.1007/978-1-4612-0919-5_10. ISBN 978-0-387-94037-3.
  63. ^ Гейссер, Сеймур (1993) Прогнозирующий вывод: введение , CRC Press. ISBN 0-412-03471-9 

Источники

дальнейшее чтение

Внешние ссылки