stringtranslate.com

Частотный вывод

Частотный вывод — это тип статистического вывода , основанный на частотной вероятности , который рассматривает «вероятность» в терминах, эквивалентных «частоте», и делает выводы на основе выборочных данных посредством подчеркивания частоты или доли результатов в данных. Частотный вывод лежит в основе частотной статистики , в которой основаны хорошо зарекомендовавшие себя методологии проверки статистических гипотез и доверительные интервалы .

История часто встречающейся статистики

Первичная формулировка частотности исходит из предположения, что статистика может восприниматься как вероятностная частота. Эта точка зрения была в первую очередь развита Рональдом Фишером и командой Ежи Неймана и Эгона Пирсона . Рональд Фишер внес свой вклад в частотную статистику, разработав частотную концепцию «тестирования значимости», которая представляет собой исследование значимости показателя статистики по сравнению с гипотезой. Нейман-Пирсон распространил идеи Фишера на несколько гипотез, предположив, что соотношение вероятностей гипотез при максимизации разницы между двумя гипотезами приводит к максимизации превышения заданного значения p, а также обеспечивает основу ошибок типа I и типа II. . Дополнительную информацию см. на странице «Основы статистики» .

Определение

Для статистического вывода статистика, о которой мы хотим сделать выводы, равна , где случайный вектор является функцией неизвестного параметра, . Параметр далее делится на ( ), где – интересующий параметр , – параметр помехи . Для конкретности это может быть среднее значение генеральной совокупности , а параметром помехи - стандартное отклонение среднего значения генеральной совокупности . [1]

Таким образом, статистический вывод связан с ожиданием случайного вектора , .

Чтобы построить области неопределенности в частотном выводе, используется ось , которая определяет область вокруг нее , которую можно использовать для обеспечения интервала для оценки неопределенности. Поворотная точка — это такая вероятность, что для поворотной точки , которая является функцией, строго возрастающей по , где — случайный вектор. Это позволяет нам для некоторых 0 < < 1 определить , что представляет собой вероятность того, что функция поворота меньше некоторого четко определенного значения. Это подразумевает , где – верхний предел для . Обратите внимание, что это диапазон результатов, определяющий односторонний предел для , и это двусторонний предел для , когда мы хотим оценить диапазон результатов, которые могут произойти. Это строго определяет доверительный интервал , который представляет собой диапазон результатов, относительно которых мы можем сделать статистические выводы.

Сокращение по Фишериану и операционные критерии Неймана-Пирсона

Двумя взаимодополняющими концепциями частотного вывода являются редукция Фишера и операционные критерии Неймана-Пирсона. Вместе эти концепции иллюстрируют способ построения частотных интервалов, которые определяют пределы для . Сокращение Фишера — это метод определения интервала, в котором может находиться истинное значение, а операционные критерии Неймана-Пирсона — это правило принятия решений о принятии априорных вероятностных предположений.

Сокращение Фишера определяется следующим образом:

По сути, сокращение Фишера предназначено для определения того, где можно использовать достаточную статистику для определения диапазона результатов, которые могут произойти в распределении вероятностей, которое определяет все потенциальные значения . Это необходимо для формулирования доверительных интервалов, где мы можем найти диапазон результатов, которые могут произойти в долгосрочной перспективе.

Операционные критерии Неймана-Пирона представляют собой еще более конкретное понимание диапазона результатов, при которых можно сказать, что соответствующая статистика имеет место в долгосрочной перспективе. Операционные критерии Неймана-Пирсона определяют вероятность того, что этот диапазон действительно является адекватным или неадекватным. Критерий Неймана-Пирсона определяет диапазон распределения вероятностей, который, если и существует в этом диапазоне, все еще ниже истинной статистики населения. Например, если распределение, полученное с помощью редукции Фишера, превышает порог, который мы считаем априори неправдоподобным, то оценка этого распределения с помощью редукции Неймана-Пирсона может быть использована для вывода о том, где рассмотрение только распределений редукции Фишера может дать нам неточные результаты. . Таким образом, сокращение Неймана-Пирсона используется для нахождения вероятности ошибок типа I и типа II . [3] Для справки: дополнением к этому в байесовской статистике является критерий минимального байесовского риска .

Поскольку критерии Неймана-Пирсона зависят от нашей способности найти диапазон результатов, которые могут произойти, подход Неймана-Пирсона возможен только там, где может быть достигнуто сокращение Фишера. [4]

Экспериментальный дизайн и методология

Частотные выводы связаны с применением частотной вероятности при планировании и интерпретации эксперимента, и, в частности, с той точкой зрения, что любой данный эксперимент можно рассматривать как один из бесконечной последовательности возможных повторений одного и того же эксперимента, каждое из которых способно давать статистически независимые результаты. [5] С этой точки зрения, частотный подход к выводу выводов из данных фактически требует, чтобы правильный вывод был сделан с заданной (высокой) вероятностью среди этого условного набора повторений.

Однако точно такие же процедуры можно разработать в несколько иной формулировке. Здесь рассматривается точка зрения, предшествовавшая эксперименту. Можно утверждать, что план эксперимента должен включать в себя еще до его проведения решения о том, какие именно шаги будут предприняты для того, чтобы прийти к выводу на основе еще не полученных данных. Эти шаги могут быть определены ученым так, чтобы существовала высокая вероятность принятия правильного решения, где в этом случае вероятность относится к еще не произошедшему набору случайных событий и, следовательно, не зависит от частотной интерпретации вероятности. Эта формулировка обсуждалась, среди прочего , Нейманом [6] . Это особенно актуально, поскольку значимость частотного теста может меняться в зависимости от выбора модели, что является нарушением принципа правдоподобия.

Статистическая философия частотности

Частотность — это исследование вероятности с предположением, что результаты возникают с заданной частотой в течение некоторого периода времени или при повторной выборке. По существу, частотный анализ должен быть сформулирован с учетом предположений о проблеме, которую пытается анализировать частотный анализ. Для этого необходимо выяснить, касается ли рассматриваемый вопрос понимания разнообразия статистики или определения истинного значения статистики. Разница между этими предположениями имеет решающее значение для интерпретации проверки гипотезы . Об этом подробно рассказывает следующий параграф.

В целом существует два лагеря статистических выводов: эпистемический подход и эпидемиологический подход . Эпистемический подход – это изучение изменчивости ; а именно, как часто мы ожидаем, что статистика будет отклоняться от некоторого наблюдаемого значения. Эпидемиологический подход занимается изучением неопределенности ; в этом подходе значение статистики фиксировано, но наше понимание этой статистики является неполным. [7] Для конкретики представьте, что вы пытаетесь измерить котировку фондового рынка, а не оценить цену актива. Фондовый рынок колеблется настолько сильно, что пытаться точно определить, какой будет цена акций, бесполезно: фондовый рынок лучше понять, используя эпистемический подход, при котором мы можем попытаться количественно оценить его непостоянные движения. И наоборот, цена актива может не сильно меняться изо дня в день: лучше определить истинную стоимость актива, а не искать диапазон цен, и, следовательно, эпидемиологический подход лучше. Разница между этими подходами нетривиальна для целей вывода.

При эпистемическом подходе мы формулируем проблему так, как будто хотим приписать гипотезе вероятность. Это можно сделать только с помощью байесовской статистики, где интерпретация вероятности проста, поскольку байесовская статистика зависит от всего выборочного пространства, тогда как частотное тестирование касается всего плана эксперимента. Частотная статистика зависит не только от данных, но и от плана эксперимента . [8] В частотной статистике порог для понимания частоты возникновения определяется на основе семейного распределения, используемого при планировании эксперимента. Например, биномиальное распределение и отрицательное биномиальное распределение могут использоваться для анализа одних и тех же данных, но поскольку их концы различны, частотный анализ будет реализовывать разные уровни статистической значимости для одних и тех же данных, что предполагает разные распределения вероятностей. Эта разница не возникает в байесовском выводе. Для получения дополнительной информации см. принцип правдоподобия , который по своей сути нарушает частотная статистика. [9]

Что касается эпидемиологического подхода, необходимо обсудить центральную идею, лежащую в основе частотной статистики. Частотная статистика разработана таким образом, чтобы в долгосрочной перспективе можно было понять частоту статистики, а в долгосрочной перспективе можно сделать вывод о диапазоне истинного среднего значения статистики. Это приводит к сокращению Фишериана и операционным критериям Неймана-Пирсона, обсуждавшимся выше. Когда мы определяем редукцию Фишера и операционные критерии Неймана-Пирсона для любой статистики, мы оцениваем, по мнению этих авторов, вероятность того, что истинное значение статистики будет иметь место в заданном диапазоне результатов, предполагая количество повторений нашей статистики. метод выборки. [8] Это позволяет сделать вывод, где в долгосрочной перспективе мы можем определить, что объединенные результаты нескольких частотных выводов означают, что 95% доверительный интервал буквально означает, что истинное среднее значение находится в доверительном интервале в 95% случаев, но не то, что среднее значение находится в определенном доверительном интервале с вероятностью 95%. Это популярное заблуждение.

Очень часто эпистемический и эпидемиологический взгляды считаются взаимоконвертируемыми. Это явно неверно. Во-первых, эпистемический взгляд сосредоточен на критериях значимости Фишера, которые предназначены для предоставления индуктивных доказательств против нулевой гипотезы в одном эксперименте и определяются p-значением Фишера. И наоборот, эпидемиологический подход, основанный на проверке гипотезы Неймана-Пирсона, предназначен для минимизации ложных ошибок принятия типа II в долгосрочной перспективе путем обеспечения минимизации ошибок, которая работает в долгосрочной перспективе. Разница между ними имеет решающее значение, поскольку эпистемический взгляд подчеркивает условия, при которых мы можем найти одно значение статистически значимым; в то же время эпидемиологический взгляд определяет условия, при которых долгосрочные результаты представляют собой достоверные результаты. Это совершенно разные выводы, поскольку одноразовые эпистемические выводы не приводят к долгосрочным ошибкам, а долгосрочные ошибки не могут использоваться для подтверждения того, имеют ли смысл одноразовые эксперименты. Допущение, что одноразовые эксперименты связаны с долгосрочными событиями, является неверным, а предположение о долгосрочных тенденциях, связанных с индивидуальными экспериментами, является примером экологической ошибки. [10]

Связь с другими подходами

Частотные выводы отличаются от других типов статистических выводов, таких как байесовские выводы и фидуциальные выводы . Хотя иногда считается, что « байесовский вывод » включает в себя подход к выводам, ведущим к оптимальным решениям , здесь для простоты используется более ограниченный взгляд.

Байесовский вывод

Байесовский вывод основан на байесовской теории вероятности , которая рассматривает «вероятность» как эквивалент «достоверности», и, таким образом, существенное различие между частотным выводом и байесовским выводом такое же, как и разница между двумя интерпретациями того, что такое «вероятность». означает. Однако там, где это уместно, байесовские выводы (имеются в виду в данном случае применение теоремы Байеса ) используются теми, кто использует частотную вероятность .

Есть два основных различия между частотным и байесовским подходами к выводу, которые не включены в приведенное выше рассмотрение интерпретации вероятности:

  1. В частотном подходе к выводу неизвестные параметры обычно рассматриваются как фиксированные, а не как случайные переменные . Напротив, байесовский подход позволяет связать вероятности с неизвестными параметрами, причем эти вероятности иногда могут иметь не только байесовскую , но и частотно-вероятностную интерпретацию . Байесовский подход позволяет интерпретировать эти вероятности как представление убеждения ученого в том, что данные значения параметра верны (см. Байесовская вероятность — Персональные вероятности и объективные методы построения априорных значений ).
  2. Результатом байесовского подхода может быть распределение вероятностей того, что известно о параметрах с учетом результатов эксперимента или исследования. Результатом частотного подхода является либо решение на основе теста значимости , либо доверительного интервала .

Смотрите также

Рекомендации

  1. ^ Кокс (2006), стр. 1–2.
  2. ^ Кокс (2006), стр. 24, 47.
  3. ^ "OpenStax CNX". cnx.org . Проверено 14 сентября 2021 г.
  4. ^ Кокс (2006), с. 24.
  5. ^ Эверитт (2002).
  6. ^ Ежи (1937), стр. 236, 333–380.
  7. ^ Ромейн, Ян-Виллем (2017), «Философия статистики», в Залте, Эдвард Н. (редактор), Стэнфордская энциклопедия философии (изд. Весны 2017 г.), Лаборатория метафизических исследований, Стэнфордский университет , получено в 2021–2009 гг. -14
  8. ^ ab Wagenmakers et al. (2008).
  9. ^ Видакович, Брани. «Принцип правдоподобия» (PDF) .
  10. ^ Хаббард, Р.; Баярри, MJ (2003). «Путаница в отношении мер доказательности (p) и ошибок (α) в классическом статистическом тестировании» (PDF) . Американский статистик . 57 : 171–182.

Библиография