stringtranslate.com

Т-критерий Стьюдента

T - тест — это тест статистической гипотезы, используемый для проверки того, является ли разница между ответами двух групп статистически значимой или нет. Это любая проверка статистической гипотезы , в которой статистика теста соответствует t -распределению Стьюдента при нулевой гипотезе . Чаще всего он применяется, когда статистика теста следовала бы нормальному распределению, если бы значение члена масштабирования в статистике теста было известно (обычно член масштабирования неизвестен и, следовательно, является неприятным параметром ). Когда коэффициент масштабирования оценивается на основе данных , статистика теста — при определенных условиях — соответствует t- распределению Стьюдента . Наиболее распространенное применение t - теста — проверить, существенно ли различаются средние значения двух совокупностей. Во многих случаях Z-тест дает результаты, очень похожие на t-тест, поскольку последний сходится к первому по мере увеличения размера набора данных.

История

Уильям Сили Госсет , разработавший « t -статистику» и опубликовавший ее под псевдонимом «Студент».

Термин « t -статистика» является сокращением от «статистика проверки гипотез». [1] В статистике t -распределение было впервые получено как апостериорное распределение в 1876 году Хелмертом [2] [3] [4] и Люротом . [5] [6] [7] t - распределение также появилось в более общей форме как распределение Пирсона типа  IV в статье Карла Пирсона 1895 года. [8] Однако t -распределение, также известное как t -распределение Стьюдента , получило свое название от Уильяма Сили Госсета , который впервые опубликовал его на английском языке в 1908 году в научном журнале « Биометрика» , используя псевдоним «Студент» [9] [10 ] ] , потому что его работодатель предпочитал, чтобы сотрудники использовали псевдонимы при публикации научных статей. [11] Госсет работал на пивоварне Guinness Brewery в Дублине , Ирландия , и интересовался проблемами небольших образцов – например, химическими свойствами ячменя при небольших размерах образцов. Следовательно, вторая версия этимологии термина «Студент» заключается в том, что компания Guinness не хотела, чтобы их конкуренты знали, что они используют t -тест для определения качества сырья. Хотя термин «Студент» был написан в честь Уильяма Госсета, на самом деле именно благодаря работе Рональда Фишера это распределение стало широко известно как «распределение Стьюдента» [12] и « Т -критерий Стьюдента ».

Госсет разработал t -тест как экономичный способ контроля качества стаута . Работа по t - тесту была представлена ​​и принята в журнале «Биометрика» и опубликована в 1908 году. [9]

В книге «Гиннесс» существовала политика, позволяющая техническому персоналу отправляться на учебу (так называемый «учебный отпуск»), которую Госсет использовал в течение первых двух семестров 1906–1907 учебного года в биометрической лаборатории профессора Карла Пирсона в Университетском колледже Лондона . [13] Личность Госсета тогда была известна коллегам-статистикам и главному редактору Карлу Пирсону. [14]

Использование

Наиболее часто используемые t -тесты — это одновыборочные и двухвыборочные тесты:

Предположения

[ сомнительно ]

Большинство тестовых статистических данных имеют форму t = Z / s , где Z и s — функции данных.

Z может быть чувствителен к альтернативной гипотезе (т. е. его величина имеет тенденцию быть больше, когда альтернативная гипотеза верна), тогда как s является параметром масштабирования , который позволяет определить распределение t .

Например, в одновыборочном t -тесте

где — выборочное среднее из выборки X 1 , X 2 , …, X n размера n , sстандартная ошибка среднего значения , — оценка стандартного отклонения генеральной совокупности, а μсреднее генеральное значение .

Предположения, лежащие в основе t -теста в простейшей форме, приведенной выше, заключаются в следующем:

В t -тесте, сравнивающем средние значения двух независимых выборок, должны соблюдаться следующие допущения:

Большинство двухвыборочных t -тестов устойчивы ко всем отклонениям от предположений, кроме больших. [19]

Для точности t - критерий и Z -критерий требуют нормальности выборочных средних, а t -критерий дополнительно требует, чтобы выборочная дисперсия соответствовала масштабированному распределению χ 2 и чтобы выборочное среднее и выборочная дисперсия были статистически независимыми . Нормальность отдельных значений данных не требуется, если эти условия выполняются. Согласно центральной предельной теореме выборочные средние выборки умеренно больших размеров часто хорошо аппроксимируются нормальным распределением, даже если данные не имеют нормального распределения. Для ненормальных данных распределение выборочной дисперсии может существенно отклоняться от распределения χ2 .

Однако если размер выборки велик, теорема Слуцкого предполагает, что распределение выборочной дисперсии мало влияет на распределение тестовой статистики. То есть по мере увеличения размера выборки:

согласно центральной предельной теореме ,
по закону больших чисел ,
.

Непарные и парные двухвыборочные t- критерии

Ошибка I рода непарных и парных двухвыборочных t -тестов как функция корреляции. Смоделированные случайные числа происходят из двумерного нормального распределения с дисперсией 1. Уровень значимости составляет 5%, а количество случаев - 60.
Мощность непарных и парных двухвыборочных t -тестов как функция корреляции. Смоделированные случайные числа происходят из двумерного нормального распределения с дисперсией 1 и отклонением ожидаемого значения 0,4. Уровень значимости составляет 5%, количество случаев — 60.

Двухвыборочные t -критерии для определения разницы средних включают независимые выборки (непарные выборки) или парные выборки . Парные t -тесты являются формой блокировки и имеют большую мощность (вероятность избежать ошибки типа II, также известной как ложноотрицательный результат), чем непарные тесты, когда парные единицы схожи с точки зрения «факторов шума» (см. искажающие факторы ). которые не зависят от принадлежности к двум сравниваемым группам. [20] В другом контексте парные t -тесты могут использоваться для уменьшения влияния мешающих факторов в обсервационном исследовании .

Независимые (неспарные) выборки

t -критерий независимых выборок используется, когда получаются два отдельных набора независимых и одинаково распределенных выборок и сравнивается одна переменная из каждой из двух совокупностей. Например, предположим, что мы оцениваем эффект медицинского лечения и включаем 100 субъектов в наше исследование, затем случайным образом распределяем 50 субъектов в группу лечения и 50 субъектов в контрольную группу. В этом случае у нас есть две независимые выборки, и мы будем использовать непарную форму t -критерия.

Парные образцы

Парные выборочные t -тесты обычно состоят из выборки совпадающих пар схожих единиц или одной группы единиц, которая была протестирована дважды ( t -критерий «повторяющихся измерений»).

Типичным примером t -теста с повторными измерениями может служить случай, когда субъектов проверяют перед лечением, скажем, на высокое кровяное давление, и тех же самых субъектов проверяют снова после лечения лекарствами, снижающими кровяное давление. Сравнивая количество одних и тех же пациентов до и после лечения, мы эффективно используем каждого пациента в качестве собственного контроля. Таким образом, правильное отклонение нулевой гипотезы (здесь: отсутствие разницы в результате лечения) может стать гораздо более вероятным, а статистическая мощность увеличится просто потому, что случайные вариации между пациентами теперь устранены. Однако за увеличение статистической мощности приходится платить: требуется больше тестов, причем каждого испытуемого приходится тестировать дважды. Поскольку половина выборки теперь зависит от другой половины, парная версия t -критерия Стьюдента имеет толькон/2− 1 степень свободы (где n — общее количество наблюдений). Пары становятся отдельными тестовыми единицами, и для достижения того же числа степеней свободы образец необходимо удвоить. Обычно существует n - 1 степеней свободы (где n — общее количество наблюдений). [21]

T -критерий для парных выборок , основанный на «выборке совпадающих пар», получается на основе непарной выборки, которая впоследствии используется для формирования парной выборки с использованием дополнительных переменных, которые измерялись вместе с интересующей переменной. [22] Сопоставление осуществляется путем выявления пар значений, состоящих из одного наблюдения из каждой из двух выборок, где пара аналогична с точки зрения других измеряемых переменных. Этот подход иногда используется в наблюдательных исследованиях для уменьшения или устранения влияния мешающих факторов.

t -критерии парных выборок часто называют « t -критериями зависимых выборок».

Расчеты

Ниже приведены явные выражения, которые можно использовать для проведения различных t -тестов. В каждом случае дается формула для тестовой статистики, которая либо точно соответствует, либо близко приближается к t -распределению при нулевой гипотезе. Кроме того, в каждом случае даны соответствующие степени свободы . Каждую из этих статистических данных можно использовать для проведения одностороннего или двустороннего теста .

После определения значения t и степеней свободы значение p можно найти с помощью таблицы значений из t -распределения Стьюдента . Если рассчитанное значение p ниже порога, выбранного для статистической значимости (обычно уровень 0,10, 0,05 или 0,01), то нулевая гипотеза отклоняется в пользу альтернативной гипотезы.

Одновыборочный t- критерий

При проверке нулевой гипотезы о том, что среднее значение совокупности равно заданному значению μ 0 , используется статистика

где – среднее значение выборки, sстандартное отклонение выборки , а n – размер выборки. В этом тесте используются степени свободы n  − 1 . Хотя родительская совокупность не обязательно должна быть нормально распределена, распределение выборочных средних предполагается нормальным.

По центральной предельной теореме , если наблюдения независимы и существует второй момент, то это будет приблизительно нормально .

Наклон линии регрессии

Предположим, что кто-то соответствует модели

где x известен, α и β неизвестны, ε — нормально распределенная случайная величина со средним значением 0 и неизвестной дисперсией σ 2 , а Y — интересующий результат. Мы хотим проверить нулевую гипотезу о том, что наклон β равен некоторому заданному значению β 0 (часто принимается равным 0, и в этом случае нулевая гипотеза заключается в том, что x и y не коррелируют).

Позволять

Затем

имеет t -распределение с n - 2 степенями свободы, если нулевая гипотеза верна. Стандартная ошибка коэффициента наклона :

можно записать через остатки. Позволять

Тогда t- оценка определяется выражением

Другой способ определить t- показатель :

где rкоэффициент корреляции Пирсона .

Показатель t , перехват можно определить по показателю t , наклон :

где s x 2 — выборочная дисперсия.

Независимый двухвыборочный t- критерий

Равные размеры выборки и дисперсия

Учитывая две группы (1, 2), этот тест применим только в том случае, если:

Нарушения этих предположений обсуждаются ниже.

Статистику t , позволяющую проверить, различны ли средние значения, можно рассчитать следующим образом:

где

Здесь s pобъединенное стандартное отклонение для n = n 1 = n 2 , а s 2
х 1
и с 2
х 2
являются несмещенными оценками генеральной дисперсии. Знаменатель t — это стандартная ошибка разницы между двумя средними значениями.

Для проверки значимости степени свободы для этого теста составляют 2 n − 2 , где n — размер выборки.

Равные или неравные размеры выборки, схожие отклонения (1/2<с х 1/с х 2< 2)

Этот тест используется только тогда, когда можно предположить, что два распределения имеют одинаковую дисперсию (когда это предположение нарушается, см. ниже). Предыдущие формулы являются частным случаем приведенных ниже формул. Они восстанавливаются, когда обе выборки имеют одинаковый размер: n = n 1 = n 2 .

Статистику t , позволяющую проверить, различны ли средние значения, можно рассчитать следующим образом:

где

— это объединенное стандартное отклонение двух выборок: оно определяется таким образом, что его квадрат является несмещенной оценкой общей дисперсии, независимо от того, одинаковы ли средние значения совокупности. В этих формулах n i  − 1 — это количество степеней свободы для каждой группы, а общий размер выборки минус два (то есть n 1  +  n 2  — 2 ) — это общее количество степеней свободы, которое используется в тестировании значимости.

Равные или неравные размеры выборки, неравные дисперсии ( s X 1 > 2 s X 2 или s X 2 > 2 s X 1 )

Этот критерий, также известный как t -критерий Уэлча , используется только в том случае, когда две генеральные дисперсии не предполагаются равными (два размера выборки могут быть равными, а могут и не быть равными) и, следовательно, должны оцениваться отдельно. Статистика t , позволяющая проверить, различны ли средние значения совокупности, рассчитывается как

где

Здесь s i 2несмещенная оценка дисперсии каждой из двух выборок с n i = количеством участников в группе i ( i = 1 или 2). В данном случае это не объединенная дисперсия. Для использования при проверке значимости распределение статистики теста аппроксимируется как обычное t -распределение Стьюдента со степенями свободы, рассчитанными по формуле

Это известно как уравнение Уэлча-Саттертуэйта . Истинное распределение тестовой статистики на самом деле зависит (слегка) от двух неизвестных генеральных дисперсий (см. проблему Беренса-Фишера ).

Точный метод для неравных дисперсий и размеров выборки

Тест [23] касается знаменитой проблемы Беренса-Фишера , т.е. сравнения разницы между средними значениями двух нормально распределенных популяций, когда дисперсии двух популяций не предполагаются равными, на основе двух независимых выборок.

Тест разработан как точный тест , который учитывает неравные размеры выборок и неравные дисперсии двух совокупностей. Это свойство по-прежнему сохраняется даже при очень малых и несбалансированных размерах выборок (например, ).

Статистику, позволяющую проверить, различны ли средние значения, можно рассчитать следующим образом:

Пусть и будут выборочными векторами iid ( ) из и отдельно.

Пусть - ортогональная матрица, все элементы первой строки которой равны , аналогично, пусть - первые n строк ортогональной матрицы (все элементы первой строки которой равны ).

Тогда – n-мерный нормальный случайный вектор.

Из приведенного выше распределения мы видим, что

Зависимый t -критерий для парных выборок

Этот тест используется, когда выборки являются зависимыми; то есть, когда имеется только один образец, который был протестирован дважды (повторяющиеся измерения), или когда есть два образца, которые были сопоставлены или «спарены». Это пример теста парных разностей . t - статистика рассчитывается как

где и – среднее и стандартное отклонение разностей между всеми парами. Пары представляют собой, например, баллы одного человека до и после теста, или пары людей, объединенных в значимые группы (например, взятые из одной семьи или возрастной группы: см. таблицу). Константа µ 0 равна нулю, если мы хотим проверить, существенно ли отличается среднее значение разницы. Используемая степень свободы равна n − 1 , где n представляет количество пар.

Работающие примеры

Пусть A 1 обозначает набор, полученный путем составления случайной выборки из шести измерений:

и пусть A 2 обозначает второй набор, полученный аналогично:

Это может быть, например, вес винтов, изготовленных на двух разных станках.

Мы проведем проверку нулевой гипотезы о том, что средние значения популяций, из которых были взяты две выборки, равны.

Разница между двумя выборочными средними значениями, каждое из которых обозначается X i , которая появляется в числителе для всех рассмотренных выше подходов к двухвыборочному тестированию, равна

Стандартные отклонения выборки для двух образцов составляют примерно 0,05 и 0,11 соответственно. Для таких небольших выборок проверка равенства между двумя генеральными дисперсиями не будет очень эффективной. Поскольку размеры выборки равны, две формы двухвыборочного t -теста в этом примере будут работать одинаково.

Неравные отклонения

Если следовать подходу для неравных дисперсий (обсужденному выше), результаты будут следующими:

и степени свободы

Статистика теста составляет примерно 1,959, что дает p -значение двустороннего теста 0,09077.

Равные отклонения

Если следовать подходу равных дисперсий (обсужденному выше), результаты будут следующими:

и степени свободы

Статистика теста примерно равна 1,959, что дает двустороннее значение p 0,07857.

Связанные статистические тесты

Альтернативы t -тесту для проблем с местоположением

T - тест обеспечивает точный тест на равенство средних значений двух нормальных популяций с неизвестными, но равными дисперсиями. ( Т -критерий Уэлча является почти точным тестом для случая, когда данные нормальны, но дисперсии могут различаться.) Для умеренно больших выборок и одностороннего критерия Ст - критерий относительно устойчив к умеренным нарушениям предположения о нормальности. [24] В достаточно больших выборках t-тест асимптотически приближается к z -тесту и становится устойчивым даже к большим отклонениям от нормальности. [16]

Если данные существенно ненормальны и размер выборки мал, t -критерий может дать ошибочные результаты. См. Тест местоположения для распределений смеси гауссовского масштаба, где представлена ​​некоторая теория, связанная с одним конкретным семейством ненормальных распределений.

Когда предположение о нормальности не выполняется, непараметрическая альтернатива t -критерию может иметь лучшую статистическую мощность . Однако, когда данные не являются нормальными и имеют разные дисперсии между группами, t-критерий может иметь лучший контроль ошибок типа 1 , чем некоторые непараметрические альтернативы. [25] Кроме того, непараметрические методы, такие как U-критерий Манна-Уитни , обсуждаемый ниже, обычно не проверяют разницу средних, поэтому их следует использовать с осторожностью, если разница средних представляет основной научный интерес. [16] Например, U-критерий Манна-Уитни сохранит ошибку типа 1 на желаемом уровне альфа, если обе группы имеют одинаковое распределение. Он также сможет обнаружить альтернативу, согласно которой группа B имеет то же распределение, что и A, но после некоторого сдвига на константу (в этом случае действительно будет разница в средних значениях двух групп). Однако могут быть случаи, когда группы A и B будут иметь разные распределения, но с одинаковыми средними значениями (например, два распределения, одно с положительной асимметрией, а другое с отрицательной асимметрией, но сдвинутыми так, чтобы иметь одинаковые средние значения). В таких случаях MW может иметь больше власти, чем альфа-уровень, при отклонении нулевой гипотезы, но приписывание интерпретации разницы в средних значениях такому результату было бы неверным.

При наличии выброса t -критерий не является устойчивым. Например, для двух независимых выборок, когда распределения данных асимметричны (то есть распределения перекошены ) или распределения имеют большие хвосты, тогда критерий суммы рангов Уилкоксона (также известный как U - критерий Манна-Уитни ) может иметь три в четыре раза выше мощности, чем t -тест. [24] [26] [27] Непараметрическим аналогом t -критерия парных выборок является знаково-ранговый критерий Уилкоксона для парных выборок. Обсуждение выбора между t -тестом и непараметрическими альтернативами см. в Lumley, et al. (2002). [16]

Односторонний дисперсионный анализ (ANOVA) обобщает двухвыборочный t -критерий, когда данные принадлежат более чем двум группам.

План, включающий как парные, так и независимые наблюдения.

Когда в двухпланах выборки присутствуют как парные наблюдения, так и независимые наблюдения, предполагая, что данные отсутствуют полностью случайным образом (MCAR), парные наблюдения или независимые наблюдения могут быть отброшены, чтобы продолжить стандартные тесты, описанные выше. В качестве альтернативы, используя все доступные данные, предполагая нормальность и MCAR, можно использовать обобщенный t-критерий частично перекрывающихся выборок. [28]

Многовариантное тестирование

Обобщение t- статистики Стьюдента, называемое t -квадратной статистикой Хотеллинга , позволяет проверять гипотезы по нескольким (часто коррелирующим) показателям в одной и той же выборке. Например, исследователь может отправить ряд субъектов на личностный тест, состоящий из нескольких шкал личности (например, Миннесотский многофазный личностный опросник ). Поскольку показатели этого типа обычно положительно коррелируют, нецелесообразно проводить отдельные одномерные t -тесты для проверки гипотез, так как они пренебрегают ковариацией между показателями и увеличивают вероятность ошибочного отклонения хотя бы одной гипотезы ( ошибка I типа ). В этом случае для проверки гипотез предпочтительнее использовать один многомерный тест. Одним из них является метод Фишера для объединения нескольких тестов с уменьшением альфа для положительной корреляции между тестами. Другой вариант : статистика Хотеллинга Т2 следует распределению Т2 . Однако на практике распределение используется редко, поскольку табличные значения для Т 2 найти трудно. Обычно вместо этого T 2 преобразуется в статистику F.

Для одновыборочного многомерного теста гипотеза состоит в том, что средний вектор ( µ ) равен заданному вектору ( µ 0 ). Тестовая статистика представляет собой t 2 Хотеллинга :

где n — размер выборки, x — вектор средних значений столбца, а Sвыборочная ковариационная матрица размера m × m .

Для многомерного теста с двумя выборками гипотеза состоит в том, что средние векторы ( 1 , 2 ) двух выборок равны. Тестовая статистика представляет собой двухвыборочный t 2 Хотеллинга :

Двухвыборочный t-критерий представляет собой частный случай простой линейной регрессии.

Двухвыборочный t-тест — это частный случай простой линейной регрессии , как показано в следующем примере.

В клиническом исследовании приняли участие 6 пациентов, принимавших препарат или плацебо. Три (3) пациента получают 0 единиц препарата (группа плацебо). Три (3) пациента получают 1 единицу препарата (группа активного лечения). В конце лечения исследователи измеряют изменение по сравнению с исходным уровнем количества слов, которые каждый пациент может вспомнить, с помощью теста памяти.

График рассеяния с шестью точками. Три точки слева расположены вертикально при дозе препарата 0 ЕД. А остальные три точки справа и располагаются вертикально при дозе препарата 1 ед.

Ниже представлена ​​таблица запоминаемости слов пациентами и значений доз препарата.

Данные и код приведены для анализа с использованием языка программирования R с функциями t.testи lmдля t-теста и линейной регрессии. Вот те же (вымышленные) данные, сгенерированные в R.

> word.recall.data = data.frame ( препарат.доза = c ( 0 , 0 , 0 , 1 , 1 , 1 ), word.recall = c ( 1 , 2 , 3 , 5 , 6 , 7 ))  

Выполните t-тест. Обратите внимание, что предположение о равной дисперсии var.equal=Tнеобходимо, чтобы сделать анализ точно эквивалентным простой линейной регрессии.

> с ( word.recall.data , t.test ( word.recall ~ Drug.dose , var.equal = T ))   

Запуск кода R дает следующие результаты.

  • Среднее слово «запоминание» в группе «0 препарат — доза» равно 2.
  • Среднее слово.вспоминание в группе 1 препарат.доза составляет 6.
  • Разница между группами лечения по среднему слову «припоминание» составляет 6 – 2 = 4.
  • Разница в запоминаемости слов между дозами препарата значительна (р=0,00805).

Выполните линейную регрессию тех же данных. Расчеты могут выполняться с использованием функции R lm()для линейной модели.

> word.recall.data.lm = lm ( word.recall ~ Drug.dose , data = word.recall.data ) > резюме ( word.recall.data.lm )     

Линейная регрессия предоставляет таблицу коэффициентов и значений p.

Таблица коэффициентов дает следующие результаты.

  • Оценочное значение 2 для перехвата представляет собой среднее значение отзыва слова, когда доза препарата равна 0.
  • Оценочное значение 4 для дозы лекарства указывает на то, что при изменении дозы лекарства на 1 единицу (от 0 до 1) происходит изменение среднего запоминания слова на 4 единицы (от 2 до 6). Это наклон линии, соединяющей два групповых средства.
  • Значение p, при котором наклон 4 отличается от 0, равно p = 0,00805.

Коэффициенты линейной регрессии определяют наклон и точку пересечения линии, соединяющей средние значения двух групп, как показано на графике. Пересечение — 2, наклон — 4.

Сравните результат линейной регрессии с результатом t-критерия.

  • Согласно t-критерию, разница между средними значениями группы составляет 6-2=4.
  • Судя по регрессии, наклон также равен 4, что указывает на то, что изменение дозы лекарства на 1 единицу (от 0 до 1) приводит к изменению среднего запоминания слов на 4 единицы (от 2 до 6).
  • Значение p-критерия Стьюдента для разницы средних значений и значение p-регрессии для наклона равны 0,00805. Методы дают одинаковые результаты.

Этот пример показывает, что для частного случая простой линейной регрессии, когда существует одна переменная x со значениями 0 и 1, t-критерий дает те же результаты, что и линейная регрессия. Связь также можно показать алгебраически.

Признание этой взаимосвязи между t-критерием и линейной регрессией облегчает использование множественной линейной регрессии и многофакторного дисперсионного анализа . Эти альтернативы t-тестам позволяют включать дополнительные объясняющие переменные , связанные с ответом. Включение таких дополнительных объясняющих переменных с использованием регрессии или ановы уменьшает необъяснимую дисперсию и обычно дает большую возможность обнаружить различия, чем двухвыборочные t-критерии.

Реализации программного обеспечения

Многие программы для работы с электронными таблицами и статистические пакеты, такие как QtiPlot , LibreOffice Calc , Microsoft Excel , SAS , SPSS , Stata , DAP , gretl , R , Python , PSPP , Wolfram Mathematica , MATLAB и Minitab , включают реализации t -теста Стьюдента .

Смотрите также

Рекомендации

  1. ^ Микробиом в здоровье и болезни. Академическая пресса. 2020-05-29. п. 397. ИСБН 978-0-12-820001-8.
  2. ^ Сабо, Иштван (2003). «Systeme aus einer endlichen Anzahl starrer Körper». Einführung in die Technische Mechanik (на немецком языке). Шпрингер Берлин Гейдельберг. стр. 196–199. дои : 10.1007/978-3-642-61925-0_16. ISBN 978-3-540-13293-6.
  3. ^ Шливич, Б. (октябрь 1937 г.). «Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica Superior und Damit in Zusammenhang stehende Fragen». Zeitschrift für Anatomie und Entwicklungsgeschichte (на немецком языке). 107 (6): 709–737. дои : 10.1007/bf02118337. ISSN  0340-2061. S2CID  27311567.
  4. ^ Гельмерт (1876). «Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers режиссер Beobachtungen gleicher Genauigkeit». Astronomische Nachrichten (на немецком языке). 88 (8–9): 113–131. Бибкод : 1876AN.....88..113H. дои : 10.1002/asna.18760880802.
  5. ^ Люрот, Дж. (1876). «Vergleichung von zwei Werthen des wahrscheinlichen Fehlers». Astronomische Nachrichten (на немецком языке). 87 (14): 209–220. Бибкод : 1876AN.....87..209L. дои : 10.1002/asna.18760871402.
  6. ^ Пфанзагль, Дж. (1996). «Исследования по истории вероятности и статистике XLIV. Предшественник t - распределения». Биометрика . 83 (4): 891–898. дои : 10.1093/biomet/83.4.891. МР  1766040.
  7. ^ Шейнин, Оскар (1995). «Работа Гельмерта по теории ошибок». Архив истории точных наук . 49 (1): 73–104. дои : 10.1007/BF00374700. ISSN  0003-9519. S2CID  121241599.
  8. ^ Пирсон, Карл (1895). «X. Вклад в математическую теорию эволюции. — II. Асимметрия в однородном материале». Философские труды Лондонского королевского общества А. 186 : 343–414. Бибкод : 1895RSPTA.186..343P. дои : 10.1098/rsta.1895.0010 .
  9. ^ аб Студент (1908). «Вероятная ошибка среднего» (PDF) . Биометрика . 6 (1): 1–25. дои : 10.1093/biomet/6.1.1. hdl :10338.dmlcz/143545 . Проверено 24 июля 2016 г.
  10. ^ "Т-таблица".
  11. ^ Вендл, Майкл С. (2016). «Псевдонимная слава». Наука . 351 (6280): 1406. doi :10.1126/science.351.6280.1406. ПМИД  27013722.
  12. ^ Уолпол, Рональд Э. (2006). Вероятность и статистика для инженеров и ученых . Майерс, Х. Рэймонд (7-е изд.). Нью-Дели: Пирсон. ISBN 81-7758-404-9. ОКЛК  818811849.
  13. ^ Раджу, Теннесси (2005). «Уильям Сили Госсет и Уильям А. Сильверман: два« студента науки »». Педиатрия . 116 (3): 732–735. дои :10.1542/пед.2005-1134. PMID  16140715. S2CID  32745754.
  14. ^ Додж, Ядола (2008). Краткая энциклопедия статистики. Springer Science & Business Media. стр. 234–235. ISBN 978-0-387-31742-7.
  15. ^ Фадем, Барбара (2008). Высокопроизводительная поведенческая наука . Высокодоходная серия. Хагерстаун, Мэриленд: Липпинкотт Уильямс и Уилкинс. ISBN 9781451130300.
  16. ^ abcd Ламли, Томас; Дир, Паула ; Эмерсон, Скотт; Чен, Лу (май 2002 г.). «Важность предположения о нормальности в больших наборах данных общественного здравоохранения». Ежегодный обзор общественного здравоохранения . 23 (1): 151–169. doi : 10.1146/annurev.publhealth.23.100901.140546 . ISSN  0163-7525. ПМИД  11910059.
  17. ^ Марковски, Кэрол А.; Марковски, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. дои : 10.2307/2684360. JSTOR  2684360.
  18. ^ Го, Бэйбэй; Юань, Ин (2017). «Сравнительный обзор методов сравнения средних с использованием частично парных данных». Статистические методы в медицинских исследованиях . 26 (3): 1323–1340. дои : 10.1177/0962280215577111. PMID  25834090. S2CID  46598415.
  19. ^ Бланд, Мартин (1995). Введение в медицинскую статистику. Издательство Оксфордского университета. п. 168. ИСБН 978-0-19-262428-4.
  20. ^ Райс, Джон А. (2006). Математическая статистика и анализ данных (3-е изд.). Даксбери Продвинутый.[ ISBN отсутствует ]
  21. ^ Вайсштейн, Эрик. «Т-распределение Стьюдента». mathworld.wolfram.com .
  22. ^ Дэвид, HA; Ганнинк, Джейсон Л. (1997). «Парный t- тест при искусственном спаривании». Американский статистик . 51 (1): 9–12. дои : 10.2307/2684684. JSTOR  2684684.
  23. ^ Ван, Чанг; Цзя, Цзиньчжу (2022). «Те-тест: новый неасимптотический Т-тест для задач Беренса-Фишера». arXiv : 2210.16473 [math.ST].
  24. ^ аб Савиловский, Шломо С.; Блэр, Р. Клиффорд (1992). «Более реалистичный взгляд на устойчивость и свойства ошибок типа II t - теста на отклонения от нормальности населения». Психологический вестник . 111 (2): 352–360. дои : 10.1037/0033-2909.111.2.352.
  25. ^ Циммерман, Дональд В. (январь 1998 г.). «Аннулирование параметрических и непараметрических статистических тестов одновременным нарушением двух предположений». Журнал экспериментального образования . 67 (1): 55–68. дои : 10.1080/00220979809598344. ISSN  0022-0973.
  26. ^ Блэр, Р. Клиффорд; Хиггинс, Джеймс Дж. (1980). «Сравнение мощности статистики ранговой суммы Уилкоксона со статистикой t Стьюдента при различных ненормальных распределениях». Журнал образовательной статистики . 5 (4): 309–335. дои : 10.2307/1164905. JSTOR  1164905.
  27. ^ Фэй, Майкл П.; Прощан, Майкл А. (2010). «Уилкоксона – Манна – Уитни или t-критерий? О предположениях для проверки гипотез и множественных интерпретациях правил принятия решений». Статистические опросы . 4 : 1–39. дои : 10.1214/09-SS051. ПМЦ 2857732 . ПМИД  20414472. 
  28. ^ Деррик, Б; Тохер, Д; Уайт, П. (2017). «Как сравнить средние значения двух выборок, включающих парные наблюдения и независимые наблюдения: компаньон Деррика, Расса, Тохера и Уайта (2017)» (PDF) . Количественные методы в психологии . 13 (2): 120–126. дои : 10.20982/tqmp.13.2.p120 .

Источники

дальнейшее чтение

  • Боно, К. Алан (1960). «Последствия нарушения предположений, лежащих в основе t- теста». Психологический вестник . 57 (1): 49–64. дои : 10.1037/h0041412. ПМИД  13802482.
  • Эджелл, Стивен Э.; Полдень, Шейла М. (1984). «Влияние нарушения нормальности на t- критерий коэффициента корреляции». Психологический вестник . 95 (3): 576–583. дои : 10.1037/0033-2909.95.3.576.

Внешние ссылки

  • «Студенческий тест». Энциклопедия математики . ЭМС Пресс . 2001 [1994].
  • Трохим, Уильям М.К. «Т-тест», База знаний по методам исследования , conjoint.ly
  • Лекция по эконометрике (тема: проверка гипотез) на YouTube Марка Тома