Тип количественного статистического анализа, в котором анализируются ровно две переменные с целью определения эмпирической связи между ними. Контрастный многомерный анализ .
В экспериментальном дизайне, организация экспериментальных единиц в группы («блоки»), которые похожи друг на друга. Блокировка часто используется для управления проблемой псевдорепликации.
Статистическое исследование, целью которого является измерение влияния некоторой переменной на результат другой переменной. Например, причинное исследование может задавать вопрос: «Как будет ощущаться моя головная боль, если я приму аспирин, по сравнению с тем, если я не приму аспирин?» Причинные исследования могут быть либо экспериментальными, либо наблюдательными. [1]
Изучение статистических методов, которые реализуются с помощью вычислительных методов на стыке статистики и информатики .
сопутствующие
В статистическом исследовании любые переменные, значения которых не зависят от экспериментального лечения, такие как возраст, пол и уровень холестерина субъекта до начала экспериментальной диеты. [1]
При наличии двух совместно распределенных случайных величин X и Y условное распределение вероятностей Y при условии X (пишется « Y | X ») — это распределение вероятностей Y , когда известно, что X имеет определенное значение.
Вероятность некоторого события A, предполагающая наступление события B. В математической нотации условная вероятность записывается как P( A | B ) и читается как «вероятность A при условии B ».
В выводной статистике диапазон вероятных значений для некоторого неизвестного параметра, такого как среднее значение популяции, определяемый как интервал с нижней границей и верхней границей. [2] Точные значения этих границ вычисляются на основе заранее определенного уровня достоверности, выбранного исследователем. Уровень достоверности представляет собой частоту интервалов, которые в долгосрочной перспективе охватывают истинное значение неизвестного параметра; т. е. 95% доверительных интервалов, вычисленных на уровне достоверности 95%, содержат истинное значение, и то же самое касается других уровней достоверности. Например, основываясь на исследовании привычек сна среди случайной выборки из 100 человек, исследователь может оценить на уровне достоверности 95%, что вся популяция спит где-то между 5 и 9 часами в сутки. Существует 95% вероятность того, что истинное среднее значение популяции попадет в этот интервал, потому что 95% случайных выборок, взятых из этой же популяции, дадут 95% доверительные интервалы, содержащие истинное среднее.
уровень уверенности
Также коэффициент достоверности .
Число, указывающее вероятность того, что доверительный интервал (диапазон) охватывает истинное среднее значение популяции. Например, доверительный интервал с уровнем достоверности 95% имеет 95%-ную вероятность охвата среднего значения популяции. Технически это означает, что если бы эксперимент повторялся много раз, 95% доверительных интервалов, вычисленных на этом уровне, содержали бы истинное среднее значение популяции. [2]
Переменная, которая влияет как на зависимую, так и на независимую переменную, вызывая ложную связь. Существование скрытых смешивающих переменных является важным количественным объяснением того, почему корреляция не подразумевает причинно-следственную связь: если изменения двух переменных кажутся коррелированными, рискованно предполагать, что одно изменение вызывает другое, поскольку возможно, что один или несколько неопознанных смешивающих факторов на самом деле вызвали изменения обеих переменных. Классическим примером является корреляция между увеличением потребления мороженого и ростом преступности летом. Нерационально предполагать, что употребление большего количества мороженого заставляет людей совершать больше преступлений, или наоборот; более вероятно, что одна или несколько дополнительных переменных, например, более теплая погода, одновременно увеличивают и потребление мороженого, и преступность. В этом примере более теплая погода является смешивающим фактором.
Числовая мера силы линейной связи между двумя случайными величинами (ее можно использовать для количественной оценки, например, того, как размер обуви и рост коррелируют в популяции). Примером является коэффициент корреляции Пирсона , который находится путем деления ковариации двух переменных на произведение их стандартных отклонений. Независимые переменные, по определению, имеют корреляцию 0. Корреляция популяции часто обозначается символом , а выборочная корреляция — .</ref>
Даны две случайные величины X и Y с ожидаемыми значениями и , ожидаемое значение случайной величины , записанное в статистической нотации как . Ковариация используется для измерения корреляции; ее можно интерпретировать как степень, в которой две переменные изменяются одновременно друг с другом или «ковариируют».
Типизированное измерение — это может быть логическое значение, действительное число, вектор (в этом случае он также называется вектором данных ) и т. д.
Событие, которое содержит только один результат в пространстве выборки; в наборе возможностей возможность, которая может произойти ровно одним способом. Например, при вытягивании карты из стандартной колоды игральных карт «вытягивание пикового валета» является элементарным событием (потому что во всей колоде есть только один пиковый валет), тогда как «вытягивание короля или туза» — нет (потому что в колоде есть объединенные четыре короля и четыре туза).
Раздел статистики, занимающийся оценкой значений параметров на основе измеренных эмпирических данных со случайной составляющей. Параметры описывают базовую физическую обстановку таким образом, что их значения влияют на распределение измеренных данных; оценщик пытается использовать измерения для аппроксимации неизвестных параметров.
Функция известных данных, которая используется для оценки неизвестного параметра; оценка — это результат фактического применения функции к определенному набору данных. Например, в качестве оценщика может использоваться среднее значение.
Также ожидание , математическое ожидание , первый момент или просто среднее значение .
Сумма вероятностей каждого возможного результата эксперимента, умноженная на их соответствующую выплату или «значение». Таким образом, она представляет собой среднюю сумму, которую «ожидают» выиграть на ставку, если ставки с одинаковыми коэффициентами повторяются много раз. Например, ожидаемое значение броска честной шестигранной игральной кости составляет 3,5. Концепция, интуитивно, является обобщением средневзвешенного значения всех возможных результатов конкретной процедуры или эксперимента и может рассматриваться как среднее арифметическое большого числа независимых реализаций эксперимента. Ожидаемое значение случайной величины X обычно записывается как E(X) для оператора ожидания и ( mu ) для параметра.
Подмножество выборочного пространства процедуры или эксперимента (т. е. возможный результат), которому может быть назначена вероятность. Например, при бросании игральной кости «выпадение тройки» является событием (с вероятностью 1 ⁄ 6 , если игральная кость честная), как и «выпадение пятерки или шестерки» (с вероятностью 1 ⁄ 3 ).
Приблизительное графическое представление распределения числовых данных. Гистограмма отображает это распределение путем деления всего диапазона значений на ряд последовательных неперекрывающихся интервалов, а затем подсчета того, сколько экземпляров набора данных попадают в каждый интервал.
Мера статистической дисперсии или разброса набора данных, определяемая как разница между 25-м и 75-м процентилями данных. Для расчета IQR набор данных делится на четыре упорядоченных по рангу четных части или квартили, границы между которыми, на 25-м, 50-м и 75-м процентилях, обозначаются как 1 , 2 и 3 соответственно; IQR = 3 1 .
Мера «хвоста» распределения вероятностей действительной случайной величины. Существуют различные способы количественной оценки, расчета и интерпретации эксцесса, но общепринятая интерпретация заключается в том, что эксцесс представляет собой степень, в которой форма распределения зависит от нечастых экстремальных наблюдений (выбросов); в этом случае более высокий эксцесс означает, что большая часть дисперсии обусловлена нечастыми экстремальными отклонениями, в отличие от частых отклонений умеренного размера.
Теорема, согласно которой среднее значение результатов, полученных при выполнении одного и того же эксперимента большое количество раз, должно быть близко к ожидаемому значению эксперимента и имеет тенденцию становиться ближе к ожидаемому значению по мере проведения большего количества испытаний. Закон предполагает, что для того, чтобы результаты любого эксперимента считались надежными, необходимо достаточно большое количество испытаний, и, следовательно, выполнение лишь небольшого количества испытаний может привести к неполной или вводящей в заблуждение интерпретации результатов эксперимента.
Условная функция вероятности, рассматриваемая как функция ее второго аргумента с фиксированным первым аргументом. Например, представьте, что вы вытаскиваете пронумерованный шар с номером k из мешка с n шарами, пронумерованными от 1 до n ; функция правдоподобия для случайной величины N может быть описана как вероятность вытаскивания k при условии, что имеется n шаров: вероятность будет 1/ n для n, больших или равных k , и 0 для n, меньших k . В отличие от функции распределения вероятностей, эта функция правдоподобия не будет давать в сумме 1 на выборочном пространстве.
При наличии двух совместно распределенных случайных величин X и Y предельное распределение X — это просто распределение вероятностей X, когда информация о Y игнорируется.
Вероятность данного события, игнорируя любую информацию о других событиях. Предельная вероятность A обозначается P ( A ). Противопоставляется условной вероятности .
Серия математических средних значений или средних значений различных подмножеств более крупного набора данных, обычно вычисляемых для понимания тенденций в наборе данных с течением времени.
Говорят, что набор событий взаимно независим , если для любого подмножества набора совместная вероятность всех событий равна произведению совместных вероятностей отдельных событий. Подумайте о результате серии подбрасываний монеты. Это более сильное условие, чем попарная независимость.
Утверждение, проверяемое в тесте статистической значимости; обычно утверждение «нет эффекта» или «нет разницы». [3] Например, в тесте на то, влияет ли свет на сон, нулевая гипотеза будет заключаться в том, что свет не влияет на сон (т. е. режим сна одинаков независимо от условий освещения). Нулевая гипотеза является выражением ожидания того, что зависимая переменная не изменится существенно при изменении независимой переменной; статистическая значимость измеряется и сообщается в соответствии со степенью, в которой это ожидание выполняется. Противопоставьте альтернативную гипотезу .
Любая измеренная величина статистической совокупности, которая суммирует или описывает аспект совокупности, например, среднее значение или стандартное отклонение; часто величина, которая должна быть оценена на основе соответствующей величины, рассчитанной путем взятия случайных выборок из совокупности. Может быть параметром совокупности, параметром распределения или ненаблюдаемым параметром.
Вероятность в непрерывном распределении вероятностей. Например, вы не можете сказать, что вероятность того, что рост человека составит шесть футов, составляет 20%, но вы можете сказать, что у него есть 20% шансов быть ростом от пяти до шести футов. Плотность вероятности задается функцией плотности вероятности. Сравните массу вероятности .
Конкретная точка или значение, в которой диапазон распределения вероятностей делится на непрерывные интервалы с равными вероятностями, или в которой наблюдения в выборке делятся таким же образом. Количество групп, на которые делится диапазон, всегда на единицу больше количества квантилей, разделяющих их. Обычно используемые квантили включают квартили (которые делят диапазон на четыре группы), децили (десять групп) и процентили (сто групп). Сами группы называются половинами, третями, четвертями и т. д., хотя термины для квантилей иногда используются для обозначения групп, а не точек отсечения.
Тип квантиля, который делит диапазон точек данных на четыре группы, называемые четвертями , равного размера. Для любого набора данных, разделенного на квартиль, существует ровно три квартиля или точки отсечения, которые создают четыре группы. Первый квартиль ( 1 ) определяется как средняя точка данных или значение, которое находится на полпути между наименьшим значением (минимумом) и медианой набора данных, так что 25 процентов данных лежат ниже этого квартиля. Второй квартиль ( 2 ) — это сама медиана, при этом 50 процентов данных лежат ниже этой точки. Третий квартиль ( 3 ) определяется как среднее значение на полпути между медианой и наибольшим значением (максимумом) набора данных, так что 75 процентов данных лежат ниже этого квартиля. Поскольку данные должны быть упорядочены от наименьшего к наибольшему для их вычисления, квартили являются типом порядковой статистики.
Измеримая функция на вероятностном пространстве, часто имеющая вещественные значения. Функция распределения случайной величины дает вероятность различных значений переменной. Среднее значение и дисперсия случайной величины также могут быть выведены. См. также дискретная случайная величина и непрерывная случайная величина.
Любая переменная, значение которой, как ожидается, будет затронуто экспериментальным лечением или изменениями в одной или нескольких других переменных; например, уровень холестерина после соблюдения определенной диеты в течение шести месяцев. Переменные отклика — это те, которые изменяются или реагируют на некоторое изучаемое явление. Этот термин часто используется взаимозаменяемо с зависимой переменной. [1]
Среднее арифметическое выборки значений, взятых из совокупности, обычно обозначается как . Примером является средний тестовый балл подгруппы из 10 студентов из класса. Среднее выборки используется в качестве оценки среднего значения совокупности, которое в этом примере будет средним тестовым баллом всех студентов в классе.
Мера асимметрии распределения вероятностей действительной случайной величины относительно ее среднего значения. Грубо говоря, распределение имеет положительный перекос (правый перекос), если верхний хвост длиннее, и отрицательный перекос (левый перекос), если нижний хвост длиннее. Идеально симметричные распределения всегда имеют нулевую перекос, хотя нулевой перекос не обязательно подразумевает симметричное распределение.
Два события независимы, если результат одного из них не влияет на результат другого (например, выпадение 1 при одном броске кубика не влияет на вероятность выпадения 1 при втором броске). Аналогично, когда мы утверждаем, что две случайные величины независимы, мы интуитивно подразумеваем, что знание чего-либо о значении одной из них не дает никакой информации о значении другой.
Вывод о популяции, основанный на случайной выборке, взятой из этой популяции, или, в более общем плане, о случайном процессе, основанный на наблюдаемом поведении популяции в течение конечного периода времени.
Набор сущностей, о которых должны быть сделаны статистические выводы, часто на основе случайной выборки. Можно также говорить о совокупности измерений или значений.
Стандарт для структурирования данных таким образом, что «каждая переменная является столбцом, каждое наблюдение является строкой, а каждый тип единицы наблюдения является таблицей». Это эквивалентно третьей нормальной форме Кодда . [4]
Переменные в статистическом исследовании, которые концептуально манипулируются. Например, в исследовании здоровья следование определенной диете является лечением, а возраст — нет. [1]
Может относиться к каждому отдельному повторению, когда речь идет об эксперименте, состоящем из любого фиксированного числа подбрасываний монеты. Например, можно представить себе эксперимент, состоящий из любого числа подбрасываний от одного до n , скажем, 17. В этом случае одно подбрасывание можно назвать испытанием, чтобы избежать путаницы, поскольку весь эксперимент состоит из 17 подбрасываний.
В статистическом исследовании — объекты, которым назначаются методы лечения. Например, в исследовании, изучающем эффекты курения сигарет, единицами будут люди. [1]
Мера статистической дисперсии случайной величины, указывающая, насколько далеки от ожидаемого значения ее значения, как правило. Дисперсия случайной величины X обычно обозначается как , , или просто
^ abcde Рейтер, Джером (24 января 2000 г.). «Использование статистики для определения причинно-следственных связей». American Mathematical Monthly . 107 (1): 24–32. doi :10.2307/2589374. JSTOR 2589374.
^ ab Пав Калиновски. Понимание доверительных интервалов (ДИ) и оценки размера эффекта. Association for Psychological Science Observer 10 апреля 2010 г. http://www.psychologicalscience.org/index.php/publications/observer/2010/april-10/understanding-confidence-intervals-cis-and-effect-size-estimation.html
^ Мур, Дэвид; МакКейб, Джордж (2003). Введение в практику статистики (4-е изд.). Нью-Йорк: WH Freeman and Co. стр. 438. ISBN9780716796572.
^ Уикхэм, Хэдли (2014). «Tidy Data» (PDF) . Журнал статистического программного обеспечения . 59 (10). doi :10.18637/jss.v059.i10.
Внешние ссылки
"Глоссарий терминологии DOE", NIST/SEMATECH e-Handbook of Statistical Methods , NIST , получено 28 февраля 2009 г.
Статистический глоссарий, statistics.com , получено 28 февраля 2009 г.
Вероятность и статистика на страницах самых ранних применений (Университет Саутгемптона)