stringtranslate.com

Сокращенная статистика хи-квадрат

В статистике сокращенная статистика хи-квадрат широко используется в тестах на соответствие . Она также известна как среднеквадратичное взвешенное отклонение ( MSWD ) в изотопном датировании [1] и дисперсия удельного веса в контексте взвешенных наименьших квадратов . [2] [3]

Его квадратный корень называется стандартной ошибкой регрессии , [4] стандартной ошибкой регрессии , [5] [6] или стандартной ошибкой уравнения [7] (см. Метод наименьших квадратов § Приведенный хи-квадрат )

Определение

Он определяется как хи-квадрат на степень свободы : [8] [9] [10] [11] : 85  [12] [13] [14] [15] где хи-квадрат представляет собой взвешенную сумму квадратов отклонений : с входными данными: дисперсия , наблюдения O и вычисленные данные C. [ 8] Степень свободы, , равна числу наблюдений n минус число подобранных параметров m .

В методе взвешенных наименьших квадратов определение часто записывается в матричной записи как где r — вектор остатков, а W — весовая матрица, обратная входной (диагональной) ковариационной матрице наблюдений. Если W недиагональна, то применяется обобщенный метод наименьших квадратов .

В обычном методе наименьших квадратов определение упрощается до: где числитель — остаточная сумма квадратов (RSS).

Если подгонка представляет собой просто обычное среднее значение, то равно стандартному отклонению выборки .

Обсуждение

Как правило, когда дисперсия ошибки измерения известна априори , a указывает на плохое соответствие модели. A указывает на то, что соответствие не полностью охватило данные (или что дисперсия ошибки была недооценена). В принципе, значение около указывает на то, что степень соответствия между наблюдениями и оценками соответствует дисперсии ошибки. A указывает на то, что модель « переобучает » данные: либо модель неправильно подгоняет шум, либо дисперсия ошибки была переоценена. [11] :  89

Когда дисперсия ошибки измерения известна лишь частично, приведенный хи-квадрат может служить в качестве поправки, оцененной апостериорно .

Приложения

Геохронология

В геохронологии MSWD является мерой качества соответствия, которая учитывает относительную важность как внутренней, так и внешней воспроизводимости, и наиболее часто используется в изотопном датировании. [16] [17] [1] [18] [19] [20]

В общем случае, когда:

MSWD = 1, если данные о возрасте соответствуют одномерному нормальному распределению в пространстве t (для среднего арифметического возраста) или log( t ) (для среднего геометрического возраста), или если данные о составе соответствуют двумерному нормальному распределению в пространстве [log( U / He ),log( Th /He)] (для центрального возраста).

MSWD < 1, если наблюдаемый разброс меньше, чем предсказанный аналитическими неопределенностями. В этом случае говорят, что данные «недорассеяны», что указывает на то, что аналитические неопределенности были переоценены.

MSWD > 1, если наблюдаемый разброс превышает предсказанный аналитическими неопределенностями. В этом случае данные считаются «чрезмерно рассеянными». Такая ситуация является правилом, а не исключением в геохронологии (U-Th)/He, что указывает на неполное понимание изотопной системы. Было предложено несколько причин для объяснения чрезмерной дисперсии данных (U-Th)/He, включая неравномерно распределенные распределения U-Th и радиационные повреждения.

Часто геохронолог определяет ряд измерений возраста на одном образце, причем измеренное значение имеет вес и связанную с ним ошибку для каждого определения возраста. Что касается взвешивания, можно либо взвесить все измеренные возрасты одинаково, либо взвесить их по доле образца, которую они представляют. Например, если две трети образца использовались для первого измерения и одна треть для второго и последнего измерения, то можно взвесить первое измерение вдвое больше, чем второе.

Среднее арифметическое значений возраста составляет , однако это значение может ввести в заблуждение, если только каждое определение возраста не имеет одинаковой значимости.

Если можно предположить, что каждое измеренное значение имеет одинаковый вес или значимость, то смещенные и несмещенные (или « выборочные » и «совокупные» соответственно) оценки дисперсии вычисляются следующим образом:

Стандартное отклонение — это квадратный корень из дисперсии.

Если индивидуальные определения возраста не имеют одинаковой значимости, лучше использовать средневзвешенное значение для получения «среднего» возраста следующим образом:

Можно показать, что смещенная взвешенная оценка дисперсии может быть вычислена как

Несмещенную взвешенную оценку дисперсии выборки можно вычислить следующим образом: Опять же, соответствующее стандартное отклонение представляет собой квадратный корень дисперсии.

Несмещенную взвешенную оценку дисперсии выборки можно также вычислить «на лету» следующим образом:

Затем можно вычислить невзвешенный средний квадрат взвешенных отклонений (невзвешенный MSWD) следующим образом:

По аналогии взвешенный средний квадрат взвешенных отклонений (взвешенный СКО) можно вычислить следующим образом:

Анализ Раша

В анализе данных, основанном на модели Раша , приведенная статистика хи-квадрат называется среднеквадратичной статистикой комплектации, а приведенная статистика хи-квадрат с весовыми коэффициентами, взвешенная по информации, называется среднеквадратичной статистикой неподходящего набора. [21]

Ссылки

  1. ^ ab Вендт, И. и Карл, К., 1991, Статистическое распределение среднеквадратичного взвешенного отклонения, Химическая геология, 275–285.
  2. ^ Стрэнг, Гилберт; Борре, Кае (1997). Линейная алгебра, геодезия и GPS. Wellesley-Cambridge Press. стр. 301. ISBN 9780961408862.
  3. ^ Кох, Карл-Рудольф (2013). Оценка параметров и проверка гипотез в линейных моделях. Springer Berlin Heidelberg. Раздел 3.2.5. ISBN 9783662039762.
  4. ^ Джулиан Фаравей (2000), Практическая регрессия и дисперсионный анализ с использованием R
  5. ^ Кенни, Дж.; Киппинг, Э.С. (1963). Математика статистики . ван Ностранд. стр. 187.
  6. ^ Цвиллингер, Д. (1995). Стандартные математические таблицы и формулы . Chapman&Hall/CRC. стр. 626. ISBN 0-8493-2479-3.
  7. ^ Хаяси, Фумио (2000). Эконометрика . Princeton University Press. ISBN 0-691-01018-8.
  8. ^ ab Laub, Charlie; Kuhl, Tonya L. (nd), Насколько плохое является хорошим? Критический взгляд на подгонку моделей отражательной способности с использованием приведенной статистики хи-квадрат (PDF) , Калифорнийский университет в Дэвисе, архивировано из оригинала (PDF) 6 октября 2016 г. , извлечено 30 мая 2015 г.
  9. ^ Тейлор, Джон Роберт (1997), Введение в анализ ошибок , University Science Books, стр. 268
  10. ^ Киркман, TW (nd), Хи-квадратная кривая , получено 30 мая 2015 г.
  11. ^ ab Бевингтон, Филип Р. (1969), Обработка данных и анализ ошибок в физических науках , Нью-Йорк: McGraw-Hill
  12. ^ Измерения и их неопределенности: практическое руководство по современному анализу ошибок, Ифан Хьюз, Томас Хазе [1]
  13. ^ Работа с неопределенностями: руководство по анализу ошибок, Манфред Дросг [2]
  14. ^ Практическая статистика для астрономов, Дж. В. Уолл, К. Р. Дженкинс
  15. ^ Вычислительные методы в физике и технике, Сэмюэл Шоу Минг Вонг [3]
  16. ^ Дикин, А. П. 1995. Геология радиогенных изотопов. Cambridge University Press, Кембридж, Великобритания, 1995, ISBN 0-521-43151-4 , ISBN 0-521-59891-5  
  17. ^ Макдугалл, И. и Харрисон, Т. М. 1988. Геохронология и термохронология по методу 40 Ar/ 39 Ar. Oxford University Press.
  18. ^ Лэнс П. Блэк, Сандра Л. Камо, Шарлотта М. Аллен, Джон Н. Алейников, Дональд В. Дэвис, Рассел Дж. Корш, Крис Фудулис 2003. TEMORA 1: новый стандарт циркона для фанерозойской U-Pb геохронологии. Химическая геология 200, 155–170.
  19. ^ MJ Streule, RJ Phillips, MP Searle, DJ Waters и MSA Horstwood 2009. Эволюция и хронология метаморфического комплекса Пангонг, прилегающего к моделированию и U-Pb геохронологии Каракорумского разлома, Ладакх: ограничения из термобарометрии, метаморфического моделирования и U-Pb геохронологии. Журнал Геологического общества 166, 919–932 doi :10.1144/0016-76492008-117
  20. ^ Роджер Пауэлл, Джанет Хергт , Джон Вудхед 2002. Улучшение изохронных расчетов с помощью надежной статистики и бутстрапа. Химическая геология 185, 191–204.
  21. ^ Linacre, JM (2002). «Что означают Infit и Outfit, среднеквадратичное и стандартизированное?». Rasch Measurement Transactions . 16 (2): 878.