stringtranslate.com

Матрица проектирования

В статистике и, в частности, в регрессионном анализе , матрица плана , также известная как матрица модели или матрица регрессора и часто обозначаемая X , представляет собой матрицу значений независимых переменных набора объектов. Каждая строка представляет отдельный объект, а последующие столбцы соответствуют переменным и их конкретным значениям для этого объекта. Матрица плана используется в некоторых статистических моделях , например, в общей линейной модели . [1] [2] [3] Он может содержать индикаторные переменные (единицы и нули), которые указывают на членство в группе в ANOVA , или может содержать значения непрерывных переменных .

Матрица плана содержит данные о независимых переменных (также называемых объясняющими переменными) в статистической модели, которая предназначена для объяснения наблюдаемых данных о переменной отклика (часто называемой зависимой переменной ). Теория, относящаяся к таким моделям, использует матрицу плана в качестве входных данных для некоторой линейной алгебры  : см., например, линейную регрессию . Примечательной особенностью концепции матрицы плана является то, что она способна представлять ряд различных экспериментальных планов и статистических моделей, например, ANOVA , ANCOVA и линейную регрессию. [ нужна цитата ]

Определение

Матрица проекта определяется как матрица, такая что ( j столбец i строки ) представляет значение j переменной, связанной с i- м объектом.

Модель регрессии может быть представлена ​​посредством умножения матриц как

где X — матрица плана, — вектор коэффициентов модели (по одному для каждой переменной), — вектор случайных ошибок со средним нулевым значением, а y — вектор прогнозируемых выходных данных для каждого объекта.

Размер

Матрица плана имеет размерность n - p , где n — количество наблюдаемых выборок, а p — количество переменных ( признаков ), измеренных во всех выборках. [4] [5]

В этом представлении разные строки обычно представляют разные повторения эксперимента, а столбцы представляют разные типы данных (скажем, результаты определенных зондов). Например, предположим, что проводится эксперимент: 10 человек вытаскивают с улицы и задают 4 вопроса. Матрица данных M будет матрицей 10×4 (то есть 10 строк и 4 столбца). Данные в строке i и столбце j этой матрицы будут ответом i- го человека на j- й вопрос.

Примеры

Среднее арифметическое

Матрица расчета для среднего арифметического представляет собой вектор- столбец из единиц .

Простая линейная регрессия

В этом разделе приводится пример простой линейной регрессии , то есть регрессии только с одной объясняющей переменной, с семью наблюдениями. Семь точек данных: { y i , x i } для i  = 1, 2, …, 7. Простая модель линейной регрессии:

где - точка пересечения по оси Y , а - наклон линии регрессии. Эту модель можно представить в матричной форме как

где первый столбец из единиц в матрице плана позволяет оценить y -пересечение, а второй столбец содержит значения x , связанные с соответствующими значениями y . Матрица, столбцы которой в этом примере имеют значения 1 и x, является матрицей проекта.

Множественная регрессия

Этот раздел содержит пример множественной регрессии с двумя ковариатами (независимыми переменными): w и x . Снова предположим, что данные состоят из семи наблюдений и что для каждого наблюдаемого прогнозируемого значения ( ) также наблюдаются значения w i и xi двух ковариат. Модель, которую следует рассмотреть,

Эту модель можно записать в матричных терминах как

Здесь матрица 7×3 справа — это матрица проекта.

Односторонний дисперсионный анализ (ячейка означает модель)

В этом разделе содержится пример однофакторного дисперсионного анализа ( ANOVA ) с тремя группами и семью наблюдениями. В данный набор данных входят первые три наблюдения, принадлежащие первой группе, следующие два наблюдения, принадлежащие второй группе, и последние два наблюдения, принадлежащие третьей группе. Если подходящая модель представляет собой просто среднее значение каждой группы, то модель

который можно написать

В этой модели представляет собой среднее значение группы.

Односторонний дисперсионный анализ (смещение от контрольной группы)

Модель ANOVA можно эквивалентным образом записать так, что каждый параметр группы представляет собой смещение от некоторой общей ссылки. Обычно за эту точку отсчета принимается одна из рассматриваемых групп. Это имеет смысл в контексте сравнения нескольких групп лечения с контрольной группой, причем контрольная группа считается «эталонной». В этом примере группа 1 была выбрана в качестве контрольной группы. Таким образом, подходящей моделью является

с ограничением, равным нулю.

В этой модели это среднее значение референтной группы и разница от группы к референтной группе. не включается в матрицу, поскольку его отличие от референтной группы (самой по себе) обязательно равно нулю.

Смотрите также

Рекомендации

  1. ^ Эверитт, Б.С. (2002). Кембриджский статистический словарь (2-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-81099-Х.
  2. ^ Коробка, GEP ; Тяо, GC (1992) [1973]. Байесовский вывод в статистическом анализе . Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-57428-7.(раздел 8.1.1)
  3. ^ Тимм, Нил Х. (2007). Прикладной многомерный анализ. Springer Science & Business Media. п. 107. ИСБН 9780387227719.
  4. ^ Джонсон, Ричард А; Вичерн, Дин В. (2001). Прикладной многомерный статистический анализ . Пирсон. стр. 111–112. ISBN 0131877151.
  5. ^ «Основные концепции многомерной статистики, стр.2» (PDF) . Институт САС.

дальнейшее чтение