Статистическая мера расхождения между данными и оценочной моделью.
В статистике остаточная сумма квадратов ( RSS ), также известная как сумма квадратов остатков ( SSR ) или сумма квадратов оценок ошибок ( SSE ), представляет собой сумму квадратов остатков (отклонений, предсказанных на основе фактических эмпирических значений данных). Это мера расхождения между данными и моделью оценки, такой как линейная регрессия . Малая RSS указывает на точное соответствие модели данным. Она используется в качестве критерия оптимальности при выборе параметров и модели .
В общем случае общая сумма квадратов = объясненная сумма квадратов + остаточная сумма квадратов. Для доказательства этого в случае многомерного обычного метода наименьших квадратов (OLS) см. разделение в общей модели OLS .
Одна объясняющая переменная
В модели с одной объясняющей переменной RSS определяется по формуле: [1]
где y i - это i- е значение переменной, которая должна быть предсказана, x i - это i- е значение объясняющей переменной, а - предсказанное значение y i (также называемое ). В стандартной линейной простой регрессионной модели , , где и - коэффициенты , y и x - регрессанд и регрессор , соответственно, а ε - ошибка . Сумма квадратов остатков - это сумма квадратов ; то есть
где — расчетное значение постоянного члена , а — расчетное значение коэффициента наклона .
Матричное выражение для остаточной суммы квадратов МНК
Общая регрессионная модель с n наблюдениями и k поясняющими факторами, первый из которых представляет собой постоянный единичный вектор, коэффициент которого является свободным членом регрессии, имеет вид
где y — вектор n × 1 зависимых переменных наблюдений, каждый столбец матрицы X размером n × k — вектор наблюдений одного из k объясняющих факторов, — вектор k × 1 истинных коэффициентов, а e — вектор n × 1 истинных базовых ошибок. Обычная оценка наименьших квадратов для — это
Остаточный вектор ; таким образом, остаточная сумма квадратов равна:
- ,
(эквивалентно квадрату нормы остатков ). Полностью:
- ,
где H — матрица шляпы , или матрица проекции в линейной регрессии.
Связь с корреляцией Пирсона «продукт-момент»
Линия регрессии наименьших квадратов определяется как
- ,
где и , где и
Поэтому,
где
Корреляция Пирсона -момента определяется следующим образом:
Смотрите также
Ссылки
- ^ Архидьякон, Томас Дж. (1994). Корреляционный и регрессионный анализ: руководство историка . Издательство Висконсинского университета. С. 161–162. ISBN 0-299-13650-7. OCLC 27266095.
- Дрейпер, Н. Р.; Смит, Х. (1998). Прикладной регрессионный анализ (3-е изд.). John Wiley. ISBN 0-471-17082-8.