Переменная считается зависимой, если она зависит от независимой переменной . Зависимые переменные изучаются в предположении или требовании, что они зависят, по некоторому закону или правилу (например, по математической функции ), от значений других переменных. Независимые переменные, в свою очередь, не рассматриваются как зависящие от какой-либо другой переменной в рамках рассматриваемого эксперимента. [a] В этом смысле некоторые общие независимые переменные - это время , пространство , плотность , масса , скорость потока жидкости , [1] [2] и предыдущие значения некоторой наблюдаемой величины интереса (например, размер человеческой популяции) для прогнозирования будущих значений (зависимая переменная). [3]
Из этих двух всегда изучается вариация зависимой переменной путем изменения входных данных, также известных как регрессоры в статистическом контексте. В эксперименте любая переменная, которой можно приписать значение без приписывания значения какой-либо другой переменной, называется независимой переменной. Модели и эксперименты проверяют эффекты, которые независимые переменные оказывают на зависимые переменные. Иногда, даже если их влияние не представляет прямого интереса, независимые переменные могут быть включены по другим причинам, например, для учета их потенциального искажающего эффекта.
В математике функция — это правило для получения входных данных (в простейшем случае числа или набора чисел) [5] и предоставления выходных данных (которые также могут быть числом). [5] Символ, обозначающий произвольные входные данные, называется независимой переменной , а символ, обозначающий произвольные выходные данные, называется зависимой переменной . [6] Наиболее распространенным символом для входных данных является x , а наиболее распространенным символом для выходных данных — y ; сама функция обычно записывается как y = f ( x ) . [6] [7]
Возможно иметь несколько независимых переменных или несколько зависимых переменных. Например, в многомерном исчислении часто встречаются функции вида z = f ( x , y ) , где z — зависимая переменная, а x и y — независимые переменные. [8] Функции с несколькими выходами часто называют векторнозначными функциями .
В математическом моделировании изучается взаимосвязь между набором зависимых переменных и набором независимых переменных. [ необходима ссылка ]
В простой стохастической линейной модели y i = a + b x i + e i член y i является i- м значением зависимой переменной, а x i является i- м значением независимой переменной. Член e i известен как «ошибка» и содержит изменчивость зависимой переменной, не объясненную независимой переменной. [ необходима цитата ]
При наличии нескольких независимых переменных модель имеет вид y i = a + b x i ,1 + b x i ,2 + ... + b x i,n + e i , где n — количество независимых переменных. [ необходима цитата ]
В статистике, а точнее в линейной регрессии , диаграмма рассеяния данных создается с X в качестве независимой переменной и Y в качестве зависимой переменной. Это также называется двумерным набором данных, ( x 1 , y 1 )( x 2 , y 2 ) ...( x i , y i ) . Простая модель линейной регрессии принимает форму Y i = a + B x i + U i , для i = 1, 2, ... , n . В этом случае U i , ... , U n являются независимыми случайными величинами. Это происходит, когда измерения не влияют друг на друга. Благодаря распространению независимости независимость U i подразумевает независимость Y i , даже если каждый Y i имеет разное математическое ожидание. Каждый U i имеет математическое ожидание 0 и дисперсию σ 2 . [9] Ожидание Y i Доказательство: [9]
Линия наилучшего соответствия для двумерного набора данных имеет вид y = α + βx и называется линией регрессии. α и β соответствуют пересечению и наклону соответственно. [9]
В эксперименте переменная, которой манипулирует экспериментатор, — это то, что, как доказано, работает, и называется независимой переменной. [10] Зависимая переменная — это событие, которое, как ожидается, изменится при манипулировании независимой переменной. [11]
В инструментах интеллектуального анализа данных (для многомерной статистики и машинного обучения ) зависимой переменной отводится рольцелевая переменная (или в некоторых инструментах какатрибут метки), в то время как независимой переменной может быть назначена рольобычной переменной [12]или переменной-функции. Известные значения целевой переменной предоставляются для набора обучающих данных итестовогонабора данных, но должны быть предсказаны для других данных. Целевая переменная используется вконтролируемого обучения, но не в неконтролируемом обучении.
В зависимости от контекста независимая переменная иногда называется «предикторной переменной», «регрессором», «ковариатом», «манипулируемой переменной», «объясняющей переменной», «переменной экспозиции» (см. теорию надежности ), « фактором риска » (см. медицинскую статистику ), « признаком » (в машинном обучении и распознавании образов ) или «входной переменной». [13] [14] В эконометрике термин «контрольная переменная» обычно используется вместо «ковариата». [15] [16] [17] [18] [19]
«Объяснительная переменная»некоторые авторы предпочитают его термину «независимая переменная», когда величины, рассматриваемые как независимые переменные, могут быть статистически независимы или не поддаваться независимому манипулированию исследователем. [20] [21] Если независимая переменная упоминается как «объясняющая переменная», то термин «переменная отклика»некоторые авторы предпочитают использовать его в качестве зависимой переменной. [14] [20] [21]
В зависимости от контекста зависимую переменную иногда называют «переменной отклика», «регрессантом», «критерием», «прогнозируемой переменной», «измеряемой переменной», «объясняемой переменной», «экспериментальной переменной», «реагирующей переменной», «переменной результата», «выходной переменной», «целью» или «меткой». [14] В экономике эндогенные переменные обычно ссылаются на цель.
«Объясненная переменная»некоторые авторы предпочитают термин «зависимая переменная», когда величины, рассматриваемые как «зависимые переменные», могут не быть статистически зависимыми. [22] Если зависимая переменная упоминается как «объясняемая переменная», то термин «предикторная переменная»некоторые авторы предпочитают использовать его в качестве независимой переменной. [22]
Примером может служить анализ тренда уровня моря, проведенный Вудвортом (1987). Здесь зависимой переменной (и переменной, представляющей наибольший интерес) был среднегодовой уровень моря в заданном месте, для которого был доступен ряд годовых значений. Основной независимой переменной было время. Использовалась ковариата, состоящая из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариата позволило получить улучшенные оценки тренда во времени по сравнению с анализами, в которых ковариата не учитывалась.
Переменная может рассматриваться как изменяющая зависимые или независимые переменные, но на самом деле не являющаяся фокусом эксперимента. Таким образом, переменная будет поддерживаться постоянной или контролироваться, чтобы попытаться минимизировать ее влияние на эксперимент. Такие переменные могут быть обозначены как «контролируемая переменная», « контрольная переменная » или «фиксированная переменная».
Посторонние переменные, если они включены в регрессионный анализ в качестве независимых переменных, могут помочь исследователю с точной оценкой параметров отклика, прогнозированием и степенью соответствия , но не представляют существенного интереса для рассматриваемой гипотезы . Например, в исследовании, изучающем влияние послевузовского образования на пожизненный доход, некоторыми посторонними переменными могут быть пол, этническая принадлежность, социальный класс, генетика, интеллект, возраст и т. д. Переменная является посторонней только тогда, когда можно предположить (или показать), что она влияет на зависимую переменную . Если она включена в регрессию, она может улучшить соответствие модели . Если она исключена из регрессии и если она имеет ненулевую ковариацию с одной или несколькими независимыми переменными, представляющими интерес, ее исключение сместит результат регрессии для эффекта этой независимой переменной, представляющей интерес. Этот эффект называется смещением из-за вмешивающейся или пропущенной переменной ; в этих ситуациях необходимы изменения в дизайне и/или контроль для статистического контроля переменной.
Посторонние переменные часто подразделяются на три типа:
В моделировании изменчивость, которая не охватывается независимой переменной, обозначается и известна как « остаток », «побочный эффект», « ошибка », «необъяснимая доля», «остаточная переменная», «возмущение» или «допуск».