Зависимые и независимые переменные

Переменная считается зависимой , если она зависит от независимой переменной. Зависимые переменные изучаются при предположении или требовании, что они зависят по некоторому закону или правилу (например, математической функции ) от значений других переменных. Независимые переменные, в свою очередь, не рассматриваются как зависящие от какой-либо другой переменной в рамках рассматриваемого эксперимента. ^[a] В этом смысле некоторыми общими независимыми переменными являются время , пространство , плотность , масса , скорость потока жидкости , ^[1]^[2] и предыдущие значения некоторых наблюдаемых значений, представляющих интерес (например, размер человеческой популяции), для прогнозирования будущих значений ( зависимая переменная). ^[3]

Из этих двух всегда именно зависимая переменная, изменение которой изучается путем изменения входных данных, также известных как регрессоры в статистическом контексте. В эксперименте любая переменная, которой можно приписать значение, не приписывая значения какой-либо другой переменной, называется независимой переменной. Модели и эксперименты проверяют влияние независимых переменных на зависимые переменные. Иногда, даже если их влияние не представляет прямого интереса, независимые переменные могут быть включены по другим причинам, например, для учета их потенциального искажающего эффекта.

В исчислении одной переменной функция обычно изображается на графике , где горизонтальная ось представляет независимую переменную, а вертикальная ось представляет зависимую переменную. ^[4] В этой функции y — зависимая переменная, а x — независимая переменная.

В чистой математике

В математике функция — это правило приема входных данных (в простейшем случае числа или набора чисел) ^[5] и предоставления выходных данных (которые также могут быть числами). ^[5] Символ, обозначающий произвольный входной сигнал, называется независимой переменной , а символ, обозначающий произвольный выходной сигнал, называется зависимой переменной . ^[6] Наиболее распространенный символ для ввода — $x$ , а наиболее распространенный символ для вывода — $y$ ; сама функция обычно записывается $y = f (x)$ . ^[6]^[7]

Возможно иметь несколько независимых переменных или несколько зависимых переменных. Например, в исчислении с несколькими переменными часто встречаются функции вида $z = f (x, y)$ , где $z$ — зависимая переменная, а $x$ и $y$ — независимые переменные. ^[8] Функции с несколькими выходными значениями часто называют векторными функциями .

В моделировании и статистике

При математическом моделировании изучается связь между множеством зависимых переменных и множеством независимых переменных.

В простой стохастической линейной модели $y i = a + b x i + e i$ термин $y i$ — это $i-$ е значение зависимой переменной, а $x i$ $— i$ -е значение независимой переменной. Термин $e i$ известен как «ошибка» и содержит изменчивость зависимой переменной, не объясненную независимой переменной.

С несколькими независимыми переменными модель имеет следующий вид: $y i = a + b x i, 1 + b x i, 2 + ... + b x i,n + e i$ , где $n$ — количество независимых переменных. ^{[ нужна цитата ]}

В статистике, точнее, в линейной регрессии , диаграмма рассеяния данных создается с $X$ в качестве независимой переменной и $Y$ в качестве зависимой переменной. Это также называется двумерным набором данных, $(x 1, y 1) (x 2, y 2) ... (x i, y i)$ . Простая модель линейной регрессии принимает форму $Y i = a + B x i + U i$ для $i = 1, 2, ..., n$ . В этом случае $U i, ... , Un являются$ независимыми случайными величинами. Это происходит, когда измерения не влияют друг на друга. Благодаря распространению независимости независимость $U i$ подразумевает независимость $Y i$ , хотя каждый $Y i$ имеет разное математическое ожидание. Каждое $U i$ имеет математическое ожидание 0 и дисперсию $σ 2$ . ^[9] Ожидание $Y i$ Доказательство: ^[9]

E[Y_{i}]=E[\alpha +\beta x_{i}+U_{i}]=\alpha +\beta x_{i}+E[U_{i}]=\alpha + \beta x_{i}.

Линия наилучшего соответствия двумерному набору данных принимает форму $y = α + βx$ и называется линией регрессии. $α$ и $β$ соответствуют точке пересечения и наклону соответственно. ^[9]

В эксперименте переменная, которой манипулирует экспериментатор, — это то, работа чего доказана, и называется независимой переменной. ^[10] Зависимая переменная – это событие, которое, как ожидается, изменится при манипулировании независимой переменной. ^[11]

В инструментах интеллектуального анализа данных (для многомерной статистики и машинного обучения ) зависимой переменной отводится рольцелевая переменная (или в некоторых инструментах какатрибут метки), тогда как независимой переменной может быть назначена рольобычной переменной.^[12]Известные значения целевой переменной предоставляются для набора обучающих итестовых данных, но их следует прогнозировать для других данных. Целевая переменная используется вобучения с учителем, но не в обучении без учителя.

Синонимы

В зависимости от контекста независимую переменную иногда называют «переменной-предиктором», «регрессором», «ковариатом», «манипулируемой переменной», «объясняющей переменной», «переменной воздействия» (см. теорию надежности ), « фактором риска » ( см. медицинскую статистику ), « функция » (в машинном обучении и распознавании образов ) или «входная переменная». ^[13]^[14] В эконометрике термин «контрольная переменная» обычно используется вместо «ковариата». ^[15]^[16]^[17]^[18]^[19] В экономическом сообществе независимые переменные также называются « экзогенными ». ^{[ нужна цитата ]}

«Независимая переменная»некоторые авторы отдают предпочтение «независимой переменной», когда величины, рассматриваемые как независимые переменные, не могут быть статистически независимыми или исследователем, которым можно независимо манипулировать. ^[20]^[21] Если независимая переменная называется «объясняющей переменной», тогда термин «переменная отклика»некоторые авторы предпочитают в качестве зависимой переменной. ^[14]^[20]^[21]

В зависимости от контекста зависимую переменную иногда называют «переменной ответа», «регрессией», «критерием», «прогнозируемой переменной», «измеренной переменной», «объясняемой переменной», «экспериментальной переменной», «отвечающей переменной». «результатная переменная», «выходная переменная», «цель» или «метка». ^[14] В экономике эндогенные переменные обычно относятся к цели.

«Объясняемая переменная»некоторые авторы отдают предпочтение «зависимой переменной», когда величины, рассматриваемые как «зависимые переменные», могут не быть статистически зависимыми. ^[22] Если зависимая переменная называется «объясняемой переменной», тогда термин «переменная-предиктор»некоторые авторы предпочитают в качестве независимой переменной. ^[22]

Примером может служить анализ тенденции изменения уровня моря, проведенный Вудвортом (1987). Здесь зависимой переменной (и переменной, представляющей наибольший интерес) был среднегодовой уровень моря в данном месте, для которого был доступен ряд годовых значений. Основной независимой переменной было время. Была использована ковариата, состоящая из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариаты позволило получить более качественные оценки тенденции в зависимости от времени по сравнению с анализом, в котором ковариата не учитывалась.

Другие переменные

Можно считать, что переменная изменяет зависимые или независимые переменные, но на самом деле она не может быть целью эксперимента. Таким образом, переменная будет поддерживаться постоянной или контролироваться, чтобы попытаться свести к минимуму ее влияние на эксперимент. Такие переменные могут быть обозначены как «управляемая переменная», « управляющая переменная » или «фиксированная переменная».

Посторонние переменные, если они включены в регрессионный анализ в качестве независимых переменных, могут помочь исследователю с точной оценкой параметров ответа, прогнозированием и степенью соответствия , но не представляют существенного интереса для исследуемой гипотезы . Например, в исследовании, изучающем влияние высшего образования на заработок в течение жизни, некоторыми посторонними переменными могут быть пол, этническая принадлежность, социальный класс, генетика, интеллект, возраст и т. д. Переменная является посторонней только тогда, когда можно предположить (или показать), что она влияет на зависимую переменную . Если его включить в регрессию, это может улучшить соответствие модели . Если он исключен из регрессии и если он имеет ненулевую ковариацию с одной или несколькими интересующими независимыми переменными, его пропуск приведет к смещению результата регрессии в отношении эффекта этой независимой интересующей переменной. Этот эффект называется смещением смешанной или пропущенной переменной ; в таких ситуациях необходимы изменения конструкции и/или контроль переменных статистических показателей.

Посторонние переменные часто подразделяют на три типа:

Субъектные переменные, которые представляют собой характеристики изучаемых людей, которые могут повлиять на их действия. Эти переменные включают возраст, пол, состояние здоровья, настроение, происхождение и т. д.
Блокирующие переменные или экспериментальные переменные — это характеристики людей, проводящих эксперимент, которые могут повлиять на поведение человека. Пол, наличие расовой дискриминации, языка или других факторов могут квалифицироваться как такие переменные.
Ситуационные переменные – это особенности среды, в которой проводилось исследование или исследование, оказывающие негативное влияние на результат эксперимента. Учитываются температура воздуха, уровень активности, освещение и время суток.

В моделировании изменчивость, не охваченная независимой переменной, обозначается и известна как « остаток », «побочный эффект», « ошибка », «необъяснимая доля», «остаточная переменная», «возмущение» или «допуск». ". $e_{I}$

Примеры

Влияние удобрений на рост растений:

В исследовании, измеряющем влияние различных количеств удобрений на рост растений, независимой переменной будет количество использованных удобрений. Зависимой переменной будет рост высоты или массы растения. Контролируемыми переменными будут тип растения, тип удобрения, количество солнечного света, которое получает растение, размер горшков и т. д.

Влияние дозы препарата на тяжесть симптомов:

Изучая, как различные дозы лекарства влияют на тяжесть симптомов, исследователь мог сравнить частоту и интенсивность симптомов при введении разных доз. Здесь независимой переменной является доза, а зависимой переменной — частота/интенсивность симптомов.

Влияние температуры на пигментацию:

При измерении количества удаленного цвета из образцов свеклы при различных температурах температура является независимой переменной, а количество удаленного пигмента — зависимой переменной.

Влияние сахара, добавленного в кофе:

Вкус меняется в зависимости от количества добавленного в кофе сахара. Здесь сахар является независимой переменной, а вкус – зависимой переменной.

Смотрите также

Примечания

^ Даже если существующая зависимость обратима (например, путем нахождения обратной функции при ее существовании), номенклатура сохраняется, если обратная зависимость не является объектом исследования в эксперименте.