Переменная считается зависимой , если она зависит от независимой переменной. Зависимые переменные изучаются при предположении или требовании, что они зависят по некоторому закону или правилу (например, математической функции ) от значений других переменных. Независимые переменные, в свою очередь, не рассматриваются как зависящие от какой-либо другой переменной в рамках рассматриваемого эксперимента. [a] В этом смысле некоторыми общими независимыми переменными являются время , пространство , плотность , масса , скорость потока жидкости , [1] [2] и предыдущие значения некоторых наблюдаемых значений, представляющих интерес (например, размер человеческой популяции), для прогнозирования будущих значений ( зависимая переменная). [3]
Из этих двух всегда именно зависимая переменная, изменение которой изучается путем изменения входных данных, также известных как регрессоры в статистическом контексте. В эксперименте любая переменная, которой можно приписать значение, не приписывая значения какой-либо другой переменной, называется независимой переменной. Модели и эксперименты проверяют влияние независимых переменных на зависимые переменные. Иногда, даже если их влияние не представляет прямого интереса, независимые переменные могут быть включены по другим причинам, например, для учета их потенциального искажающего эффекта.
В математике функция — это правило приема входных данных (в простейшем случае числа или набора чисел) [5] и предоставления выходных данных (которые также могут быть числами). [5] Символ, обозначающий произвольный входной сигнал, называется независимой переменной , а символ, обозначающий произвольный выходной сигнал, называется зависимой переменной . [6] Наиболее распространенный символ для ввода — x , а наиболее распространенный символ для вывода — y ; сама функция обычно записывается y = f ( x ) . [6] [7]
Возможно иметь несколько независимых переменных или несколько зависимых переменных. Например, в исчислении с несколькими переменными часто встречаются функции вида z = f ( x , y ) , где z — зависимая переменная, а x и y — независимые переменные. [8] Функции с несколькими выходными значениями часто называют векторными функциями .
При математическом моделировании изучается связь между множеством зависимых переменных и множеством независимых переменных.
В простой стохастической линейной модели y i = a + b x i + e i термин y i — это i- е значение зависимой переменной, а x i — i -е значение независимой переменной. Термин e i известен как «ошибка» и содержит изменчивость зависимой переменной, не объясненную независимой переменной.
С несколькими независимыми переменными модель имеет следующий вид: y i = a + b x i , 1 + b x i , 2 + ... + b x i,n + e i , где n — количество независимых переменных. [ нужна цитата ]
В статистике, точнее, в линейной регрессии , диаграмма рассеяния данных создается с X в качестве независимой переменной и Y в качестве зависимой переменной. Это также называется двумерным набором данных, ( x 1 , y 1 ) ( x 2 , y 2 ) ... ( x i , y i ) . Простая модель линейной регрессии принимает форму Y i = a + B x i + U i для i = 1, 2, ..., n . В этом случае U i , ... , Un являются независимыми случайными величинами. Это происходит, когда измерения не влияют друг на друга. Благодаря распространению независимости независимость U i подразумевает независимость Y i , хотя каждый Y i имеет разное математическое ожидание. Каждое U i имеет математическое ожидание 0 и дисперсию σ 2 . [9] Ожидание Y i Доказательство: [9]
Линия наилучшего соответствия двумерному набору данных принимает форму y = α + βx и называется линией регрессии. α и β соответствуют точке пересечения и наклону соответственно. [9]
В эксперименте переменная, которой манипулирует экспериментатор, — это то, работа чего доказана, и называется независимой переменной. [10] Зависимая переменная – это событие, которое, как ожидается, изменится при манипулировании независимой переменной. [11]
В инструментах интеллектуального анализа данных (для многомерной статистики и машинного обучения ) зависимой переменной отводится рольцелевая переменная (или в некоторых инструментах какатрибут метки), тогда как независимой переменной может быть назначена рольобычной переменной.[12]Известные значения целевой переменной предоставляются для набора обучающих итестовых данных, но их следует прогнозировать для других данных. Целевая переменная используется вобучения с учителем, но не в обучении без учителя.
В зависимости от контекста независимую переменную иногда называют «переменной-предиктором», «регрессором», «ковариатом», «манипулируемой переменной», «объясняющей переменной», «переменной воздействия» (см. теорию надежности ), « фактором риска » ( см. медицинскую статистику ), « функция » (в машинном обучении и распознавании образов ) или «входная переменная». [13] [14] В эконометрике термин «контрольная переменная» обычно используется вместо «ковариата». [15] [16] [17] [18] [19] В экономическом сообществе независимые переменные также называются « экзогенными ». [ нужна цитата ]
«Независимая переменная»некоторые авторы отдают предпочтение «независимой переменной», когда величины, рассматриваемые как независимые переменные, не могут быть статистически независимыми или исследователем, которым можно независимо манипулировать. [20] [21] Если независимая переменная называется «объясняющей переменной», тогда термин «переменная отклика»некоторые авторы предпочитают в качестве зависимой переменной. [14] [20] [21]
В зависимости от контекста зависимую переменную иногда называют «переменной ответа», «регрессией», «критерием», «прогнозируемой переменной», «измеренной переменной», «объясняемой переменной», «экспериментальной переменной», «отвечающей переменной». «результатная переменная», «выходная переменная», «цель» или «метка». [14] В экономике эндогенные переменные обычно относятся к цели.
«Объясняемая переменная»некоторые авторы отдают предпочтение «зависимой переменной», когда величины, рассматриваемые как «зависимые переменные», могут не быть статистически зависимыми. [22] Если зависимая переменная называется «объясняемой переменной», тогда термин «переменная-предиктор»некоторые авторы предпочитают в качестве независимой переменной. [22]
Примером может служить анализ тенденции изменения уровня моря, проведенный Вудвортом (1987). Здесь зависимой переменной (и переменной, представляющей наибольший интерес) был среднегодовой уровень моря в данном месте, для которого был доступен ряд годовых значений. Основной независимой переменной было время. Была использована ковариата, состоящая из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариаты позволило получить более качественные оценки тенденции в зависимости от времени по сравнению с анализом, в котором ковариата не учитывалась.
Можно считать, что переменная изменяет зависимые или независимые переменные, но на самом деле она не может быть целью эксперимента. Таким образом, переменная будет поддерживаться постоянной или контролироваться, чтобы попытаться свести к минимуму ее влияние на эксперимент. Такие переменные могут быть обозначены как «управляемая переменная», « управляющая переменная » или «фиксированная переменная».
Посторонние переменные, если они включены в регрессионный анализ в качестве независимых переменных, могут помочь исследователю с точной оценкой параметров ответа, прогнозированием и степенью соответствия , но не представляют существенного интереса для исследуемой гипотезы . Например, в исследовании, изучающем влияние высшего образования на заработок в течение жизни, некоторыми посторонними переменными могут быть пол, этническая принадлежность, социальный класс, генетика, интеллект, возраст и т. д. Переменная является посторонней только тогда, когда можно предположить (или показать), что она влияет на зависимую переменную . Если его включить в регрессию, это может улучшить соответствие модели . Если он исключен из регрессии и если он имеет ненулевую ковариацию с одной или несколькими интересующими независимыми переменными, его пропуск приведет к смещению результата регрессии в отношении эффекта этой независимой интересующей переменной. Этот эффект называется смещением смешанной или пропущенной переменной ; в таких ситуациях необходимы изменения конструкции и/или контроль переменных статистических показателей.
Посторонние переменные часто подразделяют на три типа:
В моделировании изменчивость, не охваченная независимой переменной, обозначается и известна как « остаток », «побочный эффект», « ошибка », «необъяснимая доля», «остаточная переменная», «возмущение» или «допуск». ".