Фиктивная переменная - что это такое, определение и понятие

Содержание:

Фиктивная переменная - что это такое, определение и понятие
Фиктивная переменная - что это такое, определение и понятие
Anonim

Фиктивная переменная - это переменная, используемая для объяснения качественных значений в регрессионной модели.

Модели регрессии пытаются объяснить одну переменную с точки зрения других. Например, зарплата человека в зависимости от его возраста, образования и опыта. Эти переменные можно определить количественно. Возраст, образование и опыт человека можно измерить количеством лет. Но что происходит, когда у нас есть переменные, которые невозможно определить количественно? Например, цвет волос, страна проживания или пол. Решение этой проблемы находится в фиктивных переменных. Это переменные, которые обычно принимают двоичные значения. То есть значение ноль или один.

Например, переменная пола, как мы уже сказали, является качественной переменной. Чтобы включить его в регрессионную модель, вы должны создать фиктивную переменную. Мы будем называть переменную "женщина" так, что:

Женщина = 1 (если это женщина)

Женщина = 0 (если человек не женщина, то есть мужчина)

В этом случае «мужчина» считается эталонной категорией или базовой группой.

Есть два типа фиктивных переменных. С одной стороны, существуют аддитивные фиктивные переменные, а с другой - мультипликативные фиктивные переменные.

Регрессионный анализ

Аддитивная фиктивная переменная

Аддитивная фиктивная переменная собирает фиксированное изменение. Это изменение влияет только на постоянный член уравнения. Например, модель, которая призвана объяснить заработную плату в зависимости от пола и количества лет образования. Мы можем использовать уравнение для мужчин (второе уравнение) или для женщин (первое уравнение):

Графическое представление уравнений будет следующим: в случае, если мужчины имеют более высокую заработную плату, при использовании дополнительной фиктивной переменной модель будет представлена ​​как предыдущее изображение.

В вашем случае, если бы у женщин зарплата была выше, чем у мужчин, взяв аддитивную фиктивную переменную, модель была бы представлена ​​графически как предыдущее изображение.

Количественная разница между синей линией (мужчины) и оранжевой линией (женщины) будет равна значению переменной «Женщины" или же "Мужчины»По выбранной модели. В этом случае, в случае аддитивных фиктивных переменных, разница в заработной плате не зависит от уровня обучения. Другими словами, разница в зарплате зависит исключительно и исключительно от пола.

Мультипликативная фиктивная переменная

Мультипликативная фиктивная переменная фиксирует изменение наклона уравнений для мужчин и женщин. Продолжая предыдущий пример, мы имеем:

Графически возможное представление было бы таким:

В этом случае модель сообщит нам две вещи. Во-первых, заработная плата женщин ниже, чем у мужчин. Во-вторых, дополнительный год обучения платит мужчинам лучше, чем женщинам. Мы знаем это, потому что наклон синей линии (мужчины) больше, чем наклон оранжевой линии (женщины).

Если бы женщинам лучше платили за дополнительный год обучения, то наклон оранжевой линии (женщины) был бы больше. И синяя линия (мужчины) будет внизу.

Статистическая переменная