Модели с двоичным выбором

Модели с двоичным выбором - это модели, в которых зависимая переменная принимает только два значения: 1 для обозначения «успеха» или «0» для обозначения неудачи. Конкретные модели оценки: линейная вероятность, логит и пробит.

В модели простой или множественной регрессии, которая преподается во вводном курсе эконометрики, зависимая переменная обычно имеет экономическую интерпретацию (например, рост ВВП, инвестиций или потребления) из других объясняющих переменных.

Но какую модель мы используем, когда хотим объяснить события, у которых есть только две возможности? Например: сдать или не сдать предмет, закончить или не закончить колледж, трудоустроен или безработный и т. Д. Вот на что реагируют модели бинарного выбора.

В каждом из этих случаев вы можете сделать Y = 1 означает «успех»; Y = 0 обозначают «неудача». По этой причине они называются моделями бинарного выбора, и используется следующее уравнение:

Таким образом мы получим вероятность успеха определенной переменной.

Пока это не вызывает серьезных осложнений. Однако оценка и интерпретация параметров требует большей осторожности.

Регрессионная модель

Модели для оценки бинарных параметров

Учитывая вышеупомянутые характеристики независимой переменной, существует три модели для оценки параметров:

  • Линейная вероятностная модель. Он рассчитывается с помощью обычного OLS.
  • Логит-модель. Он рассчитывается с помощью стандартной функции логистического распределения.
  • Пробит модель. Он рассчитывается с помощью стандартной функции нормального распределения.

Линейная вероятностная модель

Модель линейной вероятности (MPL) названа так потому, что вероятность
реакция линейна по отношению к параметрам уравнения. Для оценки используйте метод наименьших квадратов (МНК).

Расчетное уравнение записывается

Независимая переменная (и шляпа) - это прогнозируемая вероятность успеха.

B0 cap - это прогнозируемая вероятность успеха, когда каждый из x равен нулю. Коэффициент B1 cap измеряет изменение прогнозируемой вероятности успеха, когда x1 увеличивается на одну единицу.

Чтобы правильно интерпретировать линейную вероятностную модель, мы должны учитывать, что считается успехом, а что нет.

Пример модели бинарного выбора

Экономист Джеффри Вулдридж оценил эконометрическую модель, в которой бинарная переменная указывает, участвовала ли замужняя женщина в рабочей силе (объясненная переменная) в течение 1975 года. В данном случае Y = 1 означает, что e участвовал Y = 0, чего не было.

Модель использует уровень дохода мужа в качестве независимых переменных (hinc), Годы обучения (просвещать), многолетний опыт работы на рынке труда (Exper), возраст (возраст), количество детей в возрасте до шести лет (kidslt6) и количество детей от 6 до 18 лет (kidsge6).

Мы можем проверить, что все переменные, кроме kidsge6, статистически значимы и все значимые переменные имеют ожидаемый эффект.

Теперь интерпретация параметров такая:

  • Если вы увеличите один год обучения при прочих равных условиях, вероятность присоединения к рабочей силе возрастет на 3,8%.
  • Если опыт увеличивается за один год, вероятность быть частью рабочей силы увеличивается на 3,9%.
  • Если у вас есть ребенок младше 6 лет, при прочих равных условиях, вероятность того, что вы будете частью рабочей силы, снижается на 26,2%.

Итак, мы видим, что эта модель говорит нам о влиянии каждой ситуации на вероятность того, что женщина будет официально нанята.

Эту модель можно использовать для оценки государственной политики и социальных программ, поскольку изменение «прогнозируемой вероятности успеха» можно количественно выразить по отношению к единичным или предельным изменениям в независимых переменных.

Недостатки линейной вероятностной модели

Однако у этой модели есть два основных недостатка:

  • Он может давать вероятности меньше нуля и больше единицы, что не имеет смысла с точки зрения интерпретации этих значений.
  • Частичные эффекты всегда постоянны. В этой модели нет разницы между переходом от нуля детей к одному ребенку и переходом от двух до трех детей.
  • Поскольку независимая переменная принимает только значения ноль или один, может быть получена гетероскедастичность. Для решения этой проблемы используются стандартные ошибки.

Для решения первых двух проблем, которые являются наиболее важными в линейной вероятностной модели, были разработаны модели Logit и Probit.

Рекомендации:

Вулдридж, Дж. (2010) Введение в эконометрику. (4-е изд.) Мексика: Cengage Learning.

Популярные посты