Линейная вероятностная модель

Содержание:

Anonim

Модель линейной вероятности - это модель бинарного выбора. В этом случае условное ожидание зависимой переменной является линейной функцией, то есть связь зависимой переменной с независимой переменной (ами) является постоянной.

Чтобы увидеть это с другой стороны, линейная вероятностная модель - это модель, в которой у нас есть зависимая переменная и независимая (ые) переменная (ы), умноженные на постоянный коэффициент (ы).

Мы должны указать, что линейная вероятностная модель - это модель бинарного выбора, то есть где зависимая переменная может принимать два значения. Эти значения равны 1 или 0, чтобы указать успех или неудачу, соответственно.

Модель линейной вероятности выражается следующим образом:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

В показанном уравнении условное ожидание Y при заданном X интерпретируется как равное β0 + β1x.

В этом случае мы берем условное ожидание, поскольку нас интересует вероятность того, что человек примет решение, например, с учетом его характеристик (или в качестве эталона можно использовать другую независимую переменную).

Недостатки линейной вероятностной модели

Некоторые недостатки линейной вероятностной модели заключаются в следующем:

  • Модель линейной вероятности может показать гетероскедастичность. А именно, дисперсия ошибок не одинакова во всех сделанных наблюдениях. В этом случае используются стандартные ошибки.
  • Нельзя предполагать, что ошибки распределены нормально.
  • Зависимая переменная может принимать только два значения.
  • Предполагается, что независимые и зависимые переменные имеют линейную зависимость, то есть скорость изменения всегда одинакова. Однако может быть более точным построить модель, в которой скорость изменения увеличивается, когда Y достигает более высокого значения, и наоборот, когда Y уменьшается.

Учитывая эти недостатки, существуют модели логита и пробита.

Пример линейной вероятностной модели

Например, можно построить линейную вероятностную модель, в которой зависимой переменной является то, есть ли у человека в настоящее время официальная работа, которую он занимал в течение года или дольше. Независимыми переменными могут быть уровень обучения или уровень образования, пол и возраст.

В показанном примере зависимая переменная будет 1 или 0, но ее необходимо интерпретировать качественно, независимо от ее числового значения. Таким образом, 1 означает, что у человека действительно есть официальная работа, которая сохраняется более 1 года, а 0 означает ситуацию, в которой этого не происходит.