Модель линейной вероятности - это модель бинарного выбора. В этом случае условное ожидание зависимой переменной является линейной функцией, то есть связь зависимой переменной с независимой переменной (ами) является постоянной.
Чтобы увидеть это с другой стороны, линейная вероятностная модель - это модель, в которой у нас есть зависимая переменная и независимая (ые) переменная (ы), умноженные на постоянный коэффициент (ы).
Мы должны указать, что линейная вероятностная модель - это модель бинарного выбора, то есть где зависимая переменная может принимать два значения. Эти значения равны 1 или 0, чтобы указать успех или неудачу, соответственно.
Модель линейной вероятности выражается следующим образом:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
В показанном уравнении условное ожидание Y при заданном X интерпретируется как равное β0 + β1x.
В этом случае мы берем условное ожидание, поскольку нас интересует вероятность того, что человек примет решение, например, с учетом его характеристик (или в качестве эталона можно использовать другую независимую переменную).
Недостатки линейной вероятностной модели
Некоторые недостатки линейной вероятностной модели заключаются в следующем:
- Модель линейной вероятности может показать гетероскедастичность. А именно, дисперсия ошибок не одинакова во всех сделанных наблюдениях. В этом случае используются стандартные ошибки.
- Нельзя предполагать, что ошибки распределены нормально.
- Зависимая переменная может принимать только два значения.
- Предполагается, что независимые и зависимые переменные имеют линейную зависимость, то есть скорость изменения всегда одинакова. Однако может быть более точным построить модель, в которой скорость изменения увеличивается, когда Y достигает более высокого значения, и наоборот, когда Y уменьшается.
Учитывая эти недостатки, существуют модели логита и пробита.
Пример линейной вероятностной модели
Например, можно построить линейную вероятностную модель, в которой зависимой переменной является то, есть ли у человека в настоящее время официальная работа, которую он занимал в течение года или дольше. Независимыми переменными могут быть уровень обучения или уровень образования, пол и возраст.
В показанном примере зависимая переменная будет 1 или 0, но ее необходимо интерпретировать качественно, независимо от ее числового значения. Таким образом, 1 означает, что у человека действительно есть официальная работа, которая сохраняется более 1 года, а 0 означает ситуацию, в которой этого не происходит.