Модель распределенной авторегрессии с запаздыванием (ADR), с англ. Модель авторегрессии с распределенным запаздыванием(ADL) - это регрессия, которая включает новую независимую переменную с задержкой в дополнение к зависимой переменной с задержкой.
Другими словами, модель ADR является расширением модели авторегрессии p-порядка, AR (p), которая включает другую независимую переменную в период времени, предшествующий периоду зависимой переменной.
Пример
На основе данных с 1995 по 2018 год вычисляем натуральные логарифмыски-пассы для каждого года, и мы возвращаемся на один период назад для переменныхски-пассыт и трекит:
Год | Ски-пассы (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 | Год | Ски-пассы (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
Для регрессии мы используем значения ln_t как зависимая переменная, а значенияln_t-1 Ytrack_t-1 как независимые переменные. Значения красного цвета не попадают в регрессию.
Получаем коэффициенты регрессии:
В этом случае знак регрессоров положительный:
- Увеличение на 1€ в ценески-пассы в предыдущем сезоне (т-1) он вырос на 0,48€в ценески-пассы в этом сезоне (t).
- Увеличение количества черной взлетно-посадочной полосы, открытой в предыдущем сезоне (t-1), означает рост стоимости на 4,1%.ски-пассы в этом сезоне (t).
Значения в скобках под коэффициентами представляют собой стандартные ошибки оценок.
Подменяем
Потом,
Год | Абонементы на подъемник (€) | Треки | Год | Абонементы на подъемник (€) | Треки |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Какая модель лучше всего подходит для прогнозирования цен наски-пассы учитывая вышеприведенные наблюдения, AR (1) или ADR (1,1)? Другими словами, включаете ли вы независимую переменнуютрекит-1 в регрессии помогает лучше соответствовать нашему прогнозу?
Мы смотрим на R в квадрате регрессий моделей:
Модель AR (1): R2= 0,33
Модель ADR (1,1): R2= 0,40
R2 модели ADR (1,1) выше R2 модели AR (1). Это означает, что ввод независимой переменнойтрекит-1 в регрессии это помогает лучше соответствовать нашему прогнозу.