Распределение Пуассона - это дискретное распределение вероятностей, которое моделирует частоту определенных событий в течение фиксированного интервала времени на основе средней частоты возникновения указанных событий.
Другими словами, распределение Пуассона - это дискретное распределение вероятностей, которое, только зная события и их среднюю частоту возникновения, мы можем узнать их вероятность.
Выражение
Для дискретной случайной величины X мы говорим, что ее частота может быть удовлетворительно приближена к распределению Пуассона, так что
Распределение Пуассона зависит только от одного параметра, mu (отмечен желтым). Mu сообщает ожидаемое количество событий, которые произойдут в заданный интервал времени.
Функция плотности вероятности (pdf)
Под этой функцией понимается вероятность того, что случайная величина X примет конкретное значение x. Это экспонента отрицательного среднего, умноженная на среднее значение, полученное при наблюдении, и все, разделенное на факториал наблюдения.
Как указано, чтобы узнать вероятность каждого наблюдения, нам нужно будет подставить все наблюдения в функцию.
Расчет в Excel
Хотя предыдущая формула может показаться очень сложной, Excel решает нашу жизнь, просто написав = ПУАССОН и введя необходимые входные данные. Таким образом мы можем вычислить функцию плотности вероятности.
Функция зависит от x, mu и логического значения. Чтобы вычислить функцию плотности вероятности, мы собираемся поместить ЛОЖЬ в логическое значение, так что:
= ПУАССОН (x; мю; ЛОЖЬ).
= ПУАССОН.РАСП (x; mu; ЛОЖЬ).
Обе функции Excel эквивалентны.
Пример Пуассона в Excel
Мы предполагаем, что хотим покататься на лыжах до декабря. Вероятность открытия горнолыжных курортов до декабря - 5%. Мы хотим знать вероятность открытия ближайших горнолыжных курортов до декабря. Из 100 станций есть только 3 станции, которые находятся поблизости. Рейтинг этих 3 станций - 4, 9 и 6 соответственно.
Входными данными, необходимыми для вычисления функции вероятности плотности Пуассона, являются набор данных и mu:
- Набор данных = 100 горнолыжных курортов.
- Mu = 5% * 100 = 5 - ожидаемое количество горнолыжных курортов с учетом набора данных.
Вручную
Excel
- Набор данных или образец. Часть набора данных была скрыта, чтобы просмотреть ее как единое целое.
- Рассчитать функция плотности вероятности Пуассона:
Ячейки, отмеченные синим цветом, указывают на вероятность открытия ближайших станций до декабря. Таким образом, ближайшая станция, которая, скорее всего, откроется до декабря, - это станция 98 с рейтингом 4 и вероятностью 17,54%.