Доверительный интервал - что это такое, определение и понятие

Содержание:

Anonim

Доверительный интервал - это метод оценки, используемый в статистическом выводе, который позволяет ограничить пару или несколько пар значений, в пределах которых будет найдена желаемая точечная оценка (с определенной вероятностью).

Доверительный интервал позволит нам вычислить два значения вокруг выборочного среднего (одно верхнее и одно нижнее). Эти значения ограничивают диапазон, в котором с определенной вероятностью будет находиться параметр совокупности.

Доверительный интервал = среднее + - погрешность

В общем, определение истинного населения - вещь очень сложная. Рассмотрим население в 4 миллиона человек. Можем ли мы узнать средние потребительские расходы на домохозяйство этого населения? В принципе да. Нам просто нужно было бы обследовать все домохозяйства и вычислить среднее значение. Однако выполнение этого процесса было бы чрезвычайно трудоемким и сделало бы исследование довольно сложным.

В подобных ситуациях более целесообразно выбрать статистическую выборку. Например, 500 человек. На указанном образце вычислите среднее значение. Хотя мы все еще не знаем истинного значения совокупности, мы можем предположить, что оно будет близко к значению выборки. К этому значению мы добавляем погрешность и получаем значение доверительного интервала. С другой стороны, мы вычитаем эту погрешность из среднего, и у нас будет другое значение. Между этими двумя значениями будет среднее значение генеральной совокупности.

В заключение, доверительный интервал не служит для точечной оценки параметра популяции, если он помогает нам получить приблизительное представление о том, какой из них может быть истинным. Это позволяет нам ограничить между двумя значениями, где будет найдено среднее значение генеральной совокупности.

коэффициент вариацииНакопленная частота

Факторы, от которых зависит доверительный интервал

Расчет доверительного интервала зависит в основном от следующих факторов:

  • Выбранный размер выборки: В зависимости от количества данных, которые использовались для расчета значения выборки, оно будет более или менее близко к истинному параметру генеральной совокупности.
  • Уровень уверенности: Он проинформирует нас, в каком проценте случаев наша оценка верна. Обычные уровни - 95% и 99%.
  • Допустимая погрешность нашей оценки: Это называется альфа и информирует нас о вероятности того, что значение генеральной совокупности выходит за пределы нашего диапазона.
  • Оценка в выборке (среднее, дисперсия, разница средних …): От этого будет зависеть сводная статистика для расчета интервала.

Пример доверительного интервала для среднего, предполагая, что нормальность и стандартное отклонение известны

Для расчета используется следующая сводная статистика:

Результирующий интервал будет следующим:

Мы видим, как в интервале слева и справа от неравенства мы имеем нижнюю и верхнюю границу соответственно. Следовательно, выражение говорит нам, что вероятность того, что среднее значение генеральной совокупности находится между этими значениями, равна 1-альфа (уровень достоверности).

Давайте лучше рассмотрим вышеизложенное на примере решенного упражнения.

Вы хотите оценить среднее время, затрачиваемое бегуном на преодоление марафона. Для этого было рассчитано 10 марафонов и получено в среднем 4 часа со стандартным отклонением 33 минуты (0,55 часа). Вы хотите получить доверительный интервал 95%.

Чтобы получить интервал, нам нужно только подставить данные в формулу интервала.

Доверительный интервал будет частью распределения, заштрихованной синим цветом. 2 значения, ограниченные этим, будут соответствовать 2 красным линиям. Центральная линия, которая делит распределение на 2, будет истинным значением численности населения.

Важно отметить, что в этом случае, учитывая, что функция плотности распределения N (0,1) дает нам кумулятивную вероятность (слева до критического значения), мы должны найти значение, которое оставляет нам 0,975 на левый% (это 1,96).