Распределение Стьюдента - что это такое, определение и понятие

Содержание:

Anonim

T-распределение Стьюдента или t-распределение - это теоретическая модель, используемая для аппроксимации момента первого порядка нормально распределенной совокупности, когда размер выборки невелик и стандартное отклонение неизвестно.

Другими словами, t-распределение - это распределение вероятностей, которое оценивает значение среднего значения небольшой выборки, взятой из совокупности, которая следует нормальному распределению и для которой мы не знаем его стандартное отклонение.

Рекомендуемые статьи: степени свободы, степени свободы (пример) и нормальное распределение.

Формула t-распределения Стьюдента

Для непрерывной случайной величины L мы говорим, что частота ее наблюдений может быть удовлетворительно аппроксимирована t-распределением с g степенями свободы, таким, что:

Представление t-распределения Стьюдента

Функция плотности t-распределения с 3 степенями свободы (df).

Как мы видим, представление t-распределения очень похоже на нормальное распределение, за исключением того, что нормальное распределение имеет более широкие хвосты и более подкреплено. Другими словами, мы должны добавить больше степеней свободы к t-распределению, чтобы оно «росло» и больше походило на нормальное распределение.

Специальность

И… Почему t-распределение такое особенное?

Ну, потому что в отличие от нормального распределения, которое зависит от среднего и дисперсии, t-распределение зависит только от степеней свободы, от английского: степени свободы (df). Другими словами, контролируя степени свободы, мы контролируем распределение.

Заявление студента

Распределение t используется, когда:

  • Мы хотим оценить среднее значение нормально распределенной совокупности по небольшой выборке.
  • Размер выборки менее 30 элементов, то есть n <30.

Из 30 наблюдений t-распределение очень похоже на нормальное распределение, поэтому мы будем использовать нормальное распределение.

  • Стандартное отклонение генеральной совокупности неизвестно и должно быть оценено на основе наблюдений за выборкой.

Пример

Мы предполагаем, что у нас есть 28 наблюдений случайной величины G, которая следует t-распределению Стьюдента с 27 степенями свободы (df).

Математически,

Поскольку мы работаем с реальными данными, всегда будет ошибка аппроксимации между данными и распределением. Другими словами, среднее значение, медиана и мода не всегда будут равны нулю (0) или точно такие же.

Мы представляем частоту каждого наблюдения переменной G с помощью гистограммы.

Может ли случайная величина G аппроксимировать t-распределение?

Причины считать, что переменная G подчиняется распределению t:

  • Распределение симметричное. То есть справа и слева от центрального значения одинаковое количество наблюдений. Кроме того, среднее значение и медиана обычно близки к одному и тому же значению. Среднее значение примерно равно нулю, среднее = 0,016.
  • Наблюдения с наибольшей частотой или вероятностью находятся около центрального значения. Наблюдения с меньшей частотой или вероятностью далеки от центрального значения.