Степени свободы - это комбинация количества наблюдений в наборе данных, которые изменяются случайным образом и независимо, за вычетом наблюдений, которые зависят от этих произвольных значений.
Другими словами, степени свободы - это количество чисто свободных наблюдений (которое может варьироваться) при оценке параметров.
Мы в основном проводим различие между статистикой, использующей параметры совокупности и выборки, чтобы узнать их степени свободы. Мы обсуждаем различия между средним значением и стандартным отклонением, когда параметры являются совокупностью или выборкой:
Популяция и параметры выборки
- Параметры популяции:
Поскольку в популяциях мы не знаем всех значений, степенями свободы будут все элементы популяции: N.
Обе статистики позволяют всем наблюдениям в наборе быть случайными, и поэтому каждый раз, когда мы оцениваем статистику, мы будем получать разные результаты. Тогда наблюдения, которые имеют полное право на изменение, - это все наблюдения совокупности. Другими словами, степенями свободы в этом случае являются все элементы популяции: N. По этой причине мы делим обе статистические данные на общий размер популяции (N).
- Параметры выборки (оценки):
В образцах мы знаем все значения.
Мы дифференцируем размер совокупности (N) с размером выборки (n).
Поскольку мы знаем все значения в выборках, у нас нет проблем с вычислением среднего, поскольку оно позволяет всем наблюдениям в наборе быть случайными.
В случае стандартного отклонения мы накладываем ограничение на степени свободы: все элементы выборки (n) и мы вычитаем 1 элемент.
Но … Почему мы вычитаем только 1, а не 5 или 10 элементов из выборки (n)?
Чем больше элементов мы вычитаем, тем больше у нас информации о параметре выборки, в данном случае стандартном отклонении.
Чем больше у нас информации, тем меньше свободы (степеней свободы) для выборочных наблюдений, чтобы принимать случайные значения. Чем больше элементов мы вычитаем из выборки, тем больше ограничений мы накладываем и тем меньше степеней свободы будет иметь параметр выборки.
Пример
Мы предполагаем, что едем в Андорру на финал Кубка мира по лыжным видам спорта, потому что нам очень нравится горные лыжи. Мы приносим карту, на которой указано, где расположены различные дисциплины, и указаны имена некоторых участников, но стартовый номер каждого участника не указан. Каждый раз, когда они произносят имя конкурента, мы стираем его имя. Поскольку список участников ограничен, наступит момент, когда мы узнаем имя участника, прежде чем он объявит его через спикеров.
Анализируем хронику с математической точки зрения:
- Размер выборки (n), потому что они говорят нам только имена некоторых участников.
- Каждый участник может стартовать случайным образом, порядок не имеет значения и не может участвовать снова (комбинации без повторов).
- Последним участником будет известный элемент (n-1). Тогда случайным образом могут выйти все остальные участники, кроме последнего, о котором мы точно знаем.
Прочтите пример степеней свободы