Достаточная статистика для параметра Θ - это статистика, способная собрать или суммировать всю информацию, которую содержит выборка случайной величины X.
Мы знаем, что статистика - это реальная функция выборки. То есть принимает реальные значения, содержащиеся в образце. Исходя из этого, как мы видели в статье, в которой определяется понятие статистики, мы должны гарантировать, что статистик обладает определенными свойствами. Зачем требовать такую недвижимость? Чтобы статистика была полезна для наших целей.
Достаточность - одно из таких свойств. Проще говоря, мы скажем, что статистики достаточно, если она использует всю информацию, содержащуюся в выборке.
Как узнать, достаточно ли статистики?
С логической точки зрения возникает вопрос: как я могу узнать, удовлетворяет ли T-статистика свойству достаточности? Или как мне найти статистику, которая удовлетворяет свойству достаточности, если она существует. Ответ на эти два вопроса можно найти в двух теоремах:
- Критерий факторизации Фишера-Неймана: Этот критерий утверждает, что при заданной статистике T, если она удовлетворяет определенным условиям, это будет достаточной статистикой.
- Теорема Дармуа: Эта теорема отвечает на второй вопрос. То есть он позволяет нам найти достаточную статистику с помощью ряда процедур.
Пример достаточной статистики
Предположим, мы хотим рассчитать средний годовой доход семей, проживающих в Чили. Для этого мы будем следовать следующему процессу:
- Собираем информацию (образец): Поскольку мы не можем спрашивать каждую семью, проживающую в Чили, сколько они зарабатывают ежегодно, мы возьмем репрезентативную выборку, например, из 1000 семей.
- Определите изучаемую случайную величину: Исследуемая случайная величина - семейный доход. Таким образом: X → Семейный доход.
- Выберите правильную статистику: Подходящая статистика для расчета среднего дохода - это не что иное, как ожидание X. Другими словами, выборочное среднее X.
- Как я могу узнать, является ли статистика выборочного среднего достаточной статистикой? Поскольку у нас уже есть математическое выражение статистики, мы будем использовать критерий факторинга Фишера-Неймана. Или теорема Дармуа. Это формулы, созданные для этой цели.
После проведения надлежащих расчетов мы заключаем, что статистика выборочного среднего соответствует требованию или свойству достаточности. Убедившись, что он соответствует этому требованию, мы гарантируем, что эта (статистическая) функция, которая позволяет нам синтезировать информацию (средний доход), использует всю информацию, содержащуюся в выборке (1000 семей).
Почему так важно использовать всю информацию в образце?
Теперь, когда мы знаем, что выборочное среднее является достаточной статистикой, давайте предположим случай. Какой смысл рассчитывать средний доход на основе этих 1000 чилийских семей и что мы используем данные только о 500 семьях?
Конечно, в этом нет никакого смысла. Нам нужна сводка всей информации. То есть то, что мы определили как достаточную статистику.