Статистический знак - что это такое, определение и понятие

Содержание:

Anonim

Статистическая выборка - это подмножество данных, принадлежащих к совокупности данных. С точки зрения статистики, он должен состоять из определенного количества наблюдений, которые адекватно представляют общие данные.

Статистика как раздел математики отвечает за сбор, упорядочение и анализ данных. Другими словами, когда мы хотим изучить определенное явление, мы обращаемся к статистике. Хорошим примером феномена, изучаемого статистикой, является средняя заработная плата граждан страны.

В этом смысле по причинам времени и стоимости мы не можем собрать все данные. Эта совокупность данных известна как совокупность данных или просто совокупность данных.

Почему вы работаете со статистическими выборками?

Чтобы объяснить, почему вместо генеральной совокупности используется статистическая выборка, мы обратимся к приведенному выше примеру.

Предположим, мы хотим изучить какое-нибудь явление. В нашем случае это средняя заработная плата граждан страны. В совокупность данных входят все работники в стране. Конечно, по причинам времени и затрат было бы невозможно спросить каждого рабочего, какова его годовая зарплата. Это займет много времени или нам потребуется много ресурсов.

Здесь появляется понятие статистической выборки. Вместо того, чтобы спрашивать миллионы сотрудников в стране или регионе, мы собираем лишь небольшой объем данных. Например, мы опросили 100 000 человек. Это все еще сложная задача, но спросить 100 000 человек гораздо доступнее, чем 30 миллионов.

Этот небольшой объем данных должен быть репрезентативным. То есть он должен адекватно представлять население. Если 100 000 человек, которых мы опрашивали, сосредоточены в богатых кварталах, мы получим данные, которые не являются репрезентативными. Средняя зарплата была бы намного выше, чем есть на самом деле.

Характеристики репрезентативной статистической выборки

Если вы хотите провести хорошее исследование, важно качество статистической выборки. Бесполезно выполнять самые сложные статистические показатели с помощью самых сложных моделей, если статистическая выборка смещена. То есть, если выборка не репрезентативна.

При получении репрезентативной выборки есть определенные аспекты, о которых исследователь должен знать заранее. Среди этих аспектов - характеристики репрезентативной выборки. Характеристики репрезентативной выборки следующие:

  • Достаточно большой размер: Когда мы работаем с выборками, мы обычно работаем с количеством данных, меньшим, чем генеральная совокупность. Однако для того, чтобы статистическая выборка была репрезентативной, она должна быть достаточно большой, чтобы считаться репрезентативной. Например, если наша популяция состоит из 10 миллионов данных, и мы выбираем 10, это трудно быть репрезентативным. Конечно, более крупная выборка не всегда более репрезентативна.
  • Случайность: Выбор данных из статистической выборки должен быть случайным. То есть он должен быть абсолютно случайным. Если вместо того, чтобы делать это случайным образом, мы выполняем запланированный процесс отбора данных, мы вносим систематическую ошибку в сбор данных. Следовательно, чтобы избежать предвзятости выборки и, следовательно, сделать ее репрезентативной, мы должны сделать случайный выбор.

Статистические выводы

После получения репрезентативной выборки необходимо вывести определенные показатели. Часто нас интересует определенная величина переменной. В начальном примере переменной будет зарплата граждан страны. В этом смысле метрика, которую мы хотим проанализировать, - это средняя зарплата граждан страны.

Другими словами, у нас есть данные, состоящие из всех рабочих Мексики. Из этой совокупности мы получаем переменную, то есть годовую зарплату. Используя соответствующие методы, мы получаем репрезентативную выборку. И, наконец, когда у нас есть набор данных, с которым мы можем работать, мы используем методы статистического вывода для расчета средней заработной платы.

Конечно, как только у нас будет набор данных, мы сможем вывести другие меры. Например, как распределяется заработная плата, какой процент рабочих ниже определенной зарплаты или насколько велик разрыв в заработной плате.

Пример статистической выборки

Предположим, мы хотим провести исследование средних расходов колумбийских семей в январе. Для этого у нас есть два варианта:

  1. Введите банковские счета всех семей в Колумбии
  2. Спросите репрезентативное количество людей

Первый вариант нежизнеспособен по нескольким причинам. Во-первых, семьи не собираются отказываться от своих данных, а во-вторых, мы не можем переходить от одной семьи к другой, просматривая данные. В основном потому, что население Колумбии приближается к 50 миллионам. Между тем, второй вариант - это сбор статистической выборки.

Что мы сделаем, следуя указанным выше характеристикам, так это спросим у 100 000 семей. Это несколько сложно, но намного проще, чем спросить 50 миллионов колумбийцев. Разница значительная. Таким образом, на основе выборки из 100 000 семей мы попытаемся подсчитать средние расходы семей в январе.

Извлеченные данные будут более или менее надежными в соответствии с рядом показателей, которые учитываются в статистических исследованиях. Конечно, эти типы показателей являются более продвинутыми, поэтому мы не будем их здесь обсуждать.