Предвзятость выживания - что это такое, определение и концепция

Содержание:

Anonim

Смещение выживаемости - это смещение, которое возникает при сборе данных, когда данные исключаются из анализа, потому что сегодня их больше нет.

Эта предвзятость возникает в самых разных контекстах, когда мы сосредотачиваемся только на тех «сохранившихся» данных. Пример этого можно увидеть, когда компании опрашивают своих клиентов об одном из своих продуктов. Но они оставляют своих неклиентов, которыми в данном случае будут «нежившие», в забвении.

В этом случае делать выводы из этого исследования было бы неправильно. Поскольку результаты будут смещены только к «выжившему» населению. И они не будут репрезентативными результатами.

Предвзятость выживания на практике

Яркий пример такой предвзятости можно увидеть при изучении результатов инвестирования фондов. Большинство баз данных включают только те средства, которые существуют сегодня. Независимо от средств, которые существовали в прошлом.

Причина, по которой они не существуют сегодня, заключается в том, что их показатели были хуже, чем у «выживших». Или даже несколько фондов были объединены в один. Поэтому анализ проводится по тем фондам, которые дают наилучшие результаты. И это предубеждение приводит к завышению эффективности выборки этих фондов.

Основная проблема здесь уже не просто в переоценке результатов деятельности фонда. Скорее, выбранная выборка не будет случайной выборкой из всей совокупности. И, следовательно, результаты исследования могут не быть репрезентативными для населения. В конце концов, это именно то, что мы ищем при отборе случайной выборки населения.

Решение проблемы выживания

Представим, что мы хотим выбрать инвестиционный фонд для инвестирования на основе его поведения в прошлом. Чтобы избежать этой предвзятости в отношении выживаемости и оптимизировать этот выбор, мы должны выполнить следующие шаги:

  • Выберите временной горизонт, с которым мы планируем работать. Например, десять, пятнадцать или двадцать лет истории.
  • Возьмите все существующие фонды с начала временного горизонта, существуют ли они в настоящее время или нет.
  • Оттуда выберите образец из этой совокупности для изучения поведения.

Идея состоит в том, чтобы, в конце концов, получить случайную выборку населения. А отсюда и выводы, если они могут быть репрезентативными для этой популяции.