Парадокс Берксона

Парадокс Берксона

Парадокс Берксона или ошибка Берксона — положение математической статистики, сформулированное Дж. Берксоном. Формулировка: два независимых события могут становиться условно зависимыми, если произошло некоторое событие. Этот вывод является контр-интуитивным для некоторых людей, и таким образом может быть описан как парадокс. Парадокс Берксона часто описывается в области медицинской статистики или биостатистики. Он является усложняющим фактором, появляющимся в статистических проверках соотношений.

Формальное определение

если 0 < P(A) < 1 и 0 < P(B) < 1, где A и B — некоторые события,
и P(A|B) = P(A) (то есть события независимы),
тогда P(A|B,C) < P(A|C) где C = AB (то есть A или B).

Иллюстрация на примере

Будем исследовать статистику случайного выбора почтовых марок из набора, рассматривая два независимых свойства марки: «редкость» и «красоту».

Предположим, что имеется 1000 марок, среди которых 300 красивых, 100 редких, причём 30 и красивы, и редки. Очевидно, изо всего набора 10 % марок редки, но и из всех красивых марок тоже 10 % редки, то есть красота марки ничего не говорит о её редкости.

Однако, если выбрать из всего набора (1000) все красивые марки и все редкие марки (таких марок 370), то в этой выборке редких марок будет уже 27 % (100 из 370), но из числа красивых марок редких все равно будет только 10 % (30 из 300). Тогда наблюдатель при анализе такой выборки (а не всего набора) увидит кажущуюся обратную зависимость между красотой и редкостью марки (если марка красивая, то вероятность ее редкости ниже). Но на самом деле такой связи нет.

Описанный результат математически полностью корректен, его «парадоксальность» связана с особенностями восприятия людей, которые склонны интуитивно полагать, что если два параметра независимы, то они остаются таковыми в любой выборке. В действительности же в случае предвзятости отбора выборки между независимыми параметрами могут возникать условные зависимости, приводящие, при распространении их на всю генеральную совокупность, к грубым ошибкам анализа.

Ссылки

  • Berkson, J. (1946) «Limitations of the application of fourfold tables to hospital data». Biometrics Bulletin, 2(3), 47-53.

Wikimedia Foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Полезное


Смотреть что такое "Парадокс Берксона" в других словарях:

  • Список парадоксов — …   Википедия

  • Парадоксы —       Служебный список статей, созданный для координации работ по развитию темы.   Данное предупреждение не устанавливается на информационные статьи списки и глоссари …   Википедия

  • Ошибка игрока — (gambler’s fallacy) или ложный вывод Монте Карло отражает распространённое ошибочное понимание случайности событий. Связана с тем, что, как правило, человек не осознаёт на интуитивном уровне того факта, что вероятность желаемого исхода не… …   Википедия

  • Систематическая ошибка отбора — статистическое понятие, показывающее, что выводы, сделанные применительно к какой либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу. Содержание 1 Ошибки отбора результатов 2 …   Википедия

  • Предвзятость выбора — Систематическая ошибка отбора статистическое понятие, показывающее, что выводы, сделанные применительно к какой либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу. Ошибки отбора результатов Могут включать… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»