Top.Mail.Ru
Ответы
Аватар пользователя
14лет
Изменено

Что такое парадокс Симпсона?

По дате
По рейтингу
Аватар пользователя
Новичок
14лет

Если совсем просто, то парадокс Симпсона заключается в том, что положительные факторы, зависимости или тренды внутри каждой группы кажутся отрицательными, когда группы объединяются.

В 70-х годах 20 века университет Калифорнии в Беркли получил повестку в суд. Прыткие абитуриентки обвиняли его в половом неравенстве: если брать мужчин, то из их числа было 44 процента поступивших. Из женщин поступали только 34 процента. Разница в 10% статистически значима и, казалось, склонность приемной комиссии к мужчинам налицо.

Но все было не так-то просто.

Чтобы показать, почему могут получаться такие результаты, я доведу цифры до экстрима (в университете Беркли были другие цифры и больше факультетов) . Предположим есть два факультета: астрономии и искусствоведения. И распределение поступающих и поступивших таково:

---------------------------Абитур мПост юношиПроцент Абитур жПост девПроцент
Астрономия ----------50-------20----------------40%---------10-----------10-----------100%
Искусствоведение---10 ----------0-------------0%-----------400-----------40------------10%
Всего--------------------60----------20-------------33%----------410----------50------------12%

На обоих факультетах взятых по отдельности процент принятых девушек больше, чем процент принятых юношей (100 против 40 и 10 против 0). Но скомбинированные вместе эти цифры дают процент принятых девушек в 12%, тогда как 40% всех юношей поступило. То есть девушки в Беркли поступали преимущественно на факультеты, где конкуренция была высока, а процент принятых соответственно низок, а мужчины -- наоборот. Беркли успешно защитился в суде.

Еще один иллюстративный пример парадокса Симпсона заключается в том, что у если у женщины рождается ребенок с недостатком веса, то шансы выжить у него выше, если мать курит. Нет-нет, я не ошибся в формулировке. Так что же получается, цифры говорят, что при беременности полезно курить?

Прежде чем я продолжу, позволю себе лирическое отступление. Цифры -- это всего лишь цифры. Они не говорят ни о чем, но их интерпретацией занимаются люди. Люди могут честно заблуждаться или откровенно лгать и повернуть картину под таким углом, чтобы окружающие увидели то, что надо, а не то что есть на самом деле. На эту тему даже пишутся книги. Из-за таких искажений и появляются высказывания типа "Есть три типа лжи: ложь, наглая ложь и статистика". Я бы вообще предложил законодательно запретить цитировать Бенджамина Дизраэли или кто там это сказал людям без соответствующего образования :) ибо они не ведают о чем говорят.

Так что там с курением? Если посмотреть на цифры повнимательнее то оказывается, что у курящих женщин рождается не в пример больше детей со сниженным весом, причина которому (сюрприз-сюрприз! ) -- курящая мать. У некурящих дети с низким весом рождаются реже, но уж когда рождаются то причиной тому скорее всего становится врожденная болезнь, генетическое отклонение или нарушения беременности. И это вещи куда посерьезнее курения (в данном конкретном случае) . Неудивительно, что смертность среди таких детей выше.

Источник: Не верьте слепо цифрам.
Аватар пользователя
Ученик
14лет
Аватар пользователя
Мыслитель
14лет

Основные интересы подобщества могут оказаться совсем не основными во всём обществе. Поэтому если два ряда данных соответствуют одной определённой гипотезе, будучи объединёнными, они могут соответствовать противоположной гипотезе.