August 29th, 2019

Два примечательных статистических случая в гонке за демократическую номинацию

Два любопытных статистических случая произошли в гонке за демократическую номинацию на пост президента США. Первый: произвел сенсацию опрос Monmouth University, который дал Байдену всего лишь 19% и ниже, чем у Уоррен и Сандерса! В этом цикле опросы показывают часто очень разную картину. Вот скриншот ситуации на вчерашний день на сайте RealClearPolititcs. И, что примечательно: из-за такого ажиотажа сам Monmouth University выпустил заявление, что их опрос - статистический выброс! И тем не менее, если брать только отдельные опросы, то можно с одинаковым успехом описать гонку демократов следуюшим образом: "Байден занимает лишь третье место" и "Байден опережает Уоррен в разы". Оба будут верны.

Кстати, выборка в этом опросе для демократов была менее 300 человек. Так что совсем удивительным этот выброс назвать нельзя, хотя это все же примечательный случай и он запомнится - слишком уж большую сенсацию он произвел.

Нейт Сильвер тут верно заметил, что такие выбросы тем не менее публиковать нужно, вспоминая случай с последними выборами в Австралии. Кампании должны публиковать то, что получается, а не то, что публикуют другие фонды.



Второй случай: не попала на сентябрьские дебаты Тулси Габбард. Для сентябрьских дебатов с самого начала условия ставились уже жестче, чем для первых двух: на кампанию должны пожертовать деньги более 130 тыс. человек и минимум 2% в четырех общенациональных опросах или в опросах в ранних штатах. Первое условие она выполнила, а второе нет - только два опроса из необходимых четырех. Но опросы должны были быть из фондов, которые с самого начала поставил в список Национальный комитет Демократической партии (DNC), а другие не считаются. А вот с теми, которые не считаются, у ее четыре опроса набирается. Конечно, ее кампания негодует, но этот список составлялся задолго до того, как кто-то знал какие результаты покажут эти фонды. А у нее еще в 2016 г. был конфликт с Национальном комитетом Демократической партии! И тут, исходя из списка фондов, одобренных DNC, Тулси на дебаты не попадает, а если взять все фонды -то попадает. Как тут не поверить в заговор против нее? И тем не менее, ответ тут совершенно очевиден: Тулси просто банально не повезло! Я бы не ожидал, что до этого ответа дойдут многие из ее сторонников или в ее кампании, так как тут нужен анализ цифр и некоторое понимание статистики, а объяснение о заговоре, когда у нее был кофликт с DNC, просто напрашивается. Но я "на пальцах" объясню, как в таком случае работает везение и невезение.

У Тулси по стране по средним по данным RCP  (см. выше) 1,4%. В ранних штатах у нее ситуация примерно такая же. Начиная с конца июня, когда считаются опросы до этих дебатов, она всегда была в среднем в районе 1,0 - 1,5%. Но со средними 1,0 - 1,5% она вполне могла бы дойти до четырех опросов, которые бы показали 2% и больше. Эта вероятность "на глаз" должна была быть значительно больше 50%. Но карта могла лечь так, а могла иначе. Да и опросы же округляются до целых процентов. Где-то могло быть 1,4% и округлилось до 1%, а могло бы быть 1,5% и округлилось бы до 2%. Ей реально могло не хватить нескольких человек в опросах, а то и пары-тройки, выборка там как правило достаточно небольшая. А вот Хулиану Кастро, скажем, наоборот повезло! Он сразу в четырех общенациональных опросах и в одном в Айове получил 2%. Никогда у него не было даже 3%. Чаще 1% или даже 0. А в тех, где 2%, в реальности могло быть 1,5% или 1,6%. А среднее по стране сейчас 1,1%. Это примерно и соответствует уровню его популярности: чуть ниже, чем у Тулси. Но опросы имеют статистическую погрешность и она была более благосклонна к Кастро, чем к Габбард (да она еще и 3% набрала в опросе Emerson, который не считается). Опять же "на глаз" набрать 2% в четырех опросах при популярности 1%, вероятность была совсем не низкой, но ниже, чем у Габбард. У Яна и общенациональный рейтинг выше - 2,5%, поэтому тут ничего удивительного, что у него набралось 5 опросов с 2% и более: могло быть и больше. У Клобушар общенациональный рейтинг совсем низкий, но у нее относительно сильная кампания в Айове и она там получила более 2% сразу в трех опросах и это помогло ей попасть на дебаты. Еще были три других более ранних общенациональных опроса, где она набрала 2% - тут ей уже скорее немножко повезло. Полная таблица по всем опросам и кандидатам тут, правда она устарела на несколько дней, но последние опросы там ничего не изменили.

Габбард не повезло, но куда больше не повезло Тому Стейеру. Ему не хватило всего одного опроса для попадания на дебаты! Но заговор против Стейера никак невозможно представить: он же миллиардер и один из главных спонсоров Демократической партии! Причем, ему не повезло не только потому, что ему не хватило всего одного опроса, а Тулси два, но и потому, что опросов было мало, после того как он стал активно вести кампанию в ранних штатах.  У него там вообще доходит до нескольких процентов, потому что он туда вбухал кучу своих личных денег. А опросов мало в ранних штатах, потому что качественные телефонные опросы стало проводить дорого: мало кто отвечает на звонки и приходится звонить куда большему числу людей, чем раньше. Если бы кто-то провел еще хотя бы один опрос в Айове, Нью-Гэмпшире или в Неваде, он там почти точно набрал бы более 2%, и попал на дебаты. Если Габбард просто не повезло, то Стейеру просто дико не повезло! Хотя я как раз хотел, чтобы Тулси на дебаты попала, а Стейер нет, потому что он просто пытался "купить" себе место на дебатах и лишь из-за этого дикого невезения не достиг своей цели!