?

Log in

No account? Create an account
Журнал Александра Киреева: о политике, выборах и не только. [entries|archive|friends|userinfo]
Александр Киреев

[ website | Электоральная география ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

О нарисованном результате референдума в Севастополе [Nov. 5th, 2014|08:24 am]
Александр Киреев
[Tags|, , ]

В комментах к посту о нарисованных результатах в ДНР, некий аноним заметил то, что пока никто из нас до сих пор не заметил: результаты референдума о присоединении Севастополя тоже совпали с точностью до человека! Мы все внимательно смотрели на Крым, но там проценты не совпали с точностью до человека, хотя, на мой взгляд, они все равно там как минимум частично рисовались. Итак:

Официальные данные по городу Севастополю

Вы за воссоединение Крыма с Россией на правах субъекта Российской Федерации? 262041 95.6 %
Вы за восстановление действия Конституции Республики Крым 1992 года и за статус Крыма как части Украины? 9250 3.37 %
Действительных голосов 271291 98.97 %
Недействительных голосов 2810 1.03 %
Всего голосов 274101 100 %
Общее число зарегистрированных избирателей 306258
Явка 89.5 %


Видим нарисованную цифру проголосовавших - 274101/306258=0,895000
цифра "за" - 262041/274101=0,95600


Попадание с точностью до человека сразу по двум позициям! Но, согласен, не по всем: нет попадания по недействительным и за Украину. Но этому как раз можно придумать много объяснений, а вот попадание с точностью до человека именно по двум самым важным позициям: явка и за Россию, уже может быть объяснена только очень маловероятной случайностью или же тем, что сначала они выдумали эти проценты, а уж потом из них вычисляли абсолютные цифры.

Кстати, официального протокола с этими цифрами я не нашел (почему, ведь это историческое событие, которое и основано на этих цифрах?). Эти цифры пробиваются по многим источникам в Гугле или Яндексе. Более того, у нас есть видео, на котором председатель избиркома Севастополя Валерий Медведев озвучивает именно эти цифры на заседании Городского совета. То есть сомнений нет: это официальные цифры референдума.

Я понимаю, что для сторонников присоединения Крыма - это больная тема. Но я им советую не торопиться с гневными комментариями, а посидеть и понять, что математика безразлична к вашим патриотическим чувствам, и в данном случае она явно не на вашей стороне.

update:  Процент "за Украину" у них видимо тоже посчитанный - только криво
9250 - это ровно 3,53% (3,52998%)от ... 262041. То есть от количества голосов "за Россию". Не на ту строчку умножили. Ну а недействительные просто написали по остаточному принципу: 100% минус за Россию и минус за Украину. Вот и вся разгадка.
Спасибо barouh
linkReply

Comments:
[User Picture]From: kireev
2014-11-05 09:03 pm (UTC)
Это слишком громко сказано: теоритические основы выводов. Я же не математик, а специалист по выборам. Более того, я даже был не первый, кто такое рисование заметил. Из людей, которых я знаю, первым был юзер papa_lyosha, который заметил рисование в мае в ЛНР http://kireev.livejournal.com/1028784.html?thread=23138480#t23138480

Другая версия объяснения того же самого http://kireev.livejournal.com/1096110.html

Еще было несколько таких же объяснений в комментах к постам. Не знаю, получится ли лучше объяснить у меня, но постараюсь.

Если умножить общее число бюллетеней на процент (десятые или обычно сотые доли процента - обычно на выборах в РФ и на Украине до сотых сообщают) за какого-то кандидата и округлить до одного человека, то мы получим некое число. Но не только это число составляет такой же процент от общего числа бюллетеней, таких чисел еще может быть сто или больше и все они будут округляться до такого же процента. Но из всех этих чисел было выбрано лишь то, которое получается при обратном вычислении, то есть когда сначала берется процент и из него вычисляются абсолютные цифры. И так получается для каждого кандидата, явки, недействительных. Это значит, что сначала брались проценты, а потом из них вычислялись абсолютны цифры, следовательно результат был нарисован и не базируется на подсчете голосов.
(Reply) (Parent) (Thread)
[User Picture]From: fenixstorm
2014-11-05 09:16 pm (UTC)
Спасибо!

Там, кстати, в комментариях (их мало, почитайте, это интересно), вот что выплывает: наверное, ваши выводы верны, но похоже, что было бы полезно вам для себя дать ответ на поставленные в посте и комментах вопросы, а потом написать отдельный пост с методологией. Это сразу повысит достоверность ваших расследований для придирчивых, но добросовестных, людей. Которых вообще-то довольно много. :-)
(Reply) (Parent) (Thread)
[User Picture]From: kireev
2014-11-05 09:20 pm (UTC)
Собственно, я для этого и сделал пост со ссылкой на avva с доступным (как мне показалось) объяснением. http://kireev.livejournal.com/1096110.html
(Reply) (Parent) (Thread)
[User Picture]From: irumata
2014-11-05 10:07 pm (UTC)
Меня Леша попросил здесь тоже написать ответ.
Такая логика гораздо более понятна. Но и у нее есть определенный изъян.
Он состоит в том, что изначально не фиксируется выборка и предположение.
Чтобы точно сказать, почему данные выборы отличаются, необходимо описать список критериев по которым мы смотрим и доли процента, по которым смотрим округление.
В вашем случае видится логичным взять 5 критериев и сотые доли процента. Тогда вероятность что встретим хотя-бы одно такое значание 26 процентов. Два значения существенно меньше около процента, но все-равно не исчезающе мало. Но дело в том, что в изначальном предположении никто не говорит о необходимости двух критериев, и почему наличие двух необходимо или почему именно два нам будут о чем-то говорить.
Резюмируя, я согласен что есть серьезные основания так считать (всмысле, я и так уверен в фальсификациях, так как их там видел), но если отринуть все остальные свидетельства мне кажется ваших цифр недостаточно.
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2014-11-05 10:55 pm (UTC)
"Вы не сказали заранее, что критерием подкрученной рулетки будет выпадение именно тройки и именно 8 раз подряд, так что все ваши предположения, что стол испорчен - не более чем предположения" (это если утрировать сказанное Вами)
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2014-11-05 11:15 pm (UTC)
и потом - почему 5 критериев и 26 процентов?

независимых процентных величины там всего три - явка, % за Россию от всего проголосовавших, % за Украину от всего проголосовавших (доля недействительных считается автоматом как 100% минус предыдущие две величины)

при размере базы в 260-270 тысяч вероятность попадания одной отдельной цифры в ближайшее к целому промилле натуральное число составляет менее 0,04% (1/2600). Вероятность, что среди трех чисел хоть раз случится такое совпадение - 0,11%. Вероятность двух попаданий из трех - 1 случай на 2,3 миллиона
(Reply) (Parent) (Thread)
[User Picture]From: nonenoun
2014-11-06 02:38 pm (UTC)
при размере базы в 260 тысяч вероятность попадания одной отдельной цифры в ближайшее к целому промилле натуральное число составляет менее 0,04% (1/2600).
Промилле - это 0.1%?
260 000 * 0.001 = 260.
1/260 = 0.4% Откуда ещё один порядок взялся?
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2014-11-06 04:16 pm (UTC)
Ох, да. Я на целый разряд ошибся
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2014-11-06 04:20 pm (UTC)
Я ошибся, на что обратили мое внимание. Исправленный расчет:

при размере базы в 260-270 тысяч вероятность попадания одной отдельной цифры в ближайшее к целому промилле натуральное число составляет менее 0,4% (1/260). Вероятность, что среди трех чисел хоть раз случится такое совпадение - 1,1%. Вероятность двух попаданий из трех - 0,04% или 1 случай на 2600 "испытаний"

Редкое везение :) Особенно если обратить внимание на то, как часто подобное везение случается в этом году на юге и востоке Украины (уже минимум трижды, и все время на пророссийских голосованиях)
(Reply) (Parent) (Thread)
From: a_shen
2014-11-06 09:11 am (UTC)

это общая проблема

математической статистики. Допустим, Вы в казино видите, что цвета чередуются: КЧЧКЧЧКЧЧКЧЧКЧЧКЧЧКЧЧ - и так 10 (или n) раз. Можно ли как-то определённо сказать, сколько раз нужно это наблюдать, чтобы сказать, что "случайное возникновение такой последовательности при честных бросаниях (К и Ч равновероятны, забудем про зеро) маловероятно - имеет вероятность менее 10^{-3}?" Нет, потому что слово "такой" тут не имеет точного смысла. Если мы говорим "такой" в смысле "ровно этой", то совсем немного, 10 бросаний, но тогда это же можно сказать про любую последовательность. Если мы под "такой" понимаем периодичность, то возникает вопрос, периодичность с каким периодом? ровно 3? не больше 3? не больше чего-то ещё? все эти варианты дают разные ответы. Так что вопрос о выборе конкретного множества не имеет "единственно правильного" решения. (Подробно о возникающих тут проблемах можно прочесть в приложении 1 к www.lirmm.fr/~ashen/kolmbook.pdf, там же есть и ссылки на другие книжки, где это обсуждается - с 17 века) В данном конкретном случае ситуация упрощается тем, что уже были аналогичные наблюдения на других выборах, т.е. проверялась по существу сформулированная до изучения данных гипотеза. Да, в ней есть некоторые параметры (какое число принимать за основу при умножении и пр.), но это максимум несколько десятков вариантов.
(Reply) (Parent) (Thread)
[User Picture]From: irumata
2014-11-06 09:51 am (UTC)

Re: это общая проблема

По сути тут, конечно, все верно. Как я писал в своем посте, такой взгляд уже вполне имеет право, однако не может служить доказательством, и вопросы еще остаются. Надо быть аккуратней с последним абзацем, я правильно понимаю что аналогичные наблюдения на других выборах были подтверждены, на основе чего мы сформировали гипотезу? Или мы получили неподтвержденное наблюдение и проверили его на вторых выборах?
Не странно ли, что проверили только на "крымских" выборах. Думаю было-бы интерерсно проверить аналогичное на выборах в аналогичном по количествую жителей городах России.
(Reply) (Parent) (Thread)
From: a_shen
2014-11-06 10:17 am (UTC)

Re: это общая проблема

"Доказательство" в математической статистике и вообще экспериментальных науках и не бывает стопроцентным, и, более того, даже указать точно, насколько оно процентное, невозможно, элемент неопределённости остаётся.

Про историю подобных наблюдений - почитайте журналы Киреева и его коллег, их было много, сначала "референдум" ЛНР, потом недавние "выборы" в Донецке, и вот теперь пришла в голову идея посмотреть, что в Крыму - и, что называется, "отродясь не было, и вот опять". Что касается статистических наблюдений на российских выборах, то их было множество. Разница в том, что в России публикуются данные по участкам, соответственно, такие круглые проценты надо искать по участкам, а потом данные складываются. И да, такое обнаруживается в виде: 1) пиков на гистограмме и 2) распределении последних цифр. Про это тоже можно найти много записей; на более старые есть ссылки в обзоре http://arxiv.org/abs/1204.0307, а какие-то данные воспроизведены прямо там. Последние я уже систематически не отслеживал, но видел много - например, http://avsmal.livejournal.com/24683.html, и, кажется, про эти выборы была замечательная вертикальная прямая постоянной явки на двумерной картинке, но сейчас ссылки не вспомню...
(Reply) (Parent) (Thread)
[User Picture]From: irumata
2014-11-06 10:39 am (UTC)

Re: это общая проблема

Да ссылки интересны, я эти данные тоже видел правда в других местах. Но они-же не имеют прямого отношения к нашему случаю.
Про референдумы и выборы понятно, наверное остается на большом наборе данных только посмотреть что на "нормальных" выборах, такого не встречается никогда.
(Reply) (Parent) (Thread)