?

Log in

No account? Create an account
О нарисованных результатах выборов в Саратове - Журнал Александра Киреева: о политике, выборах и не только. [entries|archive|friends|userinfo]
Александр Киреев

[ website | Электоральная география ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

О нарисованных результатах выборов в Саратове [Sep. 20th, 2016|07:09 am]
Александр Киреев
[Tags|, , ]

В комментах привлекли мое мнение к нарисованным результатам выборов в Саратове. Я как глянул: мама родная...

Было бы наивно полагать, что рисование, а не просто фальсификация результатов, будут только в республиках. Пожалуй, это самый большой по объему случай рисования результатов в русских областях из тех, что я помню.  Таблица всех участков города под катом (кроме спец. участков). Опять же жирным шрифтом я отметил копирующиеся результаты. Я знаю: не все, но достаточно для того, чтобы понять смысл происходящего. На некоторых участках, однако, результаты выглядят нормально - я их тоже отметил. Но все же подавляющая часть участков - явно нарисованные. Саратов все же город немаленький: то есть сотнями тысяч голосов просто подтерлись. Люди зря шли на участки, даже голоса за Единую Россию учтены не были. Я это называю "интеллектуальным банкротством", если, конечно, они за ЕР голосовали добровольно.

Кстати, 62% за ЕР оказалось так много, что даже на графике результатов по стране видно (там же есть обсуждение в комментах).

Update: kobak заметил, что они просто вычисляли исходя из 40% за ЕР от списочного состава избирателей. Так и есть, я добавил эту колонку в таблицу. Причем, совпадение: ровно на 40 участках попадания ровно в 40,0%!

Update2: в Саратовсе нарисованы проценты за все партии, а не только за парламентские! Там же полная таблица.






Update: поскольку пост привлек внимание, во-первых, вот как это выглядит на графике (спасибо konst90)


Во-вторых, сразу несколько кремлеботов кричат "где исходные данные?" "Нет такого на сайте избиркома!" Вот исходные данные:

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796072&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135285&type=233

http://www.saratov.vybory.izbirkom.ru/region/saratov?action=show&global=true&root=642000026&tvd=26420001135271&vrn=100100067795849&prver=0&pronetvd=0®ion=64&sub_region=64&type=233&vibid=26420001135271

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135250&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135249&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135248&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&root=642000013&tvd=26420001135258&vrn=100100067795849&region=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135258&type=233

Update2: и еще отдельный пост об этом.

Update 3. И результаты по одномандатным округам нарисованы.

Update 4: Совпадает число бюллетеней за партии и одномандатников.

Update 5: о Саратове уже столько, что ввел для него тэг "Саратов", по нему теперь можно найти все посты об этом.
linkReply

Comments:
[User Picture]From: kobak
2016-09-26 08:17 pm (UTC)
Что значит "правильное округление"? Я имею в виду обычное округление к ближайшей десятой доли процента.

"Саратовская область - Саратовский" не выделяет г. Саратов. Вам нужны ТИКи (а не ОИКи), которые начинаются с "Саратов," (с запятой). Таких ТИК шесть штук.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 06:08 am (UTC)
Это писали Вы?

> Лучше качать файл от 23го сентября, там должно быть 96869 участков. Из них в Саратове 373 (в шести ТИК), если я не ошибся. Из них на 111 ЕР набирает 62.2% плюс минус 0.05%. Сейчас специально всё это пересчитал.

> Я предлагаю обсуждать именно этот бин (0.1%) и именно эти числа: 111 из 373 в бине 0.1% на 62.2%.


Ну так я все правильно тогда посчитал. Поскольку вот все участки:

> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),2]))

163 Саратовская область - Саратовский 
                                  373 
> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),3]))

       22 Новобурасская           26 Петровская   35 Саратов, Кировская 
                     25                      50                      63 
  36 Саратов, Ленинская 38 Саратов, Фрунзенская     39 Саратовская -163 
                    115                      25                      11 
         41 Татищевская          42 Светловская 4 Базарно-Карабулакская 
                     29                       4                      30 
           8 Балтайская 
                     21 



Никаким "просто округлением" бин высотой в 100 там не получается.

(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 09:29 am (UTC)
Это писал я. Еще раз: Вам нужно выбирать не "Саратовская область - Саратовский" из второй колонки (ОИКи), а "Саратов, " из третьей колонки (ТИКи). Ваша выборка -- это пол-Саратова и несколько прилежащих районов области. Если в этой ОИК тоже 373 участка, то это странное совпадение, которое и привело к путанице.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 04:09 pm (UTC)
Тут графики скриняться, поэтому словами.

Все что делалось, это стимулировали явку. Когда достигались оба параметра (по любому из них "превышение" ничего плохого не означает для организаторов) "явка" + "доля голосов за" стимуляцию явки _просто_прекращали_.

Запрещено это или разрешено --- звонить и пинать что бы обязательно шли голосовать (понятно что звонят принципиально всем, все равно за текущую ситуацию большинство :) я не знаю.

Иначе никакого смысла в "треугольнике" (с существенно размытой вершиной) на тернарном графике нет.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 04:16 pm (UTC)
1) Ну выложите график на imgur.com или куда-нибудь, это делается в один клик.

2) Вы убедились в наличии 110 участков в бине 0.1% в Саратове? Хотелось бы ясного подтверждения, а то Вы как-то резко бросили тему.

3) Как, по-Вашему на участке могут онлайн мониторить долю голосов за ЕР? Вы в курсе, что заполненные бюллетени бросают в урну (причем в свернутом виде), никому не показывая?

4) Если могут мониторить только явку, то как получается 110 участков в бине 0.1% вокруг результата 62.2%? Симуляцию, пожалуйста.

Edited at 2016-09-27 04:18 pm (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 07:56 pm (UTC)
1. А что ссылки тут не сделают "пост не раскрываемым"? Вы лично хоть видите заскриненый ответ?

2. С такой решительностью что то утверждая следует быть точнее. Нет, 110 при обычном округлении там нет.

> table(round(data[grep("Саратов,",data[,3]),26]/rowSums(data[grep("Саратов,",data[,3]),23:36]), 3))

 0.32 0.363 0.402 0.406 0.412 0.413 0.471 0.475 0.489 0.491 0.497 0.499 0.508 
    1     1     1     1     1     1     1     1     1     1     1     2     1 
0.512 0.513 0.525 0.532 0.533 0.534 0.538 0.541 0.544 0.551 0.561 0.563 0.564 
    1     1     1     1     1     1     1     2     1     1     2     1     1 
0.568 0.569 0.584  0.59 0.592   0.6 0.605 0.606 0.607  0.61 0.611 0.614 0.616 
    1     1     1     1     1     2     1     2     1     2     1     2     1 
0.618 0.619  0.62 0.621 0.622 0.623 0.624 0.625 0.626 0.627 0.628 0.629  0.63 
    2     1     5    15   107    31    16     7     9     6     2     3     2 
0.631 0.632 0.633 0.634 0.635 0.636 0.637 0.638  0.64 0.642 0.643 0.644 0.646 
    2     2     1     1     2     1     1     2     2     1     1     1     1 
0.647 0.649  0.65 0.651 0.653 0.654 0.656 0.658 0.661 0.663 0.664 0.665 0.666 
    2     1     3     7     1     4     1     1     2     2     1     1     2 
0.668  0.67 0.671 0.672 0.673 0.675  0.68 0.682 0.685 0.695 0.698 0.699   0.7 
    1     1     1     1     1     2     2     3     1     1     1     1     1 
0.704 0.705 0.706  0.71 0.711 0.714 0.717 0.721 0.722 0.725 0.726 0.728 0.731 
    1     1     1     1     1     2     1     1     1     2     1     1     1 
0.733  0.74 0.748  0.75 0.751 0.752 0.753 0.754 0.755 0.758 0.777  0.78 0.797 
    1     1     1     1     4     1     3     1     3     1     1     1     1 
0.799 0.804 0.808 0.834  0.84  0.88 0.891 0.896 0.912 0.926 0.942 0.948 0.951 
    1     1     1     1     1     1     2     1     1     1     1     1     1 
0.955 0.958 0.964 0.969 0.978 0.983 0.994     1 
    1     1     1     1     1     1     1     2 
> table(round(data[grep("Саратов,",data[,3]),26]/rowSums(data[grep("Саратов,",data[,3]),23:36]), 2))

0.32 0.36  0.4 0.41 0.47 0.49  0.5 0.51 0.52 0.53 0.54 0.55 0.56 0.57 0.58 0.59 
   1    1    1    3    2    2    3    3    1    3    4    1    4    2    1    2 
 0.6 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69  0.7 0.71 0.72 0.73 0.74 0.75 
   2    9  182   33    9   19    7   10    6    1    5    5    4    5    1   13 
0.76 0.78  0.8 0.81 0.83 0.84 0.88 0.89  0.9 0.91 0.93 0.94 0.95 0.96 0.97 0.98 
   2    2    3    1    1    1    1    2    1    1    1    1    3    2    1    2 
0.99    1 
   1    2 



Там 107 совпавших именно в десятых процента (или у меня опять не те данные?)

3. Значит с возможностью мониторить явку и пропорционально её уровню стимулировать явку Вы согласны?

ОК, зафиксируем.

Вы тоже что то более _однородное_ распределение голосов по участкам обсуждать не желаете и с этой темы куда то "пропадаете" :).

( Что касается возможности узнать как голосуют: А что "те кого можно уговорить прийти на выборы по просьбе" будут как то голосовать "не особенно"? Наверное раз смог позвать авторитетный для них человек, то и они консолидируются с его мнением.)

4. Вот это вполне возможно, поскольку размерность ситуации падает. Тут надо считать сколько является без "позвали", потом доливать теми кого "позвали для % явки".

Блин дофига параметров что бы учесть явно видную "борьбу за явку". Сомневаюсь что здесь вот так вот просто семплер можно составить, что бы показать что случайно, а что нет.

Надо узнать сколько "по доброй воли" приходит, и потом досыпать "сагитированными помочь явке"... но это по любому делает распределение "большой партии" боле однородным чем чисто случайное. Фактически мы досыпаем уже не близко к 50%, а наоборот к 95%. Это при обычной симуляции резко до сотни подбрасывает вероятность совпадения.

Но даже если у меня получиться, скажут что это не отличается от "вброса"? :) Или Вы согласны с этими посылками?

Блин устал я семплеры писать, надо и поспать когда :) Если завтра силы будут на эту политоту то можно продолжить.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 08:33 pm (UTC)
1) Заскриненный ответ не вижу, увы. При желании ссылку можно запостить с пробелом посередине или еще-нибудь, чтобы жж не распознал.

2) Надо делить не на сумму голосов за все партии, а на сумму действ. + недейств. бюллетеней (можно еще кол-во недейств. прибавить к сумме по всем партиям). В Саратове почти везде недействительных ноль (что уже ясный признак тотального фальсификата, кстати), но кое-где все же попадаются, отсюда, вероятно, и расхождение между 107 и 111. Но это незначительные детали; то, что участков в бине 0.1% более ста, мы можем уже, как Вы говорите, "зафиксировать".

3а) С теоретической возможностью "мониторить явку и пропорционально её уровню стимулировать явку" я согласен, да. Зафиксировали.

3б) Насчет "более однородного" распределения по участкам я пока не понял Вашу мысль. Более однородное распределение -- это какое, например? Лучше всего будет, если Вы сделаете симуляцию и предъявите какое-нибудь распределение, которое дает больше ста участков с 62.2%.

4) Не совсем понял, попробую уточнить Вашу предполагаемую схему. Есть некая нестимулированная явка 0<p1<0.643 (или сколько там в Саратове обычно) и некий нестимулированный результат ЕР 0<p2<0.622. Люди приходят биномиально и голосуют биномиально. Когда все эти люди пришли и проголосовали, и участок опустел, в участке звонят верным сторонникам ЕР, которых знают поименно и которые до сих пор сидели дома и выжидали, и приглашают их придти проголосовать. Зовут ровно столько людей, чтобы явка получилась ровно 64.3%. При этом эти верные сторонники голосуют за ЕР с вероятностью p3 близкой к единице (или даже ровно единица?). В итоге получается некий, заранее комиссии неизвестный, результат ЕР. Так? Ну в общем да, было бы любопытно, если бы Вы смогли предъявить некий набор параметров этой модели, при котором на ста участках будет получаться 62.2% в бине 0.1%. Мне так сходу неочевидно, что это возможно. (В скобках я напомню, что мы пока обсуждаем только 62.2% за ЕР, но результаты остальных партий в Саратове тоже сконцентрированы в 0.1% бинах; как Ваша модель, если я ее верно понял, может это объяснить, мне неведомо. Но для начала можно сосредоточиться на результате ЕР.)
(Reply) (Parent) (Thread)
[User Picture]From: kireev
2016-09-27 09:52 pm (UTC)
Сейчас все расскринил.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-28 04:46 am (UTC)
4. Да, практически после "естественной явки" (с неизвестным ни для кого результатом, ну кроме "среднего по больнице") не дотянувшей до "назначенного минимума" (в там практически везде как я понимаю явка низковатая) начинаются звонки по списку избирателей "придите и спасите, а то нас потом того за то что вы не пришли".

Естественно даже без какого либо заговора (что звонят только "верным людям" или это вообще "карусельщики") откликаются на такие просьбы "по телефону" просьбы "представителей власти" преимущественно люди которые тоже "за власть".

Ну а симуляцию мы выше делали -- чем дальше от 0.5 доля голосов, тем выше бин. И для доли в 0.95 или 0.99 бин также подскаивает в 100 и выше , как и для "малой партии" в 0.05 или 0.01 доле выборщиков.

Ну а поскольку у нас слагаемые ста процентов, то совпадение кучи участков "за большую" неплохо так определяет шансы и так высокие "за малую".

Семплер надо писать, в нем неизвестная величина --- "нестимулированная явка".
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-28 09:54 am (UTC)
Ну а симуляцию мы выше делали -- чем дальше от 0.5 доля голосов, тем выше бин. И для доли в 0.95 или 0.99 бин также подскаивает в 100 и выше , как и для "малой партии" в 0.05 или 0.01 доле выборщиков.

Это я понимаю, но в данном случае нам требуется получить результат 62.2%, а не что-то близкое к нулю или к ста.

Короче говоря, сценарий интересный. По-моему, он описывается (как минимум) тремя параметрами, как я написал выше: нестимулированная явка, нестимулированный результат ЕР, стимулированный результат. Последний для простоты можно положить равным единице. Нестимулированная явка должна быть в интервале процентов от 20 до 50, иначе "нефизично". Нестимулированный результат где-то тоже в этом интервале.

Как можно таким образом получить спайк на 62.2%, я не вижу, так что будет интересно, если у Вас получится продемонстрировать работающий сценарий.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-28 02:34 pm (UTC)
1. Естественно просить "именно 62.2%" это бессмысленно, поскольку очевидно, что максимум придется в некую случайную окрестность среднего с поправками на "двухэтапность" голосования -- "свободный приход тех кто и так пришел бы" переходящий в "придите а то нас накажут а мы вам так помогали".

2. Раз расскринили тернарные графики на них хорошо видно, что свободный приход (как хорошо иногда использовать нормальный бин в гистограммах :) приходится на 20-30% от списка выборщиков и потом уже начинается "стимуляция" в целях достижения приличной явки.

В Саратове очевидно гнались за 60-70% явки.

То есть случайно приходят условно 25% от размера участка, а потом приходит поток "спасать явку", дополняя до 65% уже состава 95-99% "лояльных к просьбам прийти"?

Семплер 27% заполняем выборкой "за с вероятностью 62.5", оставшееся 73% заполняем "за с вероятностью 90%"

Такие предпосылки Ок?

PS Хотя возможно в числе активистов откликающихся на просьбу прийти будут любые лояльные "текущей ситуации", а это и ЛДПР и Коммунисты.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-28 02:47 pm (UTC)
1. Не понял - что значит бессмысленно? В Саратове именно 62.2% и наблюдается, задача модели -- объяснить этот факт. Нужно подобрать параметры модели (вероятности) так, чтобы получалось как раз 62.2. Ну то есть окей, если у Вас вдруг получится модель, которая производит пик на 63.2, то это уже будет интересно, но лучше уж тогда подкрутить параметры, чтобы как раз 62.2 получалось.

А, или Вы имеете в виду, что модель с фиксированными параметрами может стабильно производить пик, но каждый раз в разном месте? Было бы любопытно посмотреть на такую модель.

2. Про тернарные графики я не понимаю Ваш аргумент. Можете подробно расписать, на что там нужно смотреть, чтобы увидеть то, что Вы видите? Это вообще графики по Саратову или по стране? Что там в углах?

В Саратове очевидно гнались за 60-70% явки.

В Саратове пик явки (более ста участков в бине 0.1%) на 64.3%. Так что не 60-70, а вот именно 64.3%. Как Вы понимаете, чтобы обеспечить такую точность, нужно было попасть в нужное кол-во пришедших с точностью до пары человек. Но в рамках Вашей модели мы принимаем, что именно так комиссии и действовавали.

То есть случайно приходят условно 25% от размера участка, а потом приходит поток "спасать явку", дополняя до 65% уже состава 95-99% "лояльных к просьбам прийти"? Семплер 27% заполняем выборкой "за с вероятностью 62.5", оставшееся 73% заполняем "за с вероятностью 90%"

Ага, тут как раз три параметра. Вы ожидаете, что если это сделать, то в итоге получится сто попаданий в 0.1 бин? Давайте!

Edited at 2016-09-28 02:49 pm (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-28 04:05 pm (UTC)
Вы не понимаете принцип совпадения, или троллите, или боитесь что численный эксперимент покажет заветные "больше 100" и готовите "пути к отступлению".

Вот в классической задаче "о совпадении дней рождения", Вы будете требовать, что бы все дни рождения совпавшие пришлись "на 1 сентября"?
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: p2004r
2016-09-28 04:22 pm (UTC)
Про тернарные графики.

Это графики которые и являются _единственным_ корректным способом отобразить на графике компоненты смеси (к которым и принадлежат обсуждаемые нами проценты). Вменяемые люди используют для компонентов составов, ввиду очевидной проблемы с размерностью, только их.

Данные графики простроены по стране. Поскольку обсуждался вопрос сколько должно прийти "без стимуляции, потому что захотелось".

Поскольку Вам вряд ли понравиться многомерный тернарный график, то для трех партий я строил их для суммы трех компонент:

партия (Т) + нет результативного голоса хотя в списке участка был (L) + все остальные результативные голоса (R).

Есть чудесная страница на Википедии (английской естественно) Ternary_plot
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: p2004r
2016-09-28 04:24 pm (UTC)
И я был бы _очень_ признателен Вам, если бы Вы не занимались редактированием своих комментариев на которые _уже_ последовали мои.

Если конечно Вы хотите общаться дальше.
(Reply) (Parent) (Thread) (Expand)