?

Log in

No account? Create an account
О нарисованных результатах выборов в Саратове - Журнал Александра Киреева: о политике, выборах и не только. [entries|archive|friends|userinfo]
Александр Киреев

[ website | Электоральная география ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

О нарисованных результатах выборов в Саратове [Sep. 20th, 2016|07:09 am]
Александр Киреев
[Tags|, , ]

В комментах привлекли мое мнение к нарисованным результатам выборов в Саратове. Я как глянул: мама родная...

Было бы наивно полагать, что рисование, а не просто фальсификация результатов, будут только в республиках. Пожалуй, это самый большой по объему случай рисования результатов в русских областях из тех, что я помню.  Таблица всех участков города под катом (кроме спец. участков). Опять же жирным шрифтом я отметил копирующиеся результаты. Я знаю: не все, но достаточно для того, чтобы понять смысл происходящего. На некоторых участках, однако, результаты выглядят нормально - я их тоже отметил. Но все же подавляющая часть участков - явно нарисованные. Саратов все же город немаленький: то есть сотнями тысяч голосов просто подтерлись. Люди зря шли на участки, даже голоса за Единую Россию учтены не были. Я это называю "интеллектуальным банкротством", если, конечно, они за ЕР голосовали добровольно.

Кстати, 62% за ЕР оказалось так много, что даже на графике результатов по стране видно (там же есть обсуждение в комментах).

Update: kobak заметил, что они просто вычисляли исходя из 40% за ЕР от списочного состава избирателей. Так и есть, я добавил эту колонку в таблицу. Причем, совпадение: ровно на 40 участках попадания ровно в 40,0%!

Update2: в Саратовсе нарисованы проценты за все партии, а не только за парламентские! Там же полная таблица.






Update: поскольку пост привлек внимание, во-первых, вот как это выглядит на графике (спасибо konst90)


Во-вторых, сразу несколько кремлеботов кричат "где исходные данные?" "Нет такого на сайте избиркома!" Вот исходные данные:

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796072&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135285&type=233

http://www.saratov.vybory.izbirkom.ru/region/saratov?action=show&global=true&root=642000026&tvd=26420001135271&vrn=100100067795849&prver=0&pronetvd=0®ion=64&sub_region=64&type=233&vibid=26420001135271

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135250&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135249&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135248&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&root=642000013&tvd=26420001135258&vrn=100100067795849&region=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135258&type=233

Update2: и еще отдельный пост об этом.

Update 3. И результаты по одномандатным округам нарисованы.

Update 4: Совпадает число бюллетеней за партии и одномандатников.

Update 5: о Саратове уже столько, что ввел для него тэг "Саратов", по нему теперь можно найти все посты об этом.
linkReply

Comments:
[User Picture]From: p2004r
2016-09-26 12:55 pm (UTC)
Для "370 участков по 2000 человек на город" и "страны размером 5000" получаем

> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.01,0.99), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 129 127 125 124 123 123 122 122 122 122

> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.60,0.40), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 38 37 37 37 37 36 36 36 35 35
> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.60,0.40), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 44 37 37 37 37 36 36 36 35 35



То есть если диаграмма в топике с бином получена по 370, то я на втором уже прогоне получил "зветный бин 43" :)
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-26 02:05 pm (UTC)
Отвечаю сразу на оба коммента:

Лучше качать файл от 23го сентября, там должно быть 96869 участков. Из них в Саратове 373 (в шести ТИК), если я не ошибся. Из них на 111 ЕР набирает 62.2% плюс минус 0.05%. Сейчас специально всё это пересчитал.

Я предлагаю обсуждать именно этот бин (0.1%) и именно эти числа: 111 из 373 в бине 0.1% на 62.2%. (Точное происхождение диаграммы в топике и числа 43, на которое Вы все время ссылаетесь, мне вообще не известно, я и не хочу о них говорить.)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 05:33 pm (UTC)
1. 43 это высота бина, можно увидеть если кликнуть на диаграмму в топике (она открывается в крупном масштабе). Ок будем считать что эта диаграмма ничего не значит.

2. Я скачал данные и импортировал

data <- read.delim("table_233_level_4.txt", quote="")

...96869 obs. of  37 variables...



Давно хотел тернарный график построить распределения :)







Пока думаю над схемой рандомизации, а то в лоб очень уж тяжелая получается...
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 07:31 pm (UTC)
ну вот, все скринит когда с картинками... так не интересно совсем.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 08:14 pm (UTC)
У меня высота бина в 100 только для целых процентов, а так 56 (44 и так выскакивает для 370 участков)

> table(round(data[which(data[,2]=="163 Саратовская область - Саратовский"),26]/(rowSums(data[which(data[,2]=="163 Саратовская область - Саратовский"),c(23:36)])),2))

0.32 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.49  0.5 0.51 0.52 0.53 0.54 0.55 0.56 
   1    1    1    1    2    3    3    3    2    2    1    6    3    5    3    6 
0.57 0.58 0.59  0.6 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69  0.7 0.71 0.72 
   2    3    4    3   10  101   26    2   13    4    8    8    2    5    2    4 
0.73 0.74 0.75 0.76 0.77 0.78 0.79  0.8 0.81 0.83 0.84 0.85 0.86 0.87 0.88 0.89 
   6    4   19    5    7    5    6    6    5    4    5    6    2    3    4    2 
 0.9 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98    1 
   5   13    4    4    4    4    6    2    1    1 
> table(round(data[which(data[,2]=="163 Саратовская область - Саратовский"),26]/(rowSums(data[which(data[,2]=="163 Саратовская область - Саратовский"),c(23:36)])),3))

 0.32 0.414 0.424 0.426 0.442 0.444  0.45 0.453 0.454 0.461 0.465 0.471 0.472 
    1     1     1     1     1     1     1     1     1     2     1     1     1 
0.475 0.489 0.495 0.497 0.502 0.507 0.517  0.52 0.522 0.532 0.534 0.538 0.541 
    1     1     1     1     1     1     2     3     1     1     2     1     2 
0.542 0.545  0.55 0.551 0.561 0.563 0.564 0.569  0.57 0.579 0.581 0.584 0.586 
    1     1     1     2     2     2     2     1     1     1     1     1     1 
 0.59 0.593 0.595   0.6 0.606 0.607 0.609  0.61 0.612 0.614 0.616 0.618 0.619 
    2     1     1     2     1     2     2     1     2     2     1     1     1 
 0.62 0.621 0.622 0.623 0.624 0.625 0.626 0.627 0.628 0.629  0.63 0.631 0.632 
    2     9    56    18    10     4     4     5     1     4     1     2     2 
0.633 0.634 0.635  0.64 0.644 0.646 0.647  0.65 0.651 0.652 0.654 0.656 0.661 
    1     3     2     1     1     1     3     2     3     1     3     1     1 
0.663 0.664 0.665 0.666 0.668 0.671 0.673 0.674 0.675  0.68 0.681 0.682 0.685 
    1     1     1     2     1     1     1     1     2     2     1     3     1 
0.695 0.696 0.698 0.699   0.7 0.705  0.71 0.714 0.717 0.721 0.723 0.725 0.726 
    2     1     1     1     1     1     1     1     1     1     1     2     1 
0.727 0.728  0.73 0.731  0.74 0.741 0.742 0.747 0.748  0.75 0.751 0.752 0.753 
    1     1     1     1     2     1     1     1     2     4     4     1     3 
0.754 0.755 0.758  0.76 0.761 0.763 0.764 0.766 0.767 0.769 0.771 0.773  0.78 
    2     2     1     1     1     1     1     1     2     1     2     1     1 
0.781 0.782 0.783 0.784 0.785 0.787 0.791 0.793 0.794 0.798 0.799   0.8 0.803 
    1     1     1     1     1     1     1     1     2     1     1     1     2 
0.804 0.808 0.809  0.81 0.812 0.827 0.828 0.836 0.839  0.84 0.841 0.843 0.849 
    1     1     2     1     1     2     2     1     1     1     1     1     2 
0.851 0.853 0.854 0.855 0.857 0.863 0.867 0.868 0.869 0.875  0.88 0.882  0.89 
    1     1     1     1     1     1     1     1     1     1     2     1     1 
0.894 0.897 0.898 0.902 0.903 0.904 0.905 0.906 0.909  0.91 0.911 0.913 0.918 
    1     1     1     1     1     1     1     1     2     4     3     2     1 
0.921 0.925 0.929 0.931 0.941 0.942 0.943 0.945 0.948 0.951 0.953 0.956 0.957 
    1     4     1     1     1     1     2     1     1     1     1     1     2 
 0.96 0.964 0.965 0.967 0.969 0.983     1 
    1     1     1     1     1     1     1 
> 



Как у Вас получилось 111 при округлении?

Ааа, так нужно не "просто округление", а "правильное округление" :) Вы же понимаете, что это уже совсем _другое_ округление.

(я для оценки его возможности теперь должен проводить обычное округление с добавлением пошаговым малой константы и выбирать максимум по такой процедуре, и у меня тоже все будет расти)
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-26 08:17 pm (UTC)
Что значит "правильное округление"? Я имею в виду обычное округление к ближайшей десятой доли процента.

"Саратовская область - Саратовский" не выделяет г. Саратов. Вам нужны ТИКи (а не ОИКи), которые начинаются с "Саратов," (с запятой). Таких ТИК шесть штук.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 06:08 am (UTC)
Это писали Вы?

> Лучше качать файл от 23го сентября, там должно быть 96869 участков. Из них в Саратове 373 (в шести ТИК), если я не ошибся. Из них на 111 ЕР набирает 62.2% плюс минус 0.05%. Сейчас специально всё это пересчитал.

> Я предлагаю обсуждать именно этот бин (0.1%) и именно эти числа: 111 из 373 в бине 0.1% на 62.2%.


Ну так я все правильно тогда посчитал. Поскольку вот все участки:

> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),2]))

163 Саратовская область - Саратовский 
                                  373 
> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),3]))

       22 Новобурасская           26 Петровская   35 Саратов, Кировская 
                     25                      50                      63 
  36 Саратов, Ленинская 38 Саратов, Фрунзенская     39 Саратовская -163 
                    115                      25                      11 
         41 Татищевская          42 Светловская 4 Базарно-Карабулакская 
                     29                       4                      30 
           8 Балтайская 
                     21 



Никаким "просто округлением" бин высотой в 100 там не получается.

(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 09:29 am (UTC)
Это писал я. Еще раз: Вам нужно выбирать не "Саратовская область - Саратовский" из второй колонки (ОИКи), а "Саратов, " из третьей колонки (ТИКи). Ваша выборка -- это пол-Саратова и несколько прилежащих районов области. Если в этой ОИК тоже 373 участка, то это странное совпадение, которое и привело к путанице.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 04:09 pm (UTC)
Тут графики скриняться, поэтому словами.

Все что делалось, это стимулировали явку. Когда достигались оба параметра (по любому из них "превышение" ничего плохого не означает для организаторов) "явка" + "доля голосов за" стимуляцию явки _просто_прекращали_.

Запрещено это или разрешено --- звонить и пинать что бы обязательно шли голосовать (понятно что звонят принципиально всем, все равно за текущую ситуацию большинство :) я не знаю.

Иначе никакого смысла в "треугольнике" (с существенно размытой вершиной) на тернарном графике нет.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 04:16 pm (UTC)
1) Ну выложите график на imgur.com или куда-нибудь, это делается в один клик.

2) Вы убедились в наличии 110 участков в бине 0.1% в Саратове? Хотелось бы ясного подтверждения, а то Вы как-то резко бросили тему.

3) Как, по-Вашему на участке могут онлайн мониторить долю голосов за ЕР? Вы в курсе, что заполненные бюллетени бросают в урну (причем в свернутом виде), никому не показывая?

4) Если могут мониторить только явку, то как получается 110 участков в бине 0.1% вокруг результата 62.2%? Симуляцию, пожалуйста.

Edited at 2016-09-27 04:18 pm (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 07:56 pm (UTC)
1. А что ссылки тут не сделают "пост не раскрываемым"? Вы лично хоть видите заскриненый ответ?

2. С такой решительностью что то утверждая следует быть точнее. Нет, 110 при обычном округлении там нет.

> table(round(data[grep("Саратов,",data[,3]),26]/rowSums(data[grep("Саратов,",data[,3]),23:36]), 3))

 0.32 0.363 0.402 0.406 0.412 0.413 0.471 0.475 0.489 0.491 0.497 0.499 0.508 
    1     1     1     1     1     1     1     1     1     1     1     2     1 
0.512 0.513 0.525 0.532 0.533 0.534 0.538 0.541 0.544 0.551 0.561 0.563 0.564 
    1     1     1     1     1     1     1     2     1     1     2     1     1 
0.568 0.569 0.584  0.59 0.592   0.6 0.605 0.606 0.607  0.61 0.611 0.614 0.616 
    1     1     1     1     1     2     1     2     1     2     1     2     1 
0.618 0.619  0.62 0.621 0.622 0.623 0.624 0.625 0.626 0.627 0.628 0.629  0.63 
    2     1     5    15   107    31    16     7     9     6     2     3     2 
0.631 0.632 0.633 0.634 0.635 0.636 0.637 0.638  0.64 0.642 0.643 0.644 0.646 
    2     2     1     1     2     1     1     2     2     1     1     1     1 
0.647 0.649  0.65 0.651 0.653 0.654 0.656 0.658 0.661 0.663 0.664 0.665 0.666 
    2     1     3     7     1     4     1     1     2     2     1     1     2 
0.668  0.67 0.671 0.672 0.673 0.675  0.68 0.682 0.685 0.695 0.698 0.699   0.7 
    1     1     1     1     1     2     2     3     1     1     1     1     1 
0.704 0.705 0.706  0.71 0.711 0.714 0.717 0.721 0.722 0.725 0.726 0.728 0.731 
    1     1     1     1     1     2     1     1     1     2     1     1     1 
0.733  0.74 0.748  0.75 0.751 0.752 0.753 0.754 0.755 0.758 0.777  0.78 0.797 
    1     1     1     1     4     1     3     1     3     1     1     1     1 
0.799 0.804 0.808 0.834  0.84  0.88 0.891 0.896 0.912 0.926 0.942 0.948 0.951 
    1     1     1     1     1     1     2     1     1     1     1     1     1 
0.955 0.958 0.964 0.969 0.978 0.983 0.994     1 
    1     1     1     1     1     1     1     2 
> table(round(data[grep("Саратов,",data[,3]),26]/rowSums(data[grep("Саратов,",data[,3]),23:36]), 2))

0.32 0.36  0.4 0.41 0.47 0.49  0.5 0.51 0.52 0.53 0.54 0.55 0.56 0.57 0.58 0.59 
   1    1    1    3    2    2    3    3    1    3    4    1    4    2    1    2 
 0.6 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69  0.7 0.71 0.72 0.73 0.74 0.75 
   2    9  182   33    9   19    7   10    6    1    5    5    4    5    1   13 
0.76 0.78  0.8 0.81 0.83 0.84 0.88 0.89  0.9 0.91 0.93 0.94 0.95 0.96 0.97 0.98 
   2    2    3    1    1    1    1    2    1    1    1    1    3    2    1    2 
0.99    1 
   1    2 



Там 107 совпавших именно в десятых процента (или у меня опять не те данные?)

3. Значит с возможностью мониторить явку и пропорционально её уровню стимулировать явку Вы согласны?

ОК, зафиксируем.

Вы тоже что то более _однородное_ распределение голосов по участкам обсуждать не желаете и с этой темы куда то "пропадаете" :).

( Что касается возможности узнать как голосуют: А что "те кого можно уговорить прийти на выборы по просьбе" будут как то голосовать "не особенно"? Наверное раз смог позвать авторитетный для них человек, то и они консолидируются с его мнением.)

4. Вот это вполне возможно, поскольку размерность ситуации падает. Тут надо считать сколько является без "позвали", потом доливать теми кого "позвали для % явки".

Блин дофига параметров что бы учесть явно видную "борьбу за явку". Сомневаюсь что здесь вот так вот просто семплер можно составить, что бы показать что случайно, а что нет.

Надо узнать сколько "по доброй воли" приходит, и потом досыпать "сагитированными помочь явке"... но это по любому делает распределение "большой партии" боле однородным чем чисто случайное. Фактически мы досыпаем уже не близко к 50%, а наоборот к 95%. Это при обычной симуляции резко до сотни подбрасывает вероятность совпадения.

Но даже если у меня получиться, скажут что это не отличается от "вброса"? :) Или Вы согласны с этими посылками?

Блин устал я семплеры писать, надо и поспать когда :) Если завтра силы будут на эту политоту то можно продолжить.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 08:33 pm (UTC)
1) Заскриненный ответ не вижу, увы. При желании ссылку можно запостить с пробелом посередине или еще-нибудь, чтобы жж не распознал.

2) Надо делить не на сумму голосов за все партии, а на сумму действ. + недейств. бюллетеней (можно еще кол-во недейств. прибавить к сумме по всем партиям). В Саратове почти везде недействительных ноль (что уже ясный признак тотального фальсификата, кстати), но кое-где все же попадаются, отсюда, вероятно, и расхождение между 107 и 111. Но это незначительные детали; то, что участков в бине 0.1% более ста, мы можем уже, как Вы говорите, "зафиксировать".

3а) С теоретической возможностью "мониторить явку и пропорционально её уровню стимулировать явку" я согласен, да. Зафиксировали.

3б) Насчет "более однородного" распределения по участкам я пока не понял Вашу мысль. Более однородное распределение -- это какое, например? Лучше всего будет, если Вы сделаете симуляцию и предъявите какое-нибудь распределение, которое дает больше ста участков с 62.2%.

4) Не совсем понял, попробую уточнить Вашу предполагаемую схему. Есть некая нестимулированная явка 0<p1<0.643 (или сколько там в Саратове обычно) и некий нестимулированный результат ЕР 0<p2<0.622. Люди приходят биномиально и голосуют биномиально. Когда все эти люди пришли и проголосовали, и участок опустел, в участке звонят верным сторонникам ЕР, которых знают поименно и которые до сих пор сидели дома и выжидали, и приглашают их придти проголосовать. Зовут ровно столько людей, чтобы явка получилась ровно 64.3%. При этом эти верные сторонники голосуют за ЕР с вероятностью p3 близкой к единице (или даже ровно единица?). В итоге получается некий, заранее комиссии неизвестный, результат ЕР. Так? Ну в общем да, было бы любопытно, если бы Вы смогли предъявить некий набор параметров этой модели, при котором на ста участках будет получаться 62.2% в бине 0.1%. Мне так сходу неочевидно, что это возможно. (В скобках я напомню, что мы пока обсуждаем только 62.2% за ЕР, но результаты остальных партий в Саратове тоже сконцентрированы в 0.1% бинах; как Ваша модель, если я ее верно понял, может это объяснить, мне неведомо. Но для начала можно сосредоточиться на результате ЕР.)
(Reply) (Parent) (Thread)
[User Picture]From: kireev
2016-09-27 09:52 pm (UTC)
Сейчас все расскринил.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-28 04:46 am (UTC)
4. Да, практически после "естественной явки" (с неизвестным ни для кого результатом, ну кроме "среднего по больнице") не дотянувшей до "назначенного минимума" (в там практически везде как я понимаю явка низковатая) начинаются звонки по списку избирателей "придите и спасите, а то нас потом того за то что вы не пришли".

Естественно даже без какого либо заговора (что звонят только "верным людям" или это вообще "карусельщики") откликаются на такие просьбы "по телефону" просьбы "представителей власти" преимущественно люди которые тоже "за власть".

Ну а симуляцию мы выше делали -- чем дальше от 0.5 доля голосов, тем выше бин. И для доли в 0.95 или 0.99 бин также подскаивает в 100 и выше , как и для "малой партии" в 0.05 или 0.01 доле выборщиков.

Ну а поскольку у нас слагаемые ста процентов, то совпадение кучи участков "за большую" неплохо так определяет шансы и так высокие "за малую".

Семплер надо писать, в нем неизвестная величина --- "нестимулированная явка".
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-28 09:54 am (UTC)
Ну а симуляцию мы выше делали -- чем дальше от 0.5 доля голосов, тем выше бин. И для доли в 0.95 или 0.99 бин также подскаивает в 100 и выше , как и для "малой партии" в 0.05 или 0.01 доле выборщиков.

Это я понимаю, но в данном случае нам требуется получить результат 62.2%, а не что-то близкое к нулю или к ста.

Короче говоря, сценарий интересный. По-моему, он описывается (как минимум) тремя параметрами, как я написал выше: нестимулированная явка, нестимулированный результат ЕР, стимулированный результат. Последний для простоты можно положить равным единице. Нестимулированная явка должна быть в интервале процентов от 20 до 50, иначе "нефизично". Нестимулированный результат где-то тоже в этом интервале.

Как можно таким образом получить спайк на 62.2%, я не вижу, так что будет интересно, если у Вас получится продемонстрировать работающий сценарий.
(Reply) (Parent) (Thread) (Expand)