?

Log in

No account? Create an account
О нарисованных результатах выборов в Саратове - Журнал Александра Киреева: о политике, выборах и не только. [entries|archive|friends|userinfo]
Александр Киреев

[ website | Электоральная география ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

О нарисованных результатах выборов в Саратове [Sep. 20th, 2016|07:09 am]
Александр Киреев
[Tags|, , ]

В комментах привлекли мое мнение к нарисованным результатам выборов в Саратове. Я как глянул: мама родная...

Было бы наивно полагать, что рисование, а не просто фальсификация результатов, будут только в республиках. Пожалуй, это самый большой по объему случай рисования результатов в русских областях из тех, что я помню.  Таблица всех участков города под катом (кроме спец. участков). Опять же жирным шрифтом я отметил копирующиеся результаты. Я знаю: не все, но достаточно для того, чтобы понять смысл происходящего. На некоторых участках, однако, результаты выглядят нормально - я их тоже отметил. Но все же подавляющая часть участков - явно нарисованные. Саратов все же город немаленький: то есть сотнями тысяч голосов просто подтерлись. Люди зря шли на участки, даже голоса за Единую Россию учтены не были. Я это называю "интеллектуальным банкротством", если, конечно, они за ЕР голосовали добровольно.

Кстати, 62% за ЕР оказалось так много, что даже на графике результатов по стране видно (там же есть обсуждение в комментах).

Update: kobak заметил, что они просто вычисляли исходя из 40% за ЕР от списочного состава избирателей. Так и есть, я добавил эту колонку в таблицу. Причем, совпадение: ровно на 40 участках попадания ровно в 40,0%!

Update2: в Саратовсе нарисованы проценты за все партии, а не только за парламентские! Там же полная таблица.






Update: поскольку пост привлек внимание, во-первых, вот как это выглядит на графике (спасибо konst90)


Во-вторых, сразу несколько кремлеботов кричат "где исходные данные?" "Нет такого на сайте избиркома!" Вот исходные данные:

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796072&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135285&type=233

http://www.saratov.vybory.izbirkom.ru/region/saratov?action=show&global=true&root=642000026&tvd=26420001135271&vrn=100100067795849&prver=0&pronetvd=0®ion=64&sub_region=64&type=233&vibid=26420001135271

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135250&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135249&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&tvd=100100067796069&vrn=100100067795849®ion=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135248&type=233

http://www.saratov.vybory.izbirkom.ru/region/region/saratov?action=show&root=642000013&tvd=26420001135258&vrn=100100067795849&region=64&global=true&sub_region=64&prver=0&pronetvd=0&vibid=26420001135258&type=233

Update2: и еще отдельный пост об этом.

Update 3. И результаты по одномандатным округам нарисованы.

Update 4: Совпадает число бюллетеней за партии и одномандатников.

Update 5: о Саратове уже столько, что ввел для него тэг "Саратов", по нему теперь можно найти все посты об этом.
linkReply

Comments:
[User Picture]From: kobak
2016-09-25 10:21 pm (UTC)
Камон, это троллинг такой? В Саратове результаты совпадают не до процента, а до десятой доли процента, о чем Киреев написал уже несколько подробных записей. Возьмите участки с 1000 пришедших с p(за ЕР)=62.2% и посчитайте на скольки участках получится 62.2% плюс минус 0.05%.

table(round(replicate(27000,sum(sample(c(1,0),1000, prob=c(0.62,0.38), replace=T))/1000),3))/100

Ответ: на 7 из 270.

Edited at 2016-09-25 10:25 pm (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 11:08 am (UTC)
Алё!

1. Про какие данные речь? Я увидел диаграмму в топике у автора, там "бин десятых" был 43. Для "большой партии" 30 у меня. Никакие другие данные я нигде скачать не могу, бо все эти ссылки на гулодиски заблочило на доступ по каким то лимитам самого гугла видимо (ну а выложить все это добро о результатах на участках на торент мозга видимо не хватает).

2. Я не понимаю отчего идет такой навал на полностью случайное распределение голосов по участкам?

Эффект совпадения есть даже на случайном распределении, малейшее отклонение от чисто случайного распространения в пользу более _однородного_ распределения мнений внутри конкретного региона и никакой проблемы с таким высоким бином в десятых процента по стране в целом нет.

Вот собственно и всё.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 11:16 am (UTC)
Ну и Ваша модификация без оператора max() мало имеет общего с сутью задачи.

Ищут не среднее, а максимальное число раз в регионе совпавшее _произвольное_ значение. Есть знаете целый раздел статистики который изучает экстремальные значения и там очень даже всё не просто.

Для "бина с десятыми долями процента" практически достоверно получить совпадение 30 при голосовании по стране в каком то случайном городе даже при случайном распределении выборщиков (не влияющих друг на друга).
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-26 11:32 am (UTC)
Я не особо знаю R, поэтому сделал простейшую модификацию. Если Вас не затруднит, поставьте, пожалуйста, max, и сообщите результат. По-моему, и так ясно, что в биномиальном распределении максимум будет в бине с модой, но можно и убедиться в этом напрямую.

В Саратове из 350 участков на 110 результат попадает в 0.1% бин. На ста десяти (!). В масштабах страны это выглядит так: http://ic.pics.livejournal.com/kireev/2901613/481099/481099_original.png (график мой).

Данные тут: https://drive.google.com/drive/u/0/folders/0ByFMnUnpIlriZEswWjRVLU16WWM -- сейчас проверил, всё работает.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 12:38 pm (UTC)
1. Спасибо за ссылку, я скачал от 19го сентября 23-00 (надеюсь не ошибся, если ошибся поправьте что там сейчас принято "за канон" )

2. Я считал выше для города в 270 участков (как я понял это было базой для диаграммы в топике).

На диаграмме "большая партия" с бином ~43, у меня 30 легко получается (доверительный интервал для экстремальных значений пока не считал).

Для малой партии у меня легко и массово получается бин 90.

Влияние на этот результат отклонения распределения выборщиков по участкам от случайного к более _однородному_ распределению я прозреваю просто ужасное (никто ведь никакой рандомизации не делал и УИК формировался среди людей подверженных одним и тем же региональным факторам).
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 12:55 pm (UTC)
Для "370 участков по 2000 человек на город" и "страны размером 5000" получаем

> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.01,0.99), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 129 127 125 124 123 123 122 122 122 122

> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.60,0.40), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 38 37 37 37 37 36 36 36 35 35
> sort(replicate(5000, max(table(round(replicate(370,sum(sample(c(1,0),2000, prob=c(0.60,0.40), replace=T))/2000),3)))), decreasing=T)[1:10]
 [1] 44 37 37 37 37 36 36 36 35 35



То есть если диаграмма в топике с бином получена по 370, то я на втором уже прогоне получил "зветный бин 43" :)
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-26 02:05 pm (UTC)
Отвечаю сразу на оба коммента:

Лучше качать файл от 23го сентября, там должно быть 96869 участков. Из них в Саратове 373 (в шести ТИК), если я не ошибся. Из них на 111 ЕР набирает 62.2% плюс минус 0.05%. Сейчас специально всё это пересчитал.

Я предлагаю обсуждать именно этот бин (0.1%) и именно эти числа: 111 из 373 в бине 0.1% на 62.2%. (Точное происхождение диаграммы в топике и числа 43, на которое Вы все время ссылаетесь, мне вообще не известно, я и не хочу о них говорить.)
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 05:33 pm (UTC)
1. 43 это высота бина, можно увидеть если кликнуть на диаграмму в топике (она открывается в крупном масштабе). Ок будем считать что эта диаграмма ничего не значит.

2. Я скачал данные и импортировал

data <- read.delim("table_233_level_4.txt", quote="")

...96869 obs. of  37 variables...



Давно хотел тернарный график построить распределения :)







Пока думаю над схемой рандомизации, а то в лоб очень уж тяжелая получается...
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 07:31 pm (UTC)
ну вот, все скринит когда с картинками... так не интересно совсем.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-26 08:14 pm (UTC)
У меня высота бина в 100 только для целых процентов, а так 56 (44 и так выскакивает для 370 участков)

> table(round(data[which(data[,2]=="163 Саратовская область - Саратовский"),26]/(rowSums(data[which(data[,2]=="163 Саратовская область - Саратовский"),c(23:36)])),2))

0.32 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.49  0.5 0.51 0.52 0.53 0.54 0.55 0.56 
   1    1    1    1    2    3    3    3    2    2    1    6    3    5    3    6 
0.57 0.58 0.59  0.6 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69  0.7 0.71 0.72 
   2    3    4    3   10  101   26    2   13    4    8    8    2    5    2    4 
0.73 0.74 0.75 0.76 0.77 0.78 0.79  0.8 0.81 0.83 0.84 0.85 0.86 0.87 0.88 0.89 
   6    4   19    5    7    5    6    6    5    4    5    6    2    3    4    2 
 0.9 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.98    1 
   5   13    4    4    4    4    6    2    1    1 
> table(round(data[which(data[,2]=="163 Саратовская область - Саратовский"),26]/(rowSums(data[which(data[,2]=="163 Саратовская область - Саратовский"),c(23:36)])),3))

 0.32 0.414 0.424 0.426 0.442 0.444  0.45 0.453 0.454 0.461 0.465 0.471 0.472 
    1     1     1     1     1     1     1     1     1     2     1     1     1 
0.475 0.489 0.495 0.497 0.502 0.507 0.517  0.52 0.522 0.532 0.534 0.538 0.541 
    1     1     1     1     1     1     2     3     1     1     2     1     2 
0.542 0.545  0.55 0.551 0.561 0.563 0.564 0.569  0.57 0.579 0.581 0.584 0.586 
    1     1     1     2     2     2     2     1     1     1     1     1     1 
 0.59 0.593 0.595   0.6 0.606 0.607 0.609  0.61 0.612 0.614 0.616 0.618 0.619 
    2     1     1     2     1     2     2     1     2     2     1     1     1 
 0.62 0.621 0.622 0.623 0.624 0.625 0.626 0.627 0.628 0.629  0.63 0.631 0.632 
    2     9    56    18    10     4     4     5     1     4     1     2     2 
0.633 0.634 0.635  0.64 0.644 0.646 0.647  0.65 0.651 0.652 0.654 0.656 0.661 
    1     3     2     1     1     1     3     2     3     1     3     1     1 
0.663 0.664 0.665 0.666 0.668 0.671 0.673 0.674 0.675  0.68 0.681 0.682 0.685 
    1     1     1     2     1     1     1     1     2     2     1     3     1 
0.695 0.696 0.698 0.699   0.7 0.705  0.71 0.714 0.717 0.721 0.723 0.725 0.726 
    2     1     1     1     1     1     1     1     1     1     1     2     1 
0.727 0.728  0.73 0.731  0.74 0.741 0.742 0.747 0.748  0.75 0.751 0.752 0.753 
    1     1     1     1     2     1     1     1     2     4     4     1     3 
0.754 0.755 0.758  0.76 0.761 0.763 0.764 0.766 0.767 0.769 0.771 0.773  0.78 
    2     2     1     1     1     1     1     1     2     1     2     1     1 
0.781 0.782 0.783 0.784 0.785 0.787 0.791 0.793 0.794 0.798 0.799   0.8 0.803 
    1     1     1     1     1     1     1     1     2     1     1     1     2 
0.804 0.808 0.809  0.81 0.812 0.827 0.828 0.836 0.839  0.84 0.841 0.843 0.849 
    1     1     2     1     1     2     2     1     1     1     1     1     2 
0.851 0.853 0.854 0.855 0.857 0.863 0.867 0.868 0.869 0.875  0.88 0.882  0.89 
    1     1     1     1     1     1     1     1     1     1     2     1     1 
0.894 0.897 0.898 0.902 0.903 0.904 0.905 0.906 0.909  0.91 0.911 0.913 0.918 
    1     1     1     1     1     1     1     1     2     4     3     2     1 
0.921 0.925 0.929 0.931 0.941 0.942 0.943 0.945 0.948 0.951 0.953 0.956 0.957 
    1     4     1     1     1     1     2     1     1     1     1     1     2 
 0.96 0.964 0.965 0.967 0.969 0.983     1 
    1     1     1     1     1     1     1 
> 



Как у Вас получилось 111 при округлении?

Ааа, так нужно не "просто округление", а "правильное округление" :) Вы же понимаете, что это уже совсем _другое_ округление.

(я для оценки его возможности теперь должен проводить обычное округление с добавлением пошаговым малой константы и выбирать максимум по такой процедуре, и у меня тоже все будет расти)
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-26 08:17 pm (UTC)
Что значит "правильное округление"? Я имею в виду обычное округление к ближайшей десятой доли процента.

"Саратовская область - Саратовский" не выделяет г. Саратов. Вам нужны ТИКи (а не ОИКи), которые начинаются с "Саратов," (с запятой). Таких ТИК шесть штук.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 06:08 am (UTC)
Это писали Вы?

> Лучше качать файл от 23го сентября, там должно быть 96869 участков. Из них в Саратове 373 (в шести ТИК), если я не ошибся. Из них на 111 ЕР набирает 62.2% плюс минус 0.05%. Сейчас специально всё это пересчитал.

> Я предлагаю обсуждать именно этот бин (0.1%) и именно эти числа: 111 из 373 в бине 0.1% на 62.2%.


Ну так я все правильно тогда посчитал. Поскольку вот все участки:

> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),2]))

163 Саратовская область - Саратовский 
                                  373 
> table(factor(data[which(data[,2]=="163 Саратовская область - Саратовский"),3]))

       22 Новобурасская           26 Петровская   35 Саратов, Кировская 
                     25                      50                      63 
  36 Саратов, Ленинская 38 Саратов, Фрунзенская     39 Саратовская -163 
                    115                      25                      11 
         41 Татищевская          42 Светловская 4 Базарно-Карабулакская 
                     29                       4                      30 
           8 Балтайская 
                     21 



Никаким "просто округлением" бин высотой в 100 там не получается.

(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 09:29 am (UTC)
Это писал я. Еще раз: Вам нужно выбирать не "Саратовская область - Саратовский" из второй колонки (ОИКи), а "Саратов, " из третьей колонки (ТИКи). Ваша выборка -- это пол-Саратова и несколько прилежащих районов области. Если в этой ОИК тоже 373 участка, то это странное совпадение, которое и привело к путанице.
(Reply) (Parent) (Thread)
[User Picture]From: p2004r
2016-09-27 04:09 pm (UTC)
Тут графики скриняться, поэтому словами.

Все что делалось, это стимулировали явку. Когда достигались оба параметра (по любому из них "превышение" ничего плохого не означает для организаторов) "явка" + "доля голосов за" стимуляцию явки _просто_прекращали_.

Запрещено это или разрешено --- звонить и пинать что бы обязательно шли голосовать (понятно что звонят принципиально всем, все равно за текущую ситуацию большинство :) я не знаю.

Иначе никакого смысла в "треугольнике" (с существенно размытой вершиной) на тернарном графике нет.
(Reply) (Parent) (Thread)
[User Picture]From: kobak
2016-09-27 04:16 pm (UTC)
1) Ну выложите график на imgur.com или куда-нибудь, это делается в один клик.

2) Вы убедились в наличии 110 участков в бине 0.1% в Саратове? Хотелось бы ясного подтверждения, а то Вы как-то резко бросили тему.

3) Как, по-Вашему на участке могут онлайн мониторить долю голосов за ЕР? Вы в курсе, что заполненные бюллетени бросают в урну (причем в свернутом виде), никому не показывая?

4) Если могут мониторить только явку, то как получается 110 участков в бине 0.1% вокруг результата 62.2%? Симуляцию, пожалуйста.

Edited at 2016-09-27 04:18 pm (UTC)
(Reply) (Parent) (Thread) (Expand)