?

Log in

No account? Create an account
Новые чудеса Волшебника Чурова - Журнал Александра Киреева: о политике, выборах и не только. — LiveJournal [entries|archive|friends|userinfo]
Александр Киреев

[ website | Электоральная география ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Новые чудеса Волшебника Чурова [Jan. 10th, 2012|02:13 pm]
Александр Киреев
[Tags|, ]

barouh проделал большую работу по вычислению вероятности чудесных результатов выбров в ряде районов Северного Кавказа и Башкортостана. Он посчитал для каждой территориальной избирательной комиссии вероятность того, что результат Единой России на всех участках или на многих участках естественным образом уложился бы в тот диапазон, в который он попал. Если вероятность выпадения такого количества первых мест Единой России во время жеребьевок мест в бюллетенях на региональных выборах, нам казалась просто ничтожно малой, то в этом случае уже явно не обошлось без волшебства.

Регион

ТИК

Всего участков

Совпадающих участков

ЕР min

ЕР max

Вероятность совпадения, 1 случай на

Башкортостан

Белебеевская

67

13

85,00%

85,05%

4,1*109

23

84,85%

85,21%

1,0*105

Стерлитамакская городская

110

41

74,90%

75,12%

8,3*1017

54

74,71%

75,26%

1,2*1012

Дагестан

Акушинская

52

19

95,76%

96,02%

7,2*105

Гумбетовская

32

18

93,17%

93,57%

1,1*1010

26

92,66%

94,03%

2,9*106

Гунибская

43

20

91,88%

92,50%

3,1*106

Дахадаевская

56

51

90,91%

91,39%

2,8*1036

56

90,59%

91,67%

3,5*1028

Сергокалинская

29

28

89,55%

89,70%

2,6*1034

29

89,47%

89,70%

1,5*1032

Сулейман-Стальская

42

39

91,58%

91,87%

3,3*1031

42

91,58%

92,21%

7,3*1024

Хунзахская

56

48

94,85%

95,39%

2,6*1024

54

94,74%

95,83%

2,8*1021

Цумадинская

55

48

93,79%

95,28%

1,1*1013

55

93,79%

97,00%

1,6*1011

Бабаюртовская

24

18

70,91%

71,06%

1,9*1020

24*

70,91%

97,83%

4,8*106

Кизлярская

54

48

90,96%

91,82%

8,9*1016

54

90,43%

92,00%

4,9*1014

Махачкала, Советский р-н

60

40

96,12%

96,33%

5,2*1017

56*

96,03%

99,16%

6,7*105

Ингушетия

Малгобекская городская

19

16

92,01%

92,45%

1,2*108

18

91,53%

92,45%

1,4*106

Назрановская

29

12

96,65%

96,75%

6,9*105

Кабардино-Балкария

Баксанская**

26

10

74,97%

75,06%

2,5*108

Майская

19

19

78,97%

79,45%

2,2*1014

Прохладненская

33

19

84,90%

85,03%

5,2*1015

30

84,69%

85,51%

1,6*1013

Чегемская

18

15

82,99%

83,55%

9,2*105

Карачаево-Черкессия

Карачаевская городская

18

12

95,65%

95,77%

3,6*109

Черкесская городская

45

35

89,89%

90,37%

2,0*109

41

89,74%

90,58%

5,6*106

Усть-Джегутинская

23

18

92,44%

92,78%

3,5*108

22

92,24%

93,23%

1,4*105

Северная Осетия

Владикавказ, Левобережный р-н***

70

48

73,76%

74,38%

2,0*1014

57

73,28%

74,80%

7,0*105

Владикавказ, Правобережный р-н***

70

40

73,78%

74,46%

5,0*108

48

73,52%

74,67%

1,7*106

Чечня****

Аргунская

9

8

99,31%

99,36%

5,6*106

Грозненская

38

27

99,31%

99,45%

1,1*108

38

99,18%

99,60%

5,5*105

Надтеречная

20

14

99,39%

99,42%

7,0*1010

20

99,30%

99,55%

1,9*106

Наурская

19

18

99,20%

99,46%

1,2*105

Ножай-Юртовская

31

16

99,31%

99,40%

7,8*107

22

99,20%

99,47%

1,8*105

Шелковская

26

24

99,35%

99,54%

3,0*109

linkReply

Comments:
[User Picture]From: Alexandre Sorokine
2012-01-10 09:35 pm (UTC)
Эти вероятности неправильные. Нельзя не учитывать кореллированность участков. Это не шары на лототроне, вероятнотсь близости результатов на соседних участках куда выше чем на дальних. Если взять какой-нибудь экономический показатель по участкам, напр. средний доход, то вероятность с которой он совпадает в пределах одного района будет где-то на уровне 10^-5, т.е. тоже невероятной. В эти цифры нужно вносить поправку на пространственную автокорелляцию, напр. используя какую-то другую переменную и Байесовскую вероятность.

Я не отрицаю, что выборы подделаны, но данная табличка это более чем от лукавого, а проблема не независимости измерений в пространстве известна по крайней с 1950-х гг.
(Reply) (Thread)
[User Picture]From: barouh
2012-01-11 06:58 am (UTC)
Спасибо за комментарии, но...

1. Хотелось бы мне посмотреть на примеры территорий, на которых уровень среднего дохода для отдельных "подтерриторий" совпадала бы с подобной же точностью. Например, чтобы во всех "подтерриториях" она была бы от 8947 до 8970 рублей. Уверен, что разброс будет существенно больше

2. Я изначально соглашаюсь с тем, что участки в пределах одного ТИКа похожие. Более того, я условно считаю, что они одинаковые. Одинаковые в том смысле, что распределение избирателей с разными предпочтениями между участками определяется исключительно случайными процессами (и на время забываем о том, что на самом деле есть множество факторов, предопределяющих РАЗЛИЧИЯ отдельных участков)

3. Я не верю в то, что какие-либо географические, социальные или экономическые факторы могут обеспечить большее единообразие электорального поведения, чем используемая мною модель случайного распределения (и не могу себя представить социальную механику подобных унификационных процессов)
(Reply) (Parent) (Thread)
[User Picture]From: rezoner
2012-01-11 01:44 pm (UTC)
Мне тоже кажутся не вполне корректными предположения Ващей модели. Это ведь не спущенные сверху проценты случайным образом раскидали между участками. То есть, модель, где распределение одинаково по республике и есть случайные отклонения, может давать более близкие или менее близкие результаты, чем наблюдаемые, но эта модель базируется на неверифицируемом предположении.
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2012-01-11 03:32 pm (UTC)
Честно говоря, не понял Ваш комментарий

Я утверждаю, что спущенные сверху проценты "тупо" воспроизвели на всех или на многих участках соответствующих ТИКов, и что наблюдаемые отклонения существенно меньше, чем должны были бы быть в естественных условиях в гомогенной среде и тем более чем они должны были бы быть в реальной ситуации неоднородной среды
(Reply) (Parent) (Thread)
[User Picture]From: rezoner
2012-01-11 04:05 pm (UTC)
Что Вы утверждаете, я понимаю. Меня интересует, как Вы вычисляли вероятности. Против какой нулевой гипотезы.

"существенно меньше, чем должны были бы быть в естественных условиях в гомогенной среде"

Означает ли это, что вы принимаете мультиномиальную модель? И вычисляете вероятности, стоящие в правой колонке, против этой модели?

Альтернативное объяснение полученным цифрам должно, значит, состоять в нахождении некоторого механизма, дающего отклонения от МН-модели, причем в сторону снижения дисперсии.

Я просто рассматриваю возможные возражения заранее, не то чтобы меня не убедили Ваши цифры.
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2012-01-11 07:46 pm (UTC)
На правах человека с гуманитарным дипломом не устыжусь вопроса: а что такое мультиномиальная модель?

Моя исходная модель - что есть генеральная совокупность (группа участков в рамках одного ТИК) с определенной долей голосующих за ЕР. И есть случайные выборки из этой генсовокупности - отдельные участки - в которых доля голосующих за ЕР будет равна средней по генсовокупности плюс-минус стандартная погрешность (величина которой естественно зависит от размера выборки, т.е. от количества голосующих, и от доли голосующих за ЕР)

По поводу альтернативного объяснения - да, нужно придумать механизм, объясняющий снижение дисперсии. Я такой механизм придумать не могу, фантазии не хватает
(Reply) (Parent) (Thread)
[User Picture]From: rezoner
2012-01-11 08:20 pm (UTC)
Мультиномиальная - это как биномиальная, только возможных исходов больше 2 (ЕР, КПРФ, СР...). Вероятности, что человек проголосует за ту или иную партию, разные, но для всех людей одинаковые. То есть, каждый избиратель, например, с р=0.3 голосует за ЕР, с вероятностью p=0.2 - за КПРФ и т.д.

Это эквивалентно тому, что Вы описываете, гуманитарный диплом Вам совершенно не мешает :))

Да, легко представить кучкование людей с одними электоральными предпочтениями в одном ТИКЕ, а с другими - в другом. Но чтобы распределение было более равномерным, чем случайное - трудновато придумать объяснение, да :)
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2012-01-11 09:23 pm (UTC)
Про мультиномиальность - я упрощенно считаю биномиальную схему "за ЕР - не за ЕР". Подозреваю, что если посчитать аналогичные вероятности для КПРФ и других партий, там тожно можно нарыть интересности и по другим районам

Edited at 2012-01-11 09:23 pm (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: Alexandre Sorokine
2012-01-12 03:39 am (UTC)
> 1. Хотелось бы мне посмотреть на примеры территорий, на которых уровень
> среднего дохода для отдельных "подтерриторий" совпадала бы с подобной же
> точностью. Например, чтобы во всех "подтерриториях" она была бы от 8947
> до 8970 рублей. Уверен, что разброс будет существенно больше

Речь о том, что совпадение в пределах 0.05% действительно маловероятно, однако вероятность совпадение в пределах 10% будет близка к единице (плюс см. замечание в конце).

> Одинаковые в том смысле, что распределение избирателей с разными
> предпочтениями между участками определяется исключительно случайными
> процессами

Это предположение неверно. Предпочтения были бы случайными если бы избиратели решали за кого голосовать путем выдергивания карты из колоды. Люди решают за кого голосовать исходя из многих факторов. Для жителей одного поселка, района, домовладения эти факторы будут близки и решения будут похожи.

> 3. Я не верю в то, что какие-либо географические, социальные или
> экономическые факторы могут обеспечить большее единообразие
> электорального поведения, чем используемая мною модель случайного
> распределения (и не могу себя представить социальную механику подобных
> унификационных процессов)

Оную гипотезу легко проверить. Примените свою методу для регионов без подделки или для выборов с другой стране. Это даст "фоновую" вероятность обычного совпадения результатов. Заодно можно будет говорить что же значат цифры в таблице.

Вообще вопрос влияния соседних измерений хорошо проработан. Для общей оценки можно использовать критерий Морана (Moran's I). Для вашей гипотезы он должен быть равен нулю, т.е., предполагается независимость соседних измерений. В реальности это вряд ли так. Более подробно этот вопрос можно исследовать методами геостатистики начав, напр., с построения вариограм для разных районов.

И еще, хоть и не по делу:

> Например, чтобы во всех "подтерриториях" она была бы от 8947 до 8970
> рублей

На практике это совсем не уникальная ситуация. Это бывает когда безработица на сравниваемых территориях близка к 100% и все получают одинаковое пособие, напр. беженцы (или еще десяток причин). Вот пример "унификационных процессов" если хотите. Но, в принципе, для слишком близких совпадений (как и слишком больших различий) всегда следуют искать объяснение и делать проверку. Чаше всего это ошибки в данных ну или подлог как на этих выборах.

Edited at 2012-01-12 04:11 am (UTC)
(Reply) (Parent) (Thread)
[User Picture]From: barouh
2012-01-12 07:06 am (UTC)
1. совпадение в пределах 10%, и даже в пределах 2-3% действительно весьма и весьма вероятно - но в приведенных мною примерах речь идет именно о десятых процента

1а. про случайные предпочтения - я же изначально в качестве базового допущения принимаю, что электоральные предпочтения на всех участках в пределах ТИКа одинаковые, т.е. что на всех участках действуют одни и те же факторы. Но поскольку распределение избирателей внутри района между участками проводится не на основе поименных данных о политических предпочтениях (а по поселениям и домам), то на выборах должны проявляться случайные отклонения отдельных участков от общей по району картинки (случайные отклонения, аналогичные отклонениям выборки от генеральной совокупности)

3. Так я эту гипотезу уже проверил. Я же считал вероятности попадания результатов в фактически получившиеся диапазоны для всех ТИКов России. Но вероятности меньше одного случая на 100 тысяч встречаются только в национальных республиках. Хотя нет, вру: еще в одном из районов Ижевска 4 участка совпадают с точностью до сотых процента в голосовании за ЕР на средних для этого района 37,7% (но это всего 4 участка). А если смотреть на более многочисленные группы участков в "чистых" регионах, то самые маленькие вероятности - для 6 участков в Зеленогорске (Красноярский край) и 7 участков Центрального района Оренбурга. Соответственно 1/3928 и 1/2005.
То есть ничего похожего на удивительные совпадения в северокавказских республиках

4. Про 8947-8970 рублей: достаточно, чтобы доля не получающих гипотетическое пособие на одном участке была бы на 0,3% выше, чем на другом участке, чтобы разброс средних значений оказался бы выше. Или, наоборот, достаточно 1 человека на 1000 с доходами в 23 тысячи рублей, чтобы соответствующий участок вылез за верхнюю планку
(Reply) (Parent) (Thread)