kouprianov (kouprianov) wrote,
kouprianov
kouprianov

Categories:

Болгария-2009, Чехия-2010, Польша-2011: картинки с выборов

Когда появились первые картинки по поводу выборов 4 декабря, почетное место среди них заняла диаграмма рассеяния в координатах «явка на избирательный участок» / «доля голосовавших за ЕР». Облако точек было заметно вытянуто по диагонали, упираясь верхним правым концом в стопроцентные явки со стопроцентными значениями по ЕР. Незатейливо накинутая на это чудо прямая линейной регрессии шла по оси вытянутого облака из нижнего левого угла в верхний правый.


Посмотреть на Яндекс.Фотках
Эта самая картинка от a_marko, которую он мне забросил в комменты.

Это, наряду с подпрыгивающим на кратных пяти значениях «распределением Чурова», рассматривалось многими как достаточно убедительное доказательство массовых фальсификаций на выборах, выполнявшихся, в основном, путем бесхитростного вброса бюллетеней, каруселей/ручейков и/или принуждения избирателей к голосованию за ЕР, по крайней мере, в «аномальной» правой части графика.

Скептики тут же отметили, что, если посмотреть на другие страны, по которым легко обнаружить данные (Англия и Германия), то и там можно наблюдать зависимость доли голосов за партию от доли избирателей, явившихся на участок. Объяснялось это тем, что электораты разных партий отличаются различной степенью активности (применительно к России это объясняли так: протестный электорат невелик и активен -- несогласных немного и на выборы они приходят все, какие есть, а вот избиратели ЕР многочисленны и ленивы, поэтому там, где они ленивы, процент ЕР невысок, а где не ленивы, там ЕР значительно обгоняет остальные партии, поскольку протестные избиратели уже закончились, а ЕР-овские все идут и идут).

Однако во всех записях на эту тему на момент их публикации (сейчас лень лезть проверять апдейты) отсутствовало обсуждение одного немаловажного параметра. По не вполне понятным причинам, скептики считали вполне достаточным показать, что коэффициент регрессионного уравнения, определяющий наклон прямой, достоверно отличается от нуля. Мне же казалось, что важнее посмотреть на коэффициент детерминации, показывающий, грубо говоря, на то, насколько облако вытянуто вдоль кинутой на него линии регрессии. Желающие могут взять в руки Ёксель и, сгенерировав случайную последовательность пар чисел, полюбоваться на линии регрессии с различным углом наклона, но довольно жалкими коэффициентами детерминации (дело облегчает то, что Ёксель не рассчитывает никаких других параметров, в частности, не дает ошибок и не указывает уровень значимости для коэффициентов уравнения линейной регрессии). Беглые подсчеты по партиям тех же Германии и Англии показывали заметно более низкий коэффициент детерминации (порядка 0.1 для ХДС/ХСС в Германии и 0.38 для консервативной партии в Англии), чем в случае ЕР (порядка 0.5), однако данные по Германии и Англии не устраивали меня по ряду причин. Во-первых, они были даны с меньшей степенью детализации (по России все смотрели на уровень УИК, а Англия и Германия были доступны на уровне примерно наших ТИКов). Во-вторых, Англия и Германия -- не самые близкие к нам страны по различным параметрам избирательной системы. Обе -- «старые» демократии (если исключить бывшую ГДР). В Англии пересчет волеизъявления избирателей в места в парламенте происходит по мажоритарной системе, в Германии -- по пропорциональной, но не совсем такой, как в России. Хотя бы эти факторы надо было исключить.

Стало быть, требовались страны (1) последней волны демократизации, (2) с пропорциональной системой представительства на основе партийных списков и с наличием порога прохождения партий в парламент. Изо всех таких стран (около 10 по предварительным подсчетам) данные были обнаружены и собраны по пяти (Эстония, Латвия, Польша, Чехия, Болгария), но только по трем последним их удалось собрать в нужной степени детализации (до уровня УИК по всем параметрам).

В целом, основные результаты таковы:

1. Распределения как явки на выборы, так и долей голосов за партии не проходят тестов на нормальность. Иногда бывают довольно причудливыми (см., например, некоторые партии в Болгарии и Польше). Подробный анализ причудливых случаев -- позже. Предварительная гипотеза связана со значительной неравномерностью расселения сторонников этих партий по территории страны (для Польши эта гипотеза по предварительным прикидкам, вроде бы, подтверждается, но надо систематически проработать этот вопрос).
2. В каждой из стран есть несколько размерных групп участков, несколько различающихся по явке (подробный анализ позже, замечу только, что в Болгарии и Чехии этих групп две, а в Польше -- не меньше трех, две из которых трудно(но)различимы).
3. Корреляции между явкой и долей голосов за партию крайне слабы. В большинстве случаев о них вообще не приходится говорить, когда они хоть сколько-нибудь выражены, то коэфф. детерминации не превышает 0.17 (всего из 55 партий такие большие значения отмечены у двух, еще у шести они едва -- но все же -- отличимы от нуля, у остальных -- считай нет вовсе). Значений, подобных тем, что наблюдаются у ЕР, нет вовсе.

Собственно, обзорная таблица и картинки:

Страна (год)Зарегистрировано избирателейДействительных голосовИзбирательных участковПартий всегоПрошедших в Парламент
Болгария (2009)6 973 7704 225 66711 863186
Чехия (2010)8 415 8925 230 85914 894265
Польша (2011)30 762 93114 369 50325 993115

Сначала -- общая картина по всем трем странам. Размеры избирательных участков (в душах зарегистрированных избирателей) и явка.

plot_vs_hist.turnout_et_electorate.bg.2009-cz.2010-pl.2011

Теперь -- картинки по прошедшим в Парламент / Сейм партиям: доля голосов как функция явки.

plot_vs_hist.parties.bg.2009

plot_vs_hist.parties.cz.2010

plot_vs_hist.parties.pl.2011

Чтобы не утомлять таблицей, привожу картинку про коэфф. детерминации.

hist.rsq.55pt.bg-2009.cz-2010.pl-2011

С благодарностью podmoskovnik, oude_rus, kobak, jemmybutton за общие идеи по поводу методов обработки (отдельное спасибо eugene_yakovis за привлечение внимания к записи jemmybutton о Германии), ishc, А. Шипунову, a_marko, anatol_olegych, ocehb, vlkamov за помощь с освоением perl и R, grey_dolphin за незримое присутствие, skytteanum, удалившему журнал, -- за помощь из подполья, последствия которой еще не очень заметны, а также совсем анонимным людям с IP разных стран за отдельные советы и комментарии.

Tags: 20111204, выборы
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 70 comments