Skip to main content

Глава 2. Математические методы фиксации способов достижения целей и задач авторитарной власти

Из книги «Выборы строгого режима»

Published onJun 12, 2022
Глава 2. Математические методы фиксации способов достижения целей и задач авторитарной власти

Эту главу вполне уместно начать c избитой, но актуальной цитаты Галилео Галилея: «Не должны ли мы признать, что геометрия является самым могущественным средством для изощрения наших умственных способностей и дает нам возможность правильно мыслить и рассуждать?» История показывает, что великие мыслители прошлого не случайно задумывались об основании, на котором должно стоять серьезное знание. Потому что для глубокого понимания и описания практически любых процессов, происходящих в природе и в обществе, необходимо привлекать разнообразный математический аппарат: иных способов описывать мир так, чтобы описание имело и предсказательную, и аналитическую силу, нам неизвестно. Даже в средней школе методы алгебры и геометрии демонстрируют полезность для понимания естественнонаучной картины мира (особенно в физике и химии). Более глубокие исследования требуют и более продвинутого аппарата, а для анализа социальных и политических процессов, которые складываются из действий множества отдельно взятых людей, не обойтись без методов теории вероятностей и математической статистики, о чем и пойдет сейчас речь.

Результаты выборов не являются ни среднеарифметической волей граждан, ни даже среднеарифметической волей избирателей. Выборы — это всегда результат волеизъявления избирателей, которые дошли до участков. Причины дойти до участков могут быть любые: по велению сердца или гражданского долга, по требованию начальника, потому что «все идут, и я иду», потому что на избирательном участке играет музыка и кормят пирожками, потому что дали денег, потому что не мог молчать… Таких причин можно назвать множество, но одно следует сказать наверняка: выборы всегда являются сочетанием явки и волеизъявления. Наличие «темной материи» не ходящих на выборы избирателей (на федеральных выборах 2000–2021 годов в России их доля составляла от 35 до 65%) дает почву для многочисленных спекуляций об их политических предпочтениях: то ли они полностью конформны и согласны с действующей властью и потому не считают для себя нужным ходить на выборы, то ли, наоборот, радикально оппозиционны и «не хотят участвовать в фарсе». Однако эмпирические данные не показывают радикального отличия политических предпочтений «молчунов» от голосующих избирателей1.

Закрепленные законодательством сложные процедуры подсчета голосов призваны обеспечить корректность процедуры голосования и подведения его итогов. В свою очередь, несоблюдение процедур и их законодательное размывание создают благоприятные условия для манипуляции голосами (в особенности при наличии большой доли не участвующих в голосовании избирателей) и фальсификации результатов. Но даже в условиях авторитарного режима, выстроившего избирательную систему «под себя» с целью получения заранее запрограммированного парламентского большинства, результаты выборов можно проанализировать и защитить.

В этой главе мы хотим продемонстрировать простую мысль: осмысление результатов выборов, и в частности их достоверности, возможно с использованием методов математики. Причем методы эти позволяют не только установить некие «аномалии», но и зачастую выявить и смоделировать их причины, возможные механизмы их реализации, а также (в определенных пределах) восстановить реальную картину голосования даже при наличии нарушений при подсчете голосов.

Можно начать с общего вопроса: как изучать большие системные процессы «внешними методами», не имея полноценного доступа к происходящему внутри системы? Электоральная система именно такова. Мы имеем доступ к довольно специфическим статистическим данным: явка, ее динамика по часам, итоговое число проголосовавших за кандидатов с разбивкой по участкам. При этом, основываясь на данных, поступающих от независимых наблюдателей, есть основания предполагать, что данные эти на многих участках (но не на всех) могут быть существенно искажены. Важно, что искажения не являются тотальными: наличие определенной доли участков с честно посчитанными результатами дает, с одной стороны, базу для оценки реального результата, с другой — основания для идентификации участков с недостоверными результатами. Также важно, что нам доступны данные с детализацией до участков — то есть до того уровня, где происходят (или не происходят) реальные фальсификации, именно это позволяет отделить «чистые» результаты от «нечистых» (подвергшихся административному вмешательству) на основании их статистических характеристик.

Прежде чем переходить к подробному разбору задачи, необходимо сделать несколько оговорок. Во-первых, сами по себе численные результаты не могут что-либо доказать, поскольку всегда необходима проверка причинно-следственной связи. Например, даже если мы обнаружим корреляцию между погодными колебаниями на Марсе и сменой президентов США, причинно-следственной связи между ними явно нет. Во-вторых, анализ крупномасштабной статистики, как правило, не позволяет сделать выводов о конкретных нарушениях на конкретном участке. Отклонения (в том числе и значительные) от средних значений всегда возможны, однако (как мы поясним ниже) эти отклонения не могут быть абсолютно произвольными. Грубо говоря, если на сотне схожих избирательных участков (например, расположенных в одинаковых по социальному уровню жителей спальных районах города) явка колеблется от 40 до 50%, а на одном мы видим явку в 38%, это может быть случайной флуктуацией. А вот наличие участка с явкой в 10% — уже аномалия, которая должна быть чем-то объяснена. Понять, какие показатели аномальны, а какие, что называется, находятся в пределах разумного, можно именно при помощи математики. В нормальной ситуации в подобных случаях математика играет экспертную роль, выявляя аномалии, а решение о наличии или отсутствии фальсификаций в каждом конкретном случае принимает суд (например, математическое моделирование является стандартным аргументом в делах о перенарезке избирательных округов в США в целях устранения последствий джерримандеринга2). Тем не менее даже в отсутствие работающего независимого суда статистические методы позволяют оценивать общие масштабы фальсификаций, а в некоторых случаях и доказывать их наличие с высочайшей степенью уверенности.

Прежде чем углубиться в электоральную математику, попробуем начать с отвлеченного примера, ставшего в последние годы крайне важным для обывателей, — с оценки эффективности вакцин против COVID-19. Для того чтобы убедиться в том, что большинство распространенных в мире вакцин (Pfizer, Moderna, Sputnik-V и другие) работают и обеспечивают достаточно высокий уровень защиты, можно не читать сложных статей по медицине. Для этого вполне достаточно самостоятельно (!) изучить известную открытую статистику.

Речь, конечно, не о рассказах про «одного знакомого», которому поплохело после прививки, или про неких медийных персонажей, которые после прививки заболели и умерли. Дело тут не только в набившей оскомину тезе «после не значит вследствие», но и в том, что подобные рассуждения неявным образом исключают из рассмотрения общую картину происходящего. Если человек, попав в аварию, получил серьезные травмы, будучи пристегнутым (даже если он получил травму от ремня безопасности!), это не значит, что пользоваться ремнями безопасности вредно: ремень значительно повышает безопасность. Почти всегда в аварии непристегнутый человек получит большие травмы, чем пристегнутый. Тоже и с прививками: если человек умер, будучи привитым, это не значит, что, заболев, он бы выжил, не будучи привитым.

Корректный вопрос об эффективности вакцин можно сформулировать так: «Снижает ли наличие вакцинации риск заболевания или, при условии того что человек заболел, риск перехода заболевания в тяжелую форму?» При этом совершенно бессмысленным является сравнение количества привитых и непривитых от COVID-19, попавших в стационар, поскольку игнорируется процент привитых людей «в популяции».

Применение формулы условной вероятности (теорема Байеса) немедленно показывает, что поскольку доля привитых3 «в больнице» меньше, чем процент вакцинированных «всего», значит вакцина эффективно снижает вероятность попадания в больницу, то есть вакцинированным реже требуется медицинская помощь, что подтверждает эффективность вакцинации.

Рассмотрим этот вопрос подробнее. Напомним формулу Байеса:

P(AB)=P(BA)P(A)P(B)P(A|B)=\frac{P(B|A)P(A)}{P(B)}

Через P (A | B) обозначается условная вероятность, то есть произошло событие A при условии того, что произошло событие B. Положим, что событие A обозначает «попадание в больницу» (то есть долю попавших в больницы), а событие B — вероятность того, что человек привит (доля вакцинированных). В таком случае вероятность попасть в больницу, будучи привитым, вычисляется через знание доли привитых в больнице P (B | A), доли заболевших P (A) и доли вакцинированных. Таким образом, мы обязаны P (B | A) разделить на долю вакцинированных, что несколько контринутивно. Подтверждение того, что доля попавших в больницу вакцинированных заметно меньше, чем P (A), просто доли заболевших, легко проводится с использованием открытых данных. Показательно, что изучать этот вопрос приходится не по данным российского Минздрава (которых фактически не существует), а по данным минздравов Аргентины, Венгрии и других стран, в которых используются интересующие нас вакцины.

Гипотетически подобная разница может объясняться какими-то другими, не фармакологическими, факторами. Например, ответственностью вакцинированных, которые используют иные средства защиты (маски, дистанцирование). Однако подтверждения подобных альтернативных причин статистического феномена не существует. Так что, пользуясь бритвой Оккама, приходится сделать вывод об эффективности вакцинации как меры, снижающей вероятность тяжелого течения болезни.

Другой регулярно встречающийся в публичном пространстве вопрос — процент смертности и якобы наличие иммунитета или склонности к заболеванию у различных категорий граждан. Например, версия о том, что курящие заболевают с меньшей вероятностью, чем некурящие. С другой стороны, были многочисленные упоминания о смертности чуть ли не в 30–40% в домах престарелых и среди пожилых людей. Не умаляя фактора вируса, отметим, что без дополнительных уточнений подобные рассуждения некорректны, поскольку пожилые люди в любом случае входят в повышенную зону риска, а для подтверждения якобы иммунитета у курящих использовалась некорректная выборка. Впрочем, «средняя по больнице» смертность — тоже цифра лукавая. Реальная вероятность осложнений для пожилого курящего, страдающего ожирением диабетика в любом случае будет кратно выше, нежели для молодого, ведущего спортивный образ жизни человека. Как говорится: «Я ем капусту, барин — мясо, а в среднем — голубцы».

Приведенные выше соображения нужно учитывать не только для анализа вакцин, но и для изучения любой информационно закрытой системы. В том числе выборов. Вообще, нам бы очень хотелось убедить наших читателей в том, что статистика и теория вероятностей совершенно необходимы в современном мире для понимания происходящих в нем процессов.

Но вернемся к электоральным процедурам и для начала обсудим несколько модельных примеров. Рассмотрим пока только такой показатель, как явка избирателей. То есть нас пока будет интересовать только один вопрос: пришел избиратель на выборы или не пришел. В этой ситуации можно сопоставить каждому избирателю случайную величину, которая принимает значения 1 (пришел) и 0 (не пришел). Явка — это отношение суммарного числа всех пришедших на участки избирателей (или, что то же самое, суммы соответствующих случайных величин), поделенная на число избирателей в списке. Если на участке зарегистрирована 1000 человек, из которых 600 пришли, а 400 не явились, то получаем 600/1000, то есть явку в 60%.

Это фактически модель схемы Бернулли. У нас выпадают +1 с вероятностью p и 0 с вероятностью 1 – p, где p численно равно средней явке (следует из определения математического ожидания). В предположении, что люди голосуют независимо, мы получаем: вероятность достижения на данном участке 100% явки равна p1000 (показатель степени равен числу зарегистрированных избирателей). При любых значениях p, сколько-нибудь отличных от 1 (не только при реалистичном p = 0,6, как в приведенном выше примере, но и при, скажем, p = 0,99), это число неотличимо от нуля. Между тем в официальных результатах выборов в России участки с тысячами избирателей и явкой 100% встречаются рутинным образом — за примерами можно обратиться к результатам выборов в Государственную Думу 2016 года в Кемеровской области. При этом на соседних участках того же населенного пункта явка может составлять, скажем, 80% или 60%. Такая разница в явке может иметь два объяснения: либо величина p, характеризующая общую склонность локальной совокупности избирателей ходить на выборы, действительно настолько резко различна на соседних участках, либо результаты подсчета на одном из участков недостоверны. По совокупности общих житейских соображений (например, знания о том, что нарезка избирательных участков в условиях города достаточно случайна и произвольна) и эмпирического опыта (например, наличия видеозаписей, на которых зафиксированы вбросы в избирательные урны) реалистичным представляется именно второй вариант.

Пойдем дальше. В рамках предложенного выше описания, когда избирателю сопоставляется бернуллиевская случайная величина, явка на каждом избирательном участке тоже представляет собой случайную величину — биномиальную, масштабированную на интервал от 0 до 1 (от 0 до 100%). При типичных значениях численности избирателей на участке (1500–2500 человек для городов) такая случайная величина неотличима от гауссовой со средним значением p и дисперсией порядка 1–2 процентных пункта. Если рассматривать совокупность избирательных участков примерно одинакового размера и с примерно одинаковым составом населения (то есть близкими значениями параметра p), например, в пределах одного города, то явку на них можно по-прежнему рассматривать как случайную величину с распределением, представляющим собой наложение узких гауссовских колоколов с несколько различающимися средними и дисперсиями, но без сильнодействующих факторов, которые бы радикально по-разному (и желательно дискретно) влияли на величину p на разных участках, распределение явки все равно остается колоколообразным и достаточно узким4. Поэтому если мы видим, например, среднюю явку в интервале от 55 до 65%, а на другом, расположенном поблизости, участке наблюдаем явку, скажем, в 5%, то это уже аномалия, которая требует объяснения. Что случилось? Локальный бойкот выборов, эпидемия, стихийное бедствие, аннулирование избирательной урны из-за нарушения процедур? В данном случае основания для сомнений в истинности результатов выборов возникают при их анализе с помощью теории вероятностей, которая дает нам необходимые инструменты: дисперсия, математическое ожидание, неравенство Чебышева, различные предельные теоремы.

В приведенном выше примере мы можем посчитать дисперсию, а неравенство Чебышева дает нам вероятность того, что отклонение от средней явки на некую величину обратно пропорционально отношению дисперсии к этой величине. Собственно, неравенство состоит в следующем:

P(Xμ)>a)<σ2a2P(|X-\mu|)>a)<\frac{\sigma^2}{a^2}

Здесь σ обозначает стандартное отклонение случайной величины (корень из дисперсии). Из неравенства мы получаем, что вероятность отклонения более чем на три средних отклонения (то есть когда a ≥ 3σ) составляет около 10%. Соответственно, появление в нашем примере участка с явкой в 5% — событие, имеющее вероятность, близкую к нулю (в математическом смысле этого слова), поскольку тут куда более чем три стандартных отклонения. Может такое быть? Теоретически может, но вероятность этого крайне низка. Как и, к примеру, вероятность авиакатастрофы.

Конечно, при таких сравнениях результатов требуется осторожность. К примеру, при средней явке на выборах в 60% наличие некоторых участков с явкой в 100% может быть объяснимо: бывают маленькие участки на несколько человек, возможно, в сельской местности, где голосуют «всем селом», бывают участки на полярных и научных станциях и т. д. Однако, если мы рассмотрим избирательные участки, расположенные в спальных районах большого города, исключив «особые» участки (родильные дома, тюрьмы, больницы и т. п.), и увидим, что на всех них явка 60%, а на одном — 5%, это серьезный повод насторожиться.

Отметим, что ситуация, когда в разных регионах происходит полярное голосование, возможна. К примеру, половина страны выборы бойкотирует, а вторая половина активно участвует. Тогда, теоретически, вполне возможны «двугорбые» распределения и другие странности5. Однако подобные «чудеса» должны иметь рациональное социологическое объяснение. Например, переход от традиционно очень узкого к очень широкому (хотя все равно «одногорбому») распределению по явке на участках произошел после 2015 года в Венесуэле, когда оппозиционно настроенные к режиму Мадуро избиратели (сосредоточенные в более экономически благополучных в прошлом районах) решили бойкотировать выборы. А вот ситуация, в которой «без наблюдателей» имеется одно распределение, а «с наблюдателями» в том же регионе — совершенно другое, маловероятна. Хороший пример такого различия, причем даже не с «человеческими», а с «механическими» наблюдателями (КОИБ), имел место в Москве в ходе думских 2007 года и президентских 2008 года выборов6. Например, в 2007 году на участках с КОИБ среднее значение явки находится в районе 55%, а «купол» распределения сосредоточен в диапазоне от 40 до 70%. Соответственно, наличие на участках без КОИБ существенного превышения числа участков с явкой более 70% выглядит как аномалия. Эта аномалия становится тем более странной, когда распределение явки на участках с КОИБ более или менее симметрично, а на участках с обычными избирательными урнами оно удивительным образом асимметрично и скошено именно в сторону повышенных явок. Для более строгих рассуждений можно взять исходные данные по явке, вычислить матожидание, дисперсию соответствующих случайных величин и воспользоваться упомянутым выше неравенством Чебышева. В результате мы приходим к выводу, что либо теория вероятностей на отечественной почве не работает, либо в ходе голосования имели место масштабные вбросы. Отметим, что на президентских выборах 2008 года различие между участками с КОИБ и без становится еще более радикальным. При этом в «постболотный» период (после 2011 года) распределение явки в Москве вполне соответствует математическим законам.

Остановимся более подробно на тезисе об описании поведения отдельного избирателя (и избирательного участка в целом) случайной величиной. Обоснование этого тезиса носит не математический, а социологический характер. Анализируя выборы в различных странах с разной политической обстановкой, несложно убедиться, что всегда и везде, кроме специфических, легко объяснимых случаев, мы видим достаточно однотипную картину распределения участков по явке: гладкий, слегка асимметричный колокол7. Ничего похожего на легендарную «пилу Чурова»8 (график с огромными пиками на целочисленных «красивых» значениях явки в 60, 65, 70, 75 и т. д. процентов) мы не видим нигде, кроме России. Так что выбирать придется одно из двух: или в России статистика работает не так, как в других странах мира, или выборы являются сфальсифицированными. Утверждение, что электоральная статистика не подчиняется математическим законам, сродни утверждению ребенка, что соседское окно разбилось из-за попадания в него метеорита, а не из-за того, что ребенок попал в окно мячом. Гипотетически такое возможно, но требует экстраординарных доказательств.

Надеюсь, нам удалось более или менее убедительно пояснить, что статистический анализ адекватно применим к исследованию результатов выборов. Еще раз подчеркнем, что в нормальной системе рассуждения, аналогичные приведенным выше, должны рассматриваться в судах в качестве доказательств, когда результаты выборов кем-либо ставятся под сомнение. Однако в политической ситуации, когда прямому наблюдению за выборами созданы специальные законодательные преграды, порой делающие его практически невозможным, применение математической статистики становится практически единственным инструментом, позволяющим схватить за руку жуликов, которые воруют наши голоса, и оценить масштабы этого воровства.

Аномалии статистики российских выборов
и оценка фальсификаций

С учетом изложенных выше общих соображений о применимости методов статистики к анализу выборов перейдем к анализу конкретной российской электоральной действительности. Помимо общих математических и статистических соображений, этот анализ в существенной степени опирается на конкретные особенности российской выборной системы и доступные данные, а также на опыт и знания, накопленные за постсоветский период специалистами по анализу выборов, наблюдателями, независимыми членами избирательных комиссий и видеонаблюдателями.

Доступные нам данные выборов являются существенно многомерными: по каждому избирательному участку есть данные о количестве зарегистрированных избирателей, количестве проголосовавших за каждого кандидата, количестве недействительных бюллетеней, данные о динамике явки в течение дня голосования. Также каждый участок вписан в окружение соседних (пространственный контекст), имеет историю предшествующих и проходящих параллельно выборов (исторический контекст) и т. д. Такая многомерность, с одной стороны, облегчает выявление возможных аномалий, с другой — создает необходимость первичной обработки и наглядного представления этих данных, которые позволили бы получить общий обзор картины голосования до анализа деталей. В нашем анализе в качестве такого наглядного представления мы используем две «проекции» данных по избирательным участкам, представленные на диаграмме с двумя панелями. Пример такой диаграммы для данных голосования по поправкам в Конституцию Российской Федерации приведен на рис. 1.

Рисунок 1

В правой панели представлена диаграмма рассеяния избирательных участков в координатах «явка на участке — результаты кандидатов». Каждому участку соответствует столько точек, сколько имеется кандидатов (в данном случае «кандидатов» три — «Да», «Нет» и недействительный бюллетень). Выбор этих координат неслучаен: оба эти параметра являются важными для отчетности и потому могут служить важным индикатором применения админресурса. В левой панели показаны распределения голосов за кандидатов по 1%-ным интервалам итоговой явки на избирательных участках; отдельно штриховкой показано отличие формы распределения голосов за административно поддерживаемого кандидата («А-кандидата», в данном случае кандидата «Да») от формы распределения голосов за прочих кандидатов (в данном случае «Нет» и недействительного бюллетеня) на высоких явках.

Диаграмма рассеяния для А-кандидата в правой панели имеет вид «кометы», состоящей из двух существенно различных по характеру частей: компактного «ядра» вокруг явки примерно 45% и результата около 65% и вытянутого «хвоста», тянущегося к 100%-ным значениям явки и результата. При этом в хвосте, в отличие от ядра, присутствует специфическая сетчатая структура: участки склонны группироваться вокруг целочисленных процентных и особенно кратных 5% значений явки и результата. Еще одна важная деталь состоит в том, что итоговые официальные значения явки и результата (показаны крестиком) попадают «в молоко» — в область между ядром и хвостом, где концентрация избирательных участков существенно меньше, чем внутри ядра и в наиболее плотной части хвоста. То есть получается, что «среднестрановых» избирательных участков нетипично мало, существенно меньше, чем участков с большими и меньшими значениями явки и результата.

Все это наводит на мысль, что в формировании распределения участков по явке и результату принимали участие два разных механизма: один для ядра, другой, отличный от первого, для хвоста. Ключом к пониманию природы «хвоста» является наличие сетчатой структуры — концентрация избирательных участков на «красивых», с человеческой точки зрения, процентных значениях. Как говорилось в предыдущей главе, величина явки на избирательных участках, складывающаяся как сумма решений независимых избирателей, представляет собой случайную величину, распределение которой имеет естественную ширину, ограниченную снизу шириной биномиального распределения для типичных значений явки и численности зарегистрированных избирателей, которая во всех реальных ситуациях имеет порядок 1%-ного пункта. Между тем наблюдаемая структура соответствует концентрации избирательных участков в узких интервалах шириной в десятые доли процента — примерно так, как если бы нам удалось нарисовать на бумаге миллиметровую сетку малярной кистью. В работе9, написанной на материале федеральных российских избирательных кампаний 2000–2012 годов, показано, что вероятность образования таких структур при свободном волеизъявлении избирателей астрономически мала, однако, как мы видим, они продолжают возникать.

Какой же механизм способен обеспечить такую точную группировку результатов и явок на участках вокруг «красивых» процентных значений? Очевидно, что этот механизм как-то связан с десятичной системой, потому что в других системах счисления «красивые» проценты никак не выделены. Например, если бы на правую диаграмму посмотрели семипалые инопланетяне, пользующиеся семеричной системой счисления, они могли бы сделать вывод, что ее авторами являются существа, для которых числа 5 и 10 имеют какое-то особое значение. И такие существа нам известны: это люди. То есть «десятичная» структура — это результат влияния человека. При этом, как уже говорилось, воздействие на уровне свободно голосующих избирателей (например, путем агитации для повышения явки) не позволяет достичь желаемых показателей с необходимой точностью в десятые доли процента в силу статистической природы итоговых показателей голосования. Остается предположить, что формирование сетчатой структуры в хвосте распределения — это следствие воздействия на явку и результат уже на уровне избирательного участка, то есть фальсификации.

В картину фальсификации укладывается и общая форма хвоста распределения на диаграмме: рост результата А-кандидата с явкой и соответствующее падение результатов прочих кандидатов. Такой рост соответствует простейшему механизму фальсификации: вбросу бюллетеней или приписке голосов за желательного кандидата. О том, что такое явление существует, мы хорошо знаем от наблюдателей на местах и особенно из записей видеонаблюдения с избирательных участков. При добавлении бюллетеней за административного кандидата происходят две вещи: избирательный участок сдвигается вправо по явке (всеми своими «точками», в отношении всех кандидатов), кроме того, процентный результат административного кандидата увеличивается (поскольку за него добавили голоса), а результаты остальных кандидатов уменьшаются (поскольку добавленные голоса за А-кандидата увеличивают общее число поданных голосов, стоящее в знаменателе процентных результатов). Таким образом, точки А-кандидата смещаются вправо и вверх, а точки остальных кандидатов — вправо и вниз, что мы и наблюдаем в правой панели.

В таком предположении становится понятен и механизм возникновения «красивых» результатов и явок: администрация избирательного участка добрасывает голоса не до какого-то произвольного числа, а до получения значений явки или результата административного кандидата, которые ей представляются желательными из каких-то соображений (или из спущенных сверху указаний). И тут проявляется еще одно важное свойство статистики больших наборов чисел: даже если доля таких «рисующих» избирательных комиссий невелика и каждая из них действует независимо, на уровне страны тенденция становится видна.

Важно, что концентрация избирательных участков на целочисленных процентах — свойство именно хвоста «кометы» в правой панели, но не ее ядра. Это оправдывает наше предположение о том, что механизмы формирования ядра и хвоста на диаграмме различны. Более того, это не единственная аномалия, свойственная участкам в хвосте. В графах протоколов с избирательных участков хвоста также аномально много чисел, заканчивающихся на 0 и 5, что тоже характерно для чисел, нарисованных «из головы», и не свойственно числам, возникшим в результате случайного процесса, каким является голосование избирателей. Кроме того, в «хвосте» наблюдаются и другие структуры, невозможные при свободном голосовании избирателей. Например, кластер точек в районе явки 63% и результата «Да» 78% (рядом с черным крестиком) — это практически все избирательные участки города Казани, за исключением нескольких, закрытых независимыми наблюдателями (там явка составила от 32 до 40%), и нескольких, показавших явку под 100%. Как и в случае обсуждавшейся выше сетчатой структуры, этот кластер слишком тесный, чтобы образоваться в результате свободного голосования на участках, а значит, можно говорить о широкомасштабной фальсификации результатов в масштабах миллионного города.

Обратимся теперь к левой панели диаграммы. Здесь приведена гистограмма распределения голосов за кандидатов по явке (количество голосов, поданных за кандидатов на участках, сгруппированных по интервалам итоговой явки размером 1% от целого процента до целого; значение явки 100% рассматривается как отдельный интервал). Фактически это проекция (маргинал) двумерного распределения из правой панели на ось явки. Тонким пунктиром показано распределение голосов «Нет» и недействительных бюллетеней, масштабированное так, чтобы совпадать с распределением голосов «Да» на низких явках. Мы видим, что в диапазоне явок, соответствующем положению ядра в правой панели, формы этих двух распределений действительно совпадают, а в области «хвоста» расходятся. Если мы принимаем, что «хвост» — это участки, где имел место вброс голосов за административного кандидата, то при достаточно общих предположениях количество вброшенных за А-кандидата голосов дается заштрихованной площадью между двумя гистограммами — А-кандидата (красная линия) и масштабированной гистограммой голосов за остальных кандидатов (серая линия). Это число обозначено в легенде левой панели (26 929 тысяча аномальных голосов). В случае если фальсификации имеют более сложный характер (например, явку и результаты просто «рисуют»), посчитанное таким образом количество аномальных голосов перестает быть численно точной оценкой объема фальсификации, но остается полезным индексом, показывающим масштаб фальсификации и пригодным, например, для сравнительного и исторического анализа, которому будет посвящена следующая глава. Кроме того, отметим, что сетчатая структура правой диаграммы в левой панели превращается в «пилу Чурова» — зубчатую форму распределения с пиками на пропорциональных 5% значениях явки.

Замечание 1. С математической точки зрения анализ данных выборов, содержащих фальсифицированные (искаженные) значения, можно рассматривать как задачу робастной (устойчивой к искажению части данных) статистики. Такие задачи возникают при обработке данных, часть которых может быть искажена, например, в результате ошибок измерения, воздействия внешних факторов или примешивания данных другой природы. Известные примеры робастных статистических показателей — медиана и межквартильный размах, дающие робастную замену соответственно среднего и среднеквадратичного отклонения. Применяемый здесь метод оценки количества аномальных голосов (и, соответственно, очищенного от фальсификаций результата голосования) можно рассматривать как специализированный показатель робастной статистики, учитывающий априорное знание о характере ожидаемых искажений данных.

Замечание 2. Может возникнуть вопрос: не слишком ли смело мы относим к числу участков с фальсификациями весь «хвост» в правой панели диаграммы, хотя статистические аномалии вроде процентной сетки, с какой бы математической строгостью они ни были доказаны, затрагивают лишь небольшую долю находящихся в «хвосте» участков? Поступая так, мы учитываем целую совокупность обстоятельств, помимо наличия статистических аномалий. Во-первых, в отличие от ядра, «хвост» может возникать и пропадать на уровне регионов в зависимости от политических обстоятельств: так, в Москве он наблюдался в период с 2007 по 2011 год и мгновенно пропал после массовых протестов зимы 2011–2012 года (возникнув вновь лишь на конституционном голосовании 2020 года). В Республике Коми «хвост» в распределениях участков пропал после ареста губернатора Гайзера и, попутно, председателя республиканского избиркома. В Хабаровском крае «хвосты» распределений исчезли после избрания губернатора Фургала. Наоборот, в Самарской области «хвосты» резко выросли после прихода из Мордовии губернаторской команды Меркушкина. В районах Московской области «хвосты» возникают и исчезают причудливым образом в зависимости от смены районных властей. Этот ряд примеров можно продолжать, и все они указывают на то, что природа «хвоста» не социологическая, а административная. Во-вторых, характерные для «хвоста» значения явки и результата не наблюдаются на участках, где присутствуют независимые наблюдатели. В-третьих, в редких случаях зафиксированных судебными решениями фальсификаций на избирательных участках мы видим, как фальсифицированные результаты голосования из «хвоста» после корректировки превращаются в реальные в «ядре»10. В-четвертых, недостоверность высоких явок участков «хвоста» подтверждается просмотром записей видеонаблюдения, когда они доступны11. В соответствии с принципами «утиной типизации» (если что-то ходит, как утка, крякает, как утка, и выглядит, как утка, то это и есть утка) и «тринадцатого удара часов» (если часы пробили в тринадцатый раз, это ставит под сомнение предыдущие 12 ударов) все эти (и другие, не упомянутые здесь) соображения позволяют отнести к фальсифицированным не только те участки «хвоста», для которых наличие фальсификаций доказано статистически или иным образом, но и их «соседей» по диаграмме с аналогичными показателями явки и результата. Конечно, при таком подходе не исключено, что к фальсифицированным будет отнесено некоторое количество «честных» участков, на которых явка и результат в силу каких-то причин сильно отклонились от обычных, но в условиях недостаточного охвата независимым наблюдением и отсутствия судебной защиты, когда единственным путем исследования результатов выборов остается статистика, это лучший из доступных подходов.

История фальсификаций результатов федеральных выборов
в зеркале статистики

В этом разделе приведем краткий обзор фальсификаций на федеральных выборах 2000–2021 годов в терминах описанного выше показателя аномальных голосов, который позволяет оценить динамику административного вмешательства в избирательную систему. Данные федеральных голосований 2003–2021 годов доступны на сайте izbirkom.ru официально, данные выборов 2000 года размещены там же в недекларированном виде, но находятся поисковыми системами. Все массивы данных можно получить у авторов по запросу.

1. 2000 год. Выборы Президента Российской Федерации

Рисунок 2

Распределение результатов административного кандидата (Владимира Путина) на избирательных участках в координатах явка-результат представляет собой компактное облако вокруг официального результата (черный крестик), а распределение голосов за административного кандидата почти не отличается по форме от распределения голосов за прочих кандидатов. Количество аномальных голосов минимально (по российским меркам) — менее 3 миллионов голосов, — хотя при вычитании его из числа проголосовавших и числа голосов за Путина результат последнего становится опасно близким ко второму туру (рис. 2).

2. 2003 год. Выборы в Государственную Думу IV созыва

Рисунок 3

На парламентских выборах 2003 года у облака результатов административного кандидата (партия «Единая Россия») формируется «кометный хвост» в сторону повышенных явок и повышенного результата, а официальный результат «уезжает» из центра кометного ядра к краю. В свою очередь, распределение голосов за «Единую Россию» по явке, начиная с определенного процента, отклоняется вверх от формы распределения голосов за другие партии. Такая картина соответствует добавлению дополнительных голосов за А-кандидата на части участков — в результате соответствующие точки A-кандидата на левой диаграмме уезжают вправо (растет явка) и вверх (растет результат A-кандидата). Количество аномальных голосов составляет примерно 4 миллиона голосов из 23 миллионов, отданных за «Единую Россию» (рис. 3).

3. 2004 год. Выборы Президента Российской Федерации

Рисунок 4

На президентских выборах 2004 года «кометный хвост» вырастает и приобретает структуру: появляется повышенная концентрация точек на «красивых» явках, кратных 5%. На левом графике этому соответствуют зубцы, впоследствии получившие название «пилы Чурова» — в честь главы ЦИК в период 2007–2016 годов. Количество аномальных голосов за А-кандидата (Владимира Путина) достигает 8 миллионов.

Появление «пилы Чурова» знаменует собой важный переломный момент в эволюции выборной системы: возникновение централизованного спроса на «красивый» результат выборов. С тех пор этот феномен сохраняется в том или ином виде на всех федеральных голосованиях. О том же свидетельствует и второе наблюдаемое в правой панели явление — резкий скачок в плотности участков между 49 и 50% (на самом деле даже между 49,9 и 50%): видно, что явку систематически «перетягивали» через 50%, хотя для каждого отдельного участка этот показатель не имел никакого юридического смысла: для признания выборов состоявшимися необходимо было превысить явку 50% по стране в целом (рис. 4).

4. 2007 год. Выборы в Государственную Думу V созыва

Рисунок 5

На парламентских выборах 2007 года «хвост кометы» увеличивается, количество аномальных голосов за «Единую Россию» достигает 12 миллионов. Именно эти аномальные голоса обеспечили ЕР квалифицированное большинство в парламенте нового созыва (рис. 5).

5. 2008 год. Выборы Президента Российской Федерации

Рисунок 6

На президентских выборах 2008 года количество аномальных голосов превышает 14 млн, а «пила Чурова» проявляется не только в явке, но и в результате А-кандидата (Дмитрий Медведев) — «хвост кометы» становится клетчатым. На этой федеральной кампании впервые случились массовые манипуляции голосами избирателей в Москве (с количеством аномальных голосов около 1 миллиона) (рис. 6).

6. 2011 год. Выборы в Государственную Думу VI созыва

Рисунок 7

Парламентские выборы 2011 года до недавнего времени делили с президентскими выборами 2008 года звание самых «аномальных». Количество аномальных голосов снова превысило 14 миллионов, а «пила Чурова» после того, как ее стали обсуждать публично, ослабла в распределении явки, но усилилась в распределении результата «Единой России» (горизонтальные линии в «хвосте кометы»). Аномальные голоса обеспечили «Единой России» простое большинство в парламенте (рис. 7).

7. 2012 год. Выборы Президента Российской Федерации

Рисунок 8

После массовых протестов осени-зимы 2011 года на президентских выборах 2012 года интенсивность административных манипуляций немного уменьшилась, а количество аномальных голосов уменьшилось в полтора раза. С этого же момента и до 2020 года практически полностью пропали выборные фальсификации в Москве (рис. 8).

8. 2016 год. Выборы в Государственную Думу VII созыва

Рисунок 9

На выборах 2016 года, по следам протестов 2011–2012 годов, выборные манипуляции были вынесены из городов на периферию, подальше от наблюдателей. В результате возник феномен «двугорбой России» — половина голосов за «Единую Россию» была получена не в основном «ядре» участков, а в «кометном хвосте». Как следствие, половину урожая голосов за «Единую Россию» по пропорциональному списку дали избирательные участки с численностью избирателей 23% от общероссийской, а другую половину — остальные участки с 77% избирателей. Официальный результат выборов в итоге далеко вышел за пределы основного облака. Аномальные голоса обеспечили ЕР 50% мест по пропорциональному списку (рис. 9).

9. 2018 год. Выборы Президента Российской Федерации

Рисунок 10

На президентских выборах 2018 года манипуляции с голосами вновь «пригасили», и количество аномальных голосов уменьшилось до 10 миллионов (рис. 10).

10. 2020 год. Голосование по поправкам к Конституции

Рисунок 11

Общенародное голосование 2020 года проводилось по новой многодневной схеме, и в принципе можно было бы ожидать какой-то новой статистической картины. Например, более широкий охват уличным голосованием мог бы расширить распределение явки без изменения соотношения между сторонниками и противниками поправок — и такое действительно наблюдалось в отдельных регионах. Однако на уровне страны в целом картина получилась привычная, хотя и превосходящая все до сих пор виденное. Судя по общей картине и по сообщениям с мест, недельное предварительное голосование использовалось просто как удобный механизм для неконтролируемого добавления голосов «за».

На этом голосовании впервые за всю историю федеральных кампаний объем «ядра», посчитанный в зарегистрированных избирателях, оказался меньше объема «хвоста». Если принять (с некоторым запасом) за границу между «ядром» и «хвостом» отметку в 57% явки, то в «ядро» попадает примерно 34% зарегистрированных избирателей, а в «хвост» — примерно 66%. Результаты голосования соответственно составляют: в «ядре» явка 44%, за поправки 65%; в «хвосте» явка 80%, за поправки 82% (рис. 11).

На этом голосовании «сломался» так называемый «московский стандарт голосования», возникший в ответ на протесты 2011–2012 годов: примерно на трети участков города результаты подсчета были фальсифицированы.

11. 2021 год. Выборы в Государственную Думу VIII созыва

Рисунок 12

Выборы депутатов Государственной Думы в 2021 году прошли по трехдневной схеме и сопровождались широким применением электронного голосования, к которому есть целый ряд вопросов, выходящих за рамки данного анализа. Здесь рассматриваются только результаты «бумажного» голосования. Количество аномальных голосов за «Единую Россию» приблизилось к 14 миллионам и составило больше половины всех «бумажных» голосов, поданных за ЕР. Благодаря этому «Единая Россия» вновь получила половину мест по пропорциональному списку, хотя в реальности могла рассчитывать на треть.

По очищенной от фальсификаций явке — 38% (это голосование повторило рекордно низкую явку 2016 года), а по очищенному от фальсификаций результату «Единой России» по пропорциональной системе — 33% (антирекорд 2011 года — 34%). В совокупности это означает, что за ЕР было подано наименьшее абсолютное количество голосов за всю историю федеральных голосований. Официальный итог (явка + результат ЕР) (черный крестик в правой панели) оказался глубоко в «молоке»: участков с такими показателями крайне мало. В целом эти итоги фиксируют полный отрыв официальных результатов выборов от политической реальности (рис. 12).

Comments
0
comment
No comments here
Why not start the discussion?