Оценка явки на досрочном голосовании в Беларуси по данным официальных протоколов и наблюдателей
Исследователь электоральных трендов, физик
|
9 августа в Беларуси прошел основной день голосования по выборам президента Республики. Было и досрочное голосование, оно прошло 4-8 августа.
Полученная от наблюдательского сообщества Беларуси таблица содержит 5366 записей о количестве проголосовавших на избирательных участках Беларуси за 4, 5, 6, 7, 8 августа по данным официальных протоколов и/или наблюдателей (каждая запись — один участок за одно число с ненулевыми данными как минимум от наблюдателя и/или из официального протокола):
- 4 августа — 1230 записей
- 5 августа — 1530 записей
- 6 августа — 999 записей
- 7 августа — 977 записей
- 8 августа — 630 записей
В условиях, когда контроль явки на избирательных участках сильно затруднен и обеспечить сплошной контроль в течение всего досрочного голосования сложно, возникает задача оценки явки досрочного голосования на основании имеющихся фрагментарных (не обязательно покрывающих все дни голосования целиком) данных.
Анализ имеющихся данных
Рассмотрение имеющихся данных показывает, что в подавляющем большинстве случаев явка по данным официального протокола либо равна явке по данным наблюдателей, либо превышает ее. В качестве иллюстрации приведем гистограмму распределения избирательных участков по всей Беларуси по количеству проголосовавших на участке за 6 августа по данным официальных протоколов и по данным наблюдателей (шаг гистограммы 10).
Распределение участков по числу проголосовавших по данным наблюдателей имеет вид узкого колокола, в то время как распределение по данным избирательных протоколов, совпадая по моде с распределением по данным наблюдателей, имеет сильно затянутый хвост в сторону высоких явок. Длительный опыт исследования российских выборов показывает, что такой хвост с большой вероятностью свидетельствует о наличии приписок явки с целью фальсификации результатов голосования. Аналогичная картина наблюдается и для остальных дат.
Чтобы исключить влияние фальсификации на оценку, ограничимся теми записями из имеющегося массива данных, для которых результаты официальных протоколов подтверждаются данными наблюдателей. Считаем данные протокола о числе проголосовавших надежными, если они отклоняются от данных наблюдателя не более чем на 10% (оставляем допуск на ошибки подсчета наблюдателем).
Таких записей в имеющемся массиве данных имеется 1804 (примерно 1/3):
- 4 августа — 550 записей
- 5 августа — 493 записи
- 6 августа — 305 записей
- 7 августа — 278 записей
- 8 августа — 178 записей
Гистограммы распределения числа участков по количеству проголосовавших для «надежных» участков приведены ниже.
По набору надежных участков можно вычислить значения медианного и среднего количества проголосовавших на участке на каждую дату, а также межквартильное расстояние IQR и на его основании робастную оценку стандартного отклонения (IQR/1.35).
Медианное и среднее значение количества проголосовавших на участках за весь срок голосования можно приближенно оценить как сумму медианных и средних значений для отдельных дат соответственно. В качестве оценки статистической погрешности можно взять квадратный корень из суммы квадратов оценок стандартных отклонений по отдельным датам, (учитывая, что разброс количества проголосовавших включает в себя систематическую составляющую, связанную с неодинаковой численностью участков, полученная погрешность скорее является оценкой сверху).
Следует учесть, что выборка проконтролированных участков, по-видимому, является смещенной в сторону городских (более крупных) участков с численностью больше средней по Беларуси (которая составляет примерно 1150 человек).
Округляя, количество проголосовавших на попавших под контроль наблюдателей и аналогичных им участках можно оценить как:
На конец дня 07.08:
- медианная оценка 195 ± 55 избирателей
- средняя оценка 230 ± 55 избирателей
На конец дня 08.08:
- медианная оценка 230 ± 60 избирателей
- средняя оценка 280 ± 60 избирателей
Если исходить из средней по Беларуси численности избирателей на участке (1150 человек), это соответствует досрочной явке:
- на 7 августа 17% (медиана) — 20% (среднее),
- на 8 августа 20% (медиана) — 24% (среднее).
Учитывая, что проконтролированные участки, по-видимому, имеют численность выше средней, эти числа следует рассматривать как оценки сверху. Таким образом, официально заявленное значение досрочной явки (41.7%) со всей очевидностью является грубо завышенным (в 2 и более раза).
Абсолютное завышение числа досрочно проголосовавших можно оценить как (42% (официальная досрочная явка) — 24% (оценка средней досрочной явки на 8 августа))*6.8 млн избирателей = 1.2 миллиона избирателей (учитывая приведенные выше оговорки, это, видимо, оценка снизу с большим запасом).
Дополнение
Поступил второй набор данных для 258 участков, на которых наблюдателям удалось проконтролировать явку с первого до последнего дня досрочного голосования. Соответственно количество проголосовавших можно оценить напрямую по данным наблюдателей.
По этому набору результаты такие:
На конец дня 07.08:
- медианное количество проголосовавших 198 избирателей;
- среднее 216 избирателей.
На конец дня 08.08:
- медианное количество проголосовавших 272 избирателя;
- среднее 298 избирателя.
Итого прямая оценка совпадает с непрямой в пределах заявленной погрешности. Так что явку досрочного голосования действительно можно оценивать по фрагментарным данным с удовлетворительной точностью.