Między sondażem, a prognozą wyborczą

W czasie kampanii prezydenckiej prof. Radosław Markowski apelował na łamach Gazety Wyborczej, by ratować sondaże wyborcze. Była to odpowiedź na pojawiające się rozbieżności między wynikami badań różnych instytutów. Choć na zakończenie kampanii wyborczej różnice między sondażami się zmniejszyły, to ich oszacowania zdecydowanie rozminęły się z wynikami wyborów – niezależnie od stosowanej metody i instytutu prowadzącego badanie (po odjęciu niezdecydowanych), poparcie Bronisława Komorowskiego było przeszacowane o około 10 punktów procentowych, a Andrzeja Dudy i Pawła Kukiza niedoszacowane o około 5 punktów procentowych.

Przedwyborcza diagnoza prof. Markowskiego wydaje się trafna. Jeżeli celem publikowanych w mediach wyników ma być prognozowanie rezultatu wyborów, to konieczne są zmiany w sposobie prowadzenia badań, ich analizie i prezentacji wyników. Poprawnie przeprowadzony sondaż jest prawdopodobnie warunkiem koniecznym, ale z pewnością niedostatecznym opracowania trafnej prognozy wyborczej. Nie jest poprawne wnioskowanie, że skoro w sondażu 40% respondentów zadeklarowało głosowanie na danego kandydata, to w wyborach ten kandydat dostanie około 40% głosów. Dzieje się tak z przynajmniej czterech powodów.

W badaniach sondażowych zakłada się, że każda pełnoletnia Polka i pełnoletni Polak mają (w uproszczeniu) równe prawdopodobieństwo znalezienia się w próbie. Niestety, wiele osób odmawia udziału w sondażach przedwyborczych, przez co w praktyce założenie to nigdy nie jest spełnione. Badania wskazują również, że osoby chętniej biorące udział w badaniach, różnią się od tych, które częściej odmawiają odpowiadania na pytania ankietera. Może to powodować skrzywienie wyników sondażu – kandydat, którego zwolennicy rzadziej biorą udział w badaniach będzie w nich niedoszacowany. Aby poradzić sobie z tym problemem instytuty badawcze zwykle przeważają wyniki, tak aby próba odzwierciedlała strukturę populacji ze względu na płeć, wiek, wielkość miejscowości zamieszkania, województwo i wykształcenie. Jednak takie działanie nie skoryguje wyników sondażu, jeżeli niechęć do udziału w badaniach oraz preferencje wyborcze zależą od innych niż wymienione cech. Nie dadzą również poprawnego rezultatu w sytuacji, gdy – niezależnie od innych cech – wyborcy jednego z kandydatów będą częściej odmawiali udziału w badaniach.

Drugim ważnym problemem jest konieczność stwierdzenia, którzy respondenci rzeczywiście wezmą udział w wyborach. Nie wszystkie osoby deklarujące w sondażu oddanie głosu w wyborach rzeczywiście pójdzie zagłosować. Zwykle deklarowana w badaniach frekwencja jest wyższa od tej z dnia wyborów. Pojawia się problem, bo w sondażu wszyscy respondenci deklarujący udział w wyborach pytani są o to na kogo oddadzą głos. Jeżeli część z nich nie pójdzie na wybory, to ich deklaracje z badania nie przełożą się na wynik wyborczy. Nie ma powodu by sądzić, że preferencje wyborcze osób zdecydowanych pójść na wybory (twardy elektorat) nie różnią się od preferencji osób deklarujących, że pójdą, ale w rzeczywistości nie wezmą udziału w głosowaniu (miękki elektorat). Bez zastosowania bardziej złożonych wskaźników niż tylko pytanie wprost o planowany udział w głosowaniu, nie da się odróżnić preferencji wyborczych respondentów, którzy rzeczywiście wezmą udział w wyborach, od tych, którzy nie pójdą głosować.

Kolejną trudnością w przewidzeniu wyników wyborów na podstawie badań sondażowych są odpowiedzi nie wiem/trudno powiedzieć. W celu dokonania trafnej prognozy wyniku wyborów, konieczne jest przewidzenie na kogo zagłosują osoby udzielające takich odpowiedzi. Standardowo firmy badawcze się tym nie zajmują, przedstawiając sondaże z dodatkowym słupkiem prezentującym odsetek niezdecydowanych. Uniemożliwia to bezpośrednie przełożenie sondażu na wynik wyborczy, w którym odpowiedzi nie wiem/trudno powiedzieć nie pojawiają się. Komentatorzy czasem przeliczają wyniki sondaży w taki sposób, aby głosy oddane na wszystkich kandydatów sumowały się do 100%. Trzeba jednak pamiętać, że taka procedura najczęściej zakłada, że głosy niezdecydowanych rozłożą się w sposób proporcjonalny do wyników wśród zdecydowanych respondentów. Niestety, założenie to zwykle nie jest prawdziwe. Firmy badawcze, które chciałyby przewidywać wyniki wyborów, musiałyby wziąć na siebie odpowiedzialność za określenie jak zagłosują niezdecydowani.

Aby przewidzieć wyniki wyborów potrzebne jest też stwierdzenie, czy osoba deklarująca w sondażu poparcie dla danego kandydata, rzeczywiście zagłosuje na niego w dniu wyborów. Często w literaturze metodologicznej przy omawianiu tego problemu wskazuje się na efekt społecznej poprawności. Część respondentów obawia się, że wyjawienie prawdziwych preferencji wyborczych może postawić ich w złym świetle, w związku z czym deklarują poparcie dla innego kandydata. W publikowanych sondażach nie próbuje się korygować wyniku w celu uwzględnienia tego efektu.
Na brak przełożenia deklaracji sondażowych na wynik wyborów ma wpływ także nierówny poziom krystalizacji poglądów wśród respondentów. Jedni są pewni, że poprą danego kandydata, inni choć wskażą na kogo planują zagłosować, wcale nie są o tym przekonani i mogą zmienić decyzję – w tradycyjnym sondażu przedwyborczym głos każdego z nich liczy się tak samo. Jak wskazywał w czasie wywiadu prof. Markowski, również w tym przypadku zamiast stosowania jednego pytania bezpośredniego, można wykorzystać skalę krystalizacji poglądów. Bez jej zastosowania nie uda się odróżnić twardego elektoratu danego kandydata od osób gotowych zmienić poglądy przed dniem wyborów. Jest to szczególnie ważne, gdy w sondażach widać wyraźne trendy w poparciu dla kandydatów. Nawet kilka dni między sondażem, a wyborami może wśród części wyborców doprowadzić do zmiany popieranego kandydata. W publikowanych sondażach nie wprowadza się na to poprawki.

Wybory prezydenckie pokazały jak niską wartość prognostyczną mają sondaże przedwyborcze publikowane w mediach. Z zaprezentowanych powyżej powodów nie powinno to być dużym zaskoczeniem. Jednak dla wielu osób brak zgodności badań przedwyborczych z oficjalnymi danymi PKW był sensacją, ponieważ w Polsce wyniki sondaży są uważane za prognozę rezultatów wyborów. W rzeczywistości konieczne jest rozróżnienie sondaży wyborczych od prognoz przygotowanych na ich podstawie. Sondaż mógłby dać wiedzę na temat wyników wyborów tylko wtedy, gdyby opisane powyżej problemy nie występowały. Prognoza wyborcza nie ignoruje występujących w rzeczywistości trudności, tylko starać się uwzględnić ich wpływ. Choć stworzenie trafnej prognozy nie jest proste, nawet polskie doświadczenia wskazują, że nie jest to niemożliwe.

Czy można od komercyjnych mediów i instytutów badawczych wymagać by zamawiały/realizowały takie prognozy na własny koszt? Nie, choć w dłuższej perspektywie dla wielu z nich mogłoby się to okazać korzystne wizerunkowo. Przed ostatnimi wyborami żadne media nie zdecydowały się zapłacić więcej, aby otrzymać prognozę wyborczą od renomowanych instytutów, zamiast wyników sondażu. Również firmy badawcze nie przedstawiły takiej prognozy – mimo, że przynajmniej jeden instytut deklarował gotowość jej opracowania, jeśli pojawi się takie zlecenie. Jeżeli firmy badawcze i media nie zdecydują się na publikowanie prognoz wyborczych, nie będzie powodu by oczekiwać, że prezentowane przez nie wyniki będą zbliżone do rezultatu wyborów. Dziennikarze i wyborcy powinni mieć tego świadomość.

Na zakończenie nie można zapomnieć o gratulacjach dla firmy IPSOS, która przedstawiła trafną prognozę na podstawie przeprowadzonego sondażu exit poll. Na etapie analiz było to zadanie znacznie prostsze niż w przypadku wyborów samorządowych, ale presja z jaką musieli sobie poradzić przedstawiciele tej firmy była z pewnością ogromna – szczególnie gdy okazało się, że wyniki będą zaskoczeniem dla niemal wszystkich dziennikarzy i komentatorów.
Kalendarium
89


captcha