Populacja, operat losowania i podstawa procentowania

W reprezentacyjnych badaniach sondażowych ważnymi terminami są populacja, próba, operat losowania i podstawa procentowania.

Populacja jest to zbiorowość, o której badacz chce zdobyć informacje na podstawie sondażu. Przykładem populacji mogą być Polacy, mieszkańcy Warszawy, uczniowie szkół gimnazjalnych.

Próba jest to zbiór jednostek wybranych z populacji, o której badacz chce zdobyć informacje. Przykładem próby może być 1000 osób wylosowanych spośród wszystkich Polaków z bazy PESEL czy 500-osobowa próba kwotowa mieszkańców Warszawy.

O próbach mówi się również w przypadku badań niereprezentatywnych, ale nie jest to sformułowanie do końca poprawne, gdyż na podstawie prób niereprezentatywnych nie można wyciągać wniosków o określonej populacji. Jako przykład próby niereprezentatywnej można podać zbiór osób, które wzięły udział w sondzie internetowej lub zbiór osób, które odpowiedziały na pytanie w sondzie ulicznej.

Operat losowania jest to spis jednostek danej populacji, który umożliwia dobranie próby losowej (czyli reprezentatywnej proceduralnie, choć wyjątek stanowi systematyczny schemat doboru próby, który jako jedyny pozwala na dobór próby losowej w sytuacji braku operatu). W Polsce istnieją tylko dwa operaty, z których można pobrać ogólnopolskie próby reprezentatywne proceduralnie:

PESEL (Powszechny Elektroniczny System Ewidencji Ludności) zawierający spis wszystkich Polaków oraz dane na temat miejsca ich zameldowania.

TERYT zawierający informację o wszystkich mieszkaniach w Polsce, co pozwala na wylosowanie reprezentatywnej próby mieszkańców Polski. Z tego rejestru korzysta przede wszystkim Główny Urząd Statystyczny.

Podstawa procentowania określa do jakiej populacji odnoszą się wyniki uzyskane w próbie. Na podstawie losowej próby Polaków można wnioskować nie tylko o wszystkich Polakach, ale również np. o Polakach w wieku 18-34 lat, gdyż próba Polaków zawiera w sobie również próbę Polaków w wieku 18-34 lat.

Należy jednak pamiętać, że wnioskowanie z podpróby (w naszym przypadku podpróby Polaków w wieku 18-34 lat z próby reprezentatywnej dla Polaków w dowolnym wieku) na temat części populacji jest obarczone większym błędem niż wnioskowanie z całej próby (w naszym przypadku Polaków w dowolnym wieku) na temat całej populacji. Wynika to z tego, że tylko część wylosowanych do próby Polaków jest w wieku 18-34 lat, a zatem liczebność podpróby będzie mniejsza.

Ważny przy określaniu podstawy procentowania może okazać się problem braków odpowiedzi lub odpowiedzi beztreściowych. Wyobraźmy sobie sondaż prezydencki, w którym 30% respondentów odpowiedziało, że zagłosuje na kandydata A, 20% zagłosuje na kandydata B, a 50% powiedziało, że jeszcze nie wie na kogo odda swój głos. Wyniki takiego badania można przedstawić na dwa sposoby:

– Na kandydata A zagłosowałoby 30% respondentów, na kandydata B 20% respondentów, a 50% jeszcze nie wie na kogo odda swój głos.

– Spośród respondentów zdecydowanych na kogo oddadzą swój głos, 60% zagłosuje na kandydata A, a 40% na kandydata B.

Brak dokładnie określonej podstawy procentowania może powodować, że wyniki dwóch zaprezentowanych sondaży pozornie będą od siebie odbiegać (według pierwszego opisu kandydat A uzyskuje 30%, a według drugiego 60%), choć tak naprawdę w obu z nich uzyskano takie same wyniki.

Artykuły
6
Aktualności
8
Skontaktuj się


captcha