Średnio czyli jak?

W badaniach statystycznych stosuje się różne parametry służące do zbiorczego opisu badanej populacji. Wyróżnia się parametry centralne służące do opisu typowego przedstawiciela danej zbiorowości oraz parametry rozproszenia, które opisują, na ile jednostki z danej zbiorowości różnią się od siebie.

Najpopularniejszym parametrem centralnym jest średnia arytmetyczna. Jest powszechnie znana – większość osób zapoznaje się z nią choćby w szkole przez wyliczanie średniej ocen. Średnia jest często stosowana w badaniach dzięki zrozumiałej interpretacji oraz pożądanym własnościom statystycznym przy bardziej skomplikowanych analizach. Jednak podanie samej średniej często okazuje się w niewystarczającym stopniu charakteryzować całą zbiorowość.

Wyobraźmy sobie dwie grupy złożone z 10 osób. W pierwszej wszyscy zarabiają 4 tys. zł, w drugiej dziewięć zarabia 2 tys. zł, a jedna 22 tys. zł. W obu przypadkach średnia jest równa 4 tys. zł, a jednak grupy te znacznie różnią się od siebie. W pierwszej grupie wszyscy zarabiają dokładnie tyle, ile wynosi średnia, w drugiej natomiast 90% osób zarabia poniżej średniej.

Przykład ten obrazuje, że wadą średniej jest jej wrażliwość na pojedyncze wartości skrajne. Z tego powodu wiele osób uważa, że lepsze jest wyliczanie mediany dochodów zamiast średniej.  Mediana jest parametrem wyznaczającym wartość poniżej i powyżej której mieści się 50% osób. Mówiąc prościej, choć nie całkiem ściśle, jest to wartość środkowa[1]. Dla zaproponowanego powyżej przykładu mediana w pierwszej grupie wynosi 4 tys. zł, natomiast w drugiej tylko 2 tys. zł.

Średnia płaca podawana przez GUS bywa często kwestionowana przez osoby, które twierdzą, że jej wartość nie odpowiada zarobkom uzyskiwanym przez większość Polaków. Z jednej strony jest to prawda. W Polsce większość ludzi ma małe lub średnie dochody, podczas gdy mniejszość zarabia bardzo dużo. Podobnie jest także w innych krajach. Większość zarabia około 2 tys., jednocześnie stosunkowo mała grupa osób zarabia miesięcznie kilkaset tysięcy złotych. Właśnie przez najbogatszych, zarabiających wielokrotnie więcej od innych, średnia dochodów jest w Polsce zdecydowanie wyższa od mediany. Oznacza to, że poniżej średniej zarabia ponad połowa Polaków. Z danych GUS wynika, że może to być nawet 60–70% Polaków.

Czy zatem należy podawać medianę dochodów zamiast wartości średniej? Niekoniecznie. Wadą mediany jest – odwrotnie niż w przypadku średniej – brak wrażliwości na wartości skrajne. Gdyby badana zbiorowość składała się z sześciu osób zarabiających 2 tys. zł, to niezależnie ile zarabiałyby cztery pozostałe, mediana wynosiłaby 2 tys. zł. Tymczasem, zmianę wartości średniej spowoduje zmiana dochodów dowolnej z osób należących do badanej zbiorowości.

Zdecydowanie najwięcej dowiemy się o badanej populacji, kiedy znamy zarówno średnią, jak i medianę. Dzięki ich porównaniu można nie tylko określić jakie są typowe zarobki, ale również stwierdzić – jeśli mediana będzie dużo niższa od średniej – że stosunkowo niewielka część osób zarabia zdecydowanie więcej od pozostałych.

Parametrem rozproszenia, pomocnym przy charakterystyce populacji, jest odchylenie standardowe. Określa ono jak bardzo jednostki danej populacji różnią się między sobą. Dla grupy złożonej z 10 osób, z których każda zarabia tyle samo, odchylenie standardowe wyniesie 0 zł. Dla grupy osób, z której dziewięć zarabia 2 tys. i jedna 22 tys. odchylenie standardowe będzie wynosiło już 6 tys. zł. Wiadomo zatem, że społeczeństwa mające wyższe odchylenie standardowe dochodów są bardziej zróżnicowane. Jest to ważna społecznie informacja i, naszym zdaniem, powinna częściej pojawiać się w raportach GUS.

Istnieje postulat, aby parametrem dochodów podawanym przez GUS była również dominanta lub inaczej modalna, czyli wartość dochodów uzyskiwana przez największą liczbę Polaków. Załóżmy, że w pewnej zbiorowości 90% osób uzyskuje różne dochody: od 2 do 10 tys. zł., zaś 5,1% uzyskuje dochody w wysokości płacy minimalnej, czyli 1,6 tys. zł., a 4,9% równe maksymalnemu wynagrodzeniu w zarządzie spółek skarbu państwa, czyli powiedzmy 40 tys. zł. Dominanta w takiej zbiorowości wynosi 1,6 tys. zł. Załóżmy teraz, że część osób uzyskujących dochód wielkości płacy minimalnej straci pracę, tak że w całej zbiorowości tylko 4,8% osób będzie uzyskiwało dochody równe płacy minimalnej. Co się stanie z dominantą? Mimo że dochody w zbiorowości tak naprawdę zmniejszyły się, to dominanta wyniesie teraz 40 tys. zł.

Przykład jest dosyć skrajny, ale ma on pokazać wady dominanty. Jej głównym minusem jest fakt, że w żaden sposób nie charakteryzuje ona całego rozkładu dochodów, a tylko jego jeden dosyć przypadkowy punkt, który może podlegać gwałtownym zmianom. Dlatego uważamy, że podawanie dominanty przez GUS nie jest szczególnie ważne, choć oczywiście byłaby to kolejna, dodatkowa informacja o dochodach Polaków.

 


[1] Nie jest to prawdą, gdy liczba jednostek jest parzysta, a zatem nie ma pojedynczej jednostki „środkowej”.

Artykuły
40


captcha