Przejdź do głównej treści

Widok zawartości stron Widok zawartości stron

Nawigacja okruszkowa Nawigacja okruszkowa

Widok zawartości stron Widok zawartości stron

Widok zawartości stron Widok zawartości stron

Czy statystyka rzeczywiście kłamie?

Czy statystyka rzeczywiście kłamie?

W jaki sposób odpowiednio generalizować wyniki i analizować dane tak, aby uchronić je przed rozprzestrzenianiem dezinformacji? Jak nie wpaść w pułapkę statystycznych uogólnień? Czym jest skąpstwo poznawcze? Zapraszamy do lektury tekstu mgr Karoliny Koziary z Katedry Epidemiologii i Badań Populacyjnych Wydziału Nauk o Zdrowiu UJ CM.

Artykuł oryginalnie opublikowany na Blogu Instytutu Zdrowia Publicznego UJ CM.

 

Zanim odpowiemy sobie na to pytanie, musimy cofnąć się do wczesnych lat ‘80, kiedy Shelley Taylor ze swoją, niegdyś studentką, a wtedy już najbliższą współpracowniczką Susan Fiske, opublikowały przełomową pracę pod tytułem Social Cognition [1]. Obszerna praca, oprócz opisu skomplikowanych mechanizmów funkcjonowania poznawczego człowieka, wprowadziła do słownika psychologii pojęcie opisywane do dziś jako „skąpstwo poznawcze”. Opisuje ono tendencję ludzi do wybierania rozwiązań niskokosztowych poznawczo, czyli takich, które pozwalają na szybkie potwierdzenie naszych założeń i nie wymagają zmiany posiadanych już przekonań. Zasoby poznawcze człowieka nie są nieograniczone. Odpowiadają za cały szereg czynności intelektualnych takich jak zapamiętywanie, kojarzenie, rozumowanie, używanie języka, rozumienie związków przyczynowo-skutkowych czy podejmowanie decyzji. Dlatego, im mniej tych zasobów poznawczych zużywamy na określoną czynność, tym bardziej zyskują na jakości nasze kolejne działania.

W dzisiejszym świecie, jesteśmy eksponowani na szereg alternatyw nawet w najprostszych sytuacjach życiowych, takich jak kupno kawy. No właśnie… ale jakiej? Americano? Latte? Espresso? Frappe? Jak pokazują badania Danzigera i współpracowników [2], im więcej wyborów mamy i im więcej decyzji musimy podjąć, tym bardziej tracą na tym nasze kolejne wybory. Zjawisko to określa się jako syndrom „zmęczenia decyzyjnego” (decision fatigue). A zatem, ograniczanie nadmiernego zaangażowania zasobów poznawczych nie jest zjawiskiem negatywnym. Pozwala ono na poprawienie funkcjonowania człowieka i ułatwienie podejmowania kolejnych decyzji. Z tego względu wielu polityków czy inwestorów ogranicza do minimum decyzje, które muszą podjąć rano, takie jak co zjeść na śniadanie czy w co się ubrać. Niestety, to upodobanie do prostoty i oszczędność zasobów poznawczych, wiąże się również z nadmiernym upraszczaniem rzeczywistości, co często ma miejsce na styku nauki, statystyki i interpretacji danych.

Skąd czerpiemy wiedzę o badaniach?

Wszyscy kiedyś słyszeli zdanie zaczynające się od słów „Amerykańscy naukowcy…”. Ta chwytliwa fraza jest nie tylko bohaterką niezliczonej ilości memów, ale całkiem dobrze streszcza sposób oceniania źródeł wiedzy przez wielu ludzi. Wydawać by się mogło, że w dobie powszechnego dostępu do Internetu, a co za tym idzie nieograniczonego dostępu do wiedzy, myślenie magiczne czy wiara w horoskopy i amulety usuwające toksyny z organizmu odejdzie do lamusa. Nic bardziej mylnego! Dostęp do wiedzy, niezależnie od tego jak łatwy, nie ogranicza naszej naturalnej tendencji do skąpstwa poznawczego. Wolimy ograniczyć nasze cenne zasoby poznawcze, nawet jeśli na weryfikację informacji musielibyśmy poświęcić tylko kilka sekund.

Główny problem polega na tym, że analiza danych, jak i całe wnioskowanie statystyczne, to sztuka oparta na prawdopodobieństwie – nigdy na pewności. Media natomiast często chcą przedstawić odpowiedź na pytanie w sposób jednoznaczny, czarno-biały.

Skąpstwo poznawcze stanowi podstawę dla sposobu w jaki wyniki badań i doniesienia naukowe prezentowane są w mediach. To głównie zwykłe media masowe, serwisy informacyjne i gazety stanowią pomost między publikacją pojawiającą się w renomowanym czasopiśmie naukowym, a przeciętnym czytelnikiem, nie-naukowcem. Taki czytelnik nie ma czasu wnikać w niuanse, a po prostu chce wiedzieć co nowego słychać w świecie nauki. Media, z kolei, interesuje przyciągnięcie uwagi: liczba odsłon, sprzedanych egzemplarzy. Stąd popularność tzw. clickbait (ang. click – „kliknięcie” i bait – „przynęta”), czyli sensacyjnych tytułów gazetowych mających skłonić „kliknięcia” w artykuł. Jako czytelnicy lubimy, kiedy przedstawi się nam wyniki badań w sposób jasny, a przede wszystkim taki, który odpowiada na nasze pytanie. Chcemy wiedzieć czy pizza rzeczywiście chroni przed nowotworami [3], czy nasz jamnik może wykryć u nas cukrzycę [4] i czy warto chodzić na korepetycję z matematyki, skoro Majowie wyliczyli, że za chwilę będzie koniec świata [5]. To częsty problem, z jakim borykają się naukowcy zajmujący się popularyzację wiedzy. Po długiej opowieści o przeprowadzonych analizach i uzyskanych wynikach, prędzej czy później będą musieli zmierzyć się z pytaniem o to, jak to w końcu jest i czy na pewno. I właśnie to „na pewno”, często staje się tym ziarnkiem piasku w bucie naukowca, który niby nie utrudnia chodzenia, ale jednak uwiera w stopę.

Główny problem polega na tym, że analiza danych, jak i całe wnioskowanie statystyczne, to sztuka oparta na prawdopodobieństwie – nigdy na pewności. Media natomiast często chcą przedstawić odpowiedź na pytanie w sposób jednoznaczny, czarno-biały. W nauce, nawet jeśli argumenty przemawiają za przyjęciem określonej hipotezy, zawsze jesteśmy zobowiązani zaakceptować pewien margines błędu i niepewności. To do pewnego stopnia wyjaśnia niesłabnącą popularność wspomnianych wcześniej horoskopów, czy wszelkiego rodzaju alternatywnych sposobów na uzdrowienie z ciężkich, często nieuleczalnych chorób. Lekarze jako przedstawiciele medycyny konwencjonalnej, zobowiązani są do rzetelnego przedstawienia szans na wyleczenie. Łatwo zrozumieć, że dla osoby ciężko chorej, bardziej kusząca jest perspektywa rysowana przez uzdrawiaczy. Oni obiecują szybką poprawę i wyleczenie. Spełniają oni emocjonalną potrzebę, której nie daje racjonalny lekarz – oferujący „tylko” racjonalne alternatywy i szacunki prawdopodobieństwa wyleczenia.

Czy błąd ekologiczny to coś o Greenpeace?

Znamy już poznawczą podstawę utrudniającą nam interpretację danych. Dodatkowo, wiemy, że za część nieścisłości odpowiada medialny sposób przekazu. Ale skąd jednak bierze się przekonanie, że statystyka kłamie? Gdy przyjrzymy się dokładniej drodze jaką muszą przemierzyć dane naukowe, zauważymy, że na początku często pojawia się jakaś obserwacja. Zastanawiamy się czy tak szybka poprawa u pacjenta jest czymś wyjątkowym, czy istnieją jakieś szczególne cechy tego człowieka, które pozwalają mu dojść do zdrowia szybciej niż się tego spodziewaliśmy? Co stoi za tym, że bliźniacy z sąsiedztwa zachowują się prawie identycznie, a ci z naszej rodziny są zupełnie różni? Czy jeśli psa da się nauczyć aportować, to szopa pracza też? I tak dalej… Większość takich obserwacji odnosi się do pojedynczych przypadków, ewentualnie do ograniczonej grupy jednostek, rzadko zastanawiamy się nad perspektywą globalną. Weźmy naszych bliźniaków. Interesuje nas to, dlaczego te konkretne dwie pary są tak różne, a nie charakterystyka wszystkich bliźniaków z całego świata.

Dowód anegdotyczny używany jest często do „obalania” statystycznych prawidłowości. Wzorowym przykładem jest tu palacz, który na wieść o tym, że palenie papierosów zwiększa ryzyko nowotworu, opowiada o swoim dziadku, który całe życie palił a umarł w wieku 98 lat potrącony przez rower.

W przeciwieństwie jednak do tego co nas trapi, naukowców najczęściej interesuje właśnie ten wymiar globalny, a więc odpowiedź na pytanie o to, jakie cechy indywidualne odpowiadają za podobieństwa i różnice u bliźniąt. Wszystkich bliźniąt, a nie tylko tych z naszego sąsiedztwa. Istnieją co najmniej dwa powody, dla których nauka musi spoglądać na zjawiska szerzej. Po pierwsze, wymiar pragmatyczny – istnieje całkiem duża szansa, że na świecie jest więcej osób, które zadają sobie podobne pytanie. Po drugie, wymiar merytoryczny – porównanie dwóch znajomych par bliźniąt, nie mówi nam wiele o bliźniakach ogólnie.

Aby móc generalizować nasze wyniki, czyli odnieść je do większości bliźniąt w populacji, nasze badania powinny być przeprowadzone na reprezentatywnej części tej populacji. Reprezentatywność w naszym przypadku oznacza, że każda para bliźniaków ma takie same szanse trafić do badania. Dlaczego jest to ważne? Wyobraźmy sobie, że zignorujemy założenie o reprezentatywności i przeprowadzimy badanie na osobach, które akurat są dostępne. Zaczniemy od naszych znajomych, którym niedawno urodziły się bliźnięta. Poprosimy, aby oni zaprosili do badania swoich kuzynów, którzy też mają bliźniaki, następnie ich kuzyni zaproszą swoich znajomych, i tym sposobem po jakimś czasie zgromadzimy w badaniu 100 par bliźniąt. Całkiem niezła liczebność! Jednak w związku z tym, że zignorowaliśmy założenie o reprezentatywności próby, niektóre bliźnięta miały większą szansę na znalezienie się w naszym badaniu. Konsekwencją tego, jest brak kontroli nad czynnikami, które mogą wpływać na interesujące nas charakterystyki badanych. Przykładowo, możemy założyć, że wykształcenie rodziców w naszej grupie jest zbliżone, możliwe, że również warunki społeczno-ekonomiczne są podobne, tak samo jak dostarczane bliźniętom bodźce czy sposób komunikacji rodzice-dziecko. Chociaż te kwestie z wydają się nieistotne, to mogą one być czynnikiem zakłócającym, czyli sprawić, że zaobserwujemy zależność, która pojawia się na przykład wyłącznie wśród dzieci podobnych do naszych badanych.

W związku z tym, że nasza potoczna, anegdotyczna perspektywa najczęściej dotyczy konkretnej osoby, konkretnego przypadku. Perspektywa naukowców to – tymczasem – poszukiwanie  przeciętnej osoby, typowego przypadku. W połowie drogi między tymi perspektywami musimy zmierzyć się z tak zwanym błędem ekologicznym (ecological fallacy). Najprościej mówiąc, błąd ekologiczny to wnioskowanie o jednostkowym przypadku na podstawie zależności zaobserwowanych w grupie badanej. Przykładowo, jeśli na próbie studentów pewnego uniwersytetu zaobserwowano, że istnieje związek między czasem poświęcanym na aktywność sportową, a punktami zdobytymi z egzaminu ze statystyki, nie oznacza to, że wszyscy studenci, którzy otrzymali 5 z egzaminu, dostają w pakiecie dres i zaproszenie do kadry narodowej. Ten błąd wnioskowania często powoduje, że mamy wrażenie, że dane z badań mówią o nieistniejących zależnościach, ponieważ nie jesteśmy w stanie odnieść ich do rzeczywistego przykładu z naszego otoczenia.

Przeciwieństwem tego błędu jest dowód anegdotyczny, czyli przejście od „u mnie tak było” do wniosku, że tak ogólnie jest. Na przykład „ciocia Jadzia całe życie jeździła Fiatem i nigdy nie miała wypadku, a wujek Marek ledwo wsiadł do nowego Forda, od razu urwał zderzak”. Ten przykład wydaje się być absurdalny, trudno przecież na podstawie jednego przypadku wnioskować, że jazda Fiatem uchroni nas przed kolizją, jednak dla wielu ludzi taka argumentacja jest wystarczająca. Dowód anegdotyczny używany jest często do „obalania” statystycznych prawidłowości. Wzorowym przykładem jest tu palacz, który na wieść o tym, że palenie papierosów zwiększa ryzyko nowotworu, opowiada o swoim dziadku, który całe życie palił a umarł w wieku 98 lat potrącony przez rower. Z perspektywy naukowca, jest oczywiste, że będą osoby palące, u których nie rozwinie się nowotwór. Jednak z perspektywy skąpca poznawczego, anegdota o dziadku palaczu będzie dowodem na to, że „badania kłamią”.

Podsumowując, zanim oskarżymy dane o kłamstwo i sianie dezinformacji, musimy zastanowić się, czy aby przypadkiem nie zapoznajemy się z wynikami badań zbyt powierzchownie. Oczywiste jest, że każdy człowiek w pewnym sensie jest skąpcem poznawczym i nie ma w tym nic złego. Jeszcze bardziej oczywiste jest, że chcemy odnosić wyniki badań naukowych (zwłaszcza tych dotyczących zdrowia publicznego) do konkretnych przypadków. Na tym polega aplikacyjny wymiar badań. Powinniśmy jednak pamiętać, że każda, nawet najlepsza publikacja, wymaga naszej wnikliwej analizy i ściśle naukowej wątpliwości, która pozwali nam racjonalnie, a nie emocjonalnie podejść do najnowszych doniesień naukowych.

 

mgr Karolina Koziara
Katedra Epidemiologii i Badań Populacyjnych
Instytut Zdrowia Publicznego
Wydział Nauk o Zdrowiu

 

----------------------------------------

Mgr Karolina Koziara jest doktorantką w Instytucie Psychologii Uniwersytetu Jagiellońskiego oraz asystentką w Instytucie Zdrowia Publicznego CMUJ, gdzie prowadzi zajęcia z zakresu Analizy Statystycznej. Jest również doradczynią w Punkcie Konsultacyjno-Diagnostycznym HIV w Krakowie. Pracowała też jako psycholog w Fundacji Trans-Fuzja, gdzie prowadziła grupy wsparcia oraz konsultacje dla osób transpłciowych. Ukończyła psychologię w Instytucie Psychologii Uniwersytetu Jagiellońskiego ze specjalizacją w zakresie psychologii sądowej, jest również absolwentką podyplomowych studiów „Seksuologia Kliniczna – Opiniowanie, Edukacja, Terapia” na Uniwersytecie im. Adama Mickiewicza w Poznaniu. Od kilku lat realizuje badania dotyczące zagadnień ujawnienia tożsamości seksualnej i występowania depresji u osób LGBTQ, psychospołecznych uwarunkowań zdrowia wśród osób LGBTQ oraz społecznej percepcji zaburzeń preferencji. W szczególności interesuje ją problematyka stresu mniejszościowego, zaburzeń afektywnych i przemocy seksualnej. 

-----------------------------------------

 

Źródła:

  1. Fiske S, Taylor S. Social Cognition. New York: Random House; 1984.
  2. Danziger S, Levav J, Avnaim-Pesso L. Extraneous factors in judicial decisions. Proc Natl Acad Sci. 2011;108(17):6889–92.
  3. Gallus S, Talamini R, Bosetti C, Negri E, Montella M, Franceschi S, et al. Pizza consumption and the risk of breast, ovarian and prostate cancer. Eur J Cancer Prev. 2006;15(1):74–6.
  4. Gonder-Frederick LA, Grabman JH, Shepard JA, Tripathi AV, Ducar DM, McElgunn ZR. Variability of Diabetes Alert Dog Accuracy in a Real-World Setting. J Diabetes Sci Technol. 2017;11(4):714–9.
  5. Ewing S. Lies, Damn Lies and a Mayan prophesy of Doom. Vinculum. 2012;49(4):45.
Polecamy również
Tydzień Noblowski 2022 - komentarze
Tydzień Noblowski 2022 - komentarze
Tydzień Noblowski 2021 - komentarze
Tydzień Noblowski 2021 - komentarze
Tydzień Noblowski 2020 - komentarze
Tydzień Noblowski 2020 - komentarze