Wpół do weekendu #8 – statystyka

Dziś kilka słów o statystyce. I o tym, jak zabawa liczbami może doprowadzić do mylnych wniosków.

Stare przysłowie pszczół mówi, że są kłamstwa, wielkie kłamstwa – i są statystyki. Jednak takie postawienie sprawy jest mocno krzywdzące i zakłada, że to z samą statystyką coś jest nie tak. Jeśli już – to raczej ze statystykami. A najczęściej – z ludźmi, którym wydaje się, że potrafią je odczytać.

Podobnie, jak nie rozumiemy wielkich liczb (nasz umysł nie jest ewolucyjnie przystosowany do ich ogarnięcia), tak mamy problem ze zrozumieniem pewnych zależności statystycznych. Jeśli w dziesięciu rzutach monetą dziewięć razy z rzędu wypadnie orzeł, będziemy przekonani, że następna powinna być reszka. Tymczasem, o ile moneta nie jest sfałszowana, reszka i orzeł mają takie samo prawdopodobieństwo wypadnięcia.

Podobnie jest z losowaniami lotto. Skreślamy na kuponach daty urodzin i inne czary – mary, a liczby 1, 2, 3, 4, 5 i 6 mogą wypaść z takim samym prawdopodobieństwem.

Statystyka to dla większości ludzi czarna magia.

Nasz mały, śródtygodniowy weekend zacznijmy nieco dłuższym tekstem na ten właśnie temat. Jeśli nie macie kilku minut, odłóżcie go sobie do przeczytania na później, bo warto. W skrócie – abyśmy mogli iść dalej:

  • to, co nazywamy średnią, wcale nią nie jest,
  • 99% skuteczność może być bez znaczenia,
  • bycie najszybciej rosnącym wcale nie musi być niesamowite,
  • nie zawsze trend jest trendem,
  • korelacja nie oznacza przyczynowości.

I własnie temu ostatniemu punktowi chciałbym poświęcić resztę wpisu. Nie, żeby poprzednie były gorsze – po prostu ten ostatni jest odpowiedzialny za całą masę nieporozumień we współczesnym świecie. Łącznie z przekonaniem, że szczepionki powodują autyzm.

Oto lista dziesięciu takich fałszywych założeń – jakoby korelacja między jakimiś zjawiskami oznaczała ich wzajemną zależność. Przy czym te tutaj są jeszcze dość normalne. Co powiedzieć o danych prezentowanych na tej liście? Czy faktycznie liczba morderstw jest zależna od spożywania lodów albo używania Internet Explorera?

Oczywiście – nie ma takich dziwnych danych, których internety nie mogą udziwnić jeszcze bardziej. Stąd wspaniała strona, gdzie można znaleźć więcej tego typu powiązań. A nawet samodzielnie spróbować jakieś odkryć. Choć i tak moim faworytem od bardzo dawna jest zależność między spożyciem margaryny w USA, a liczbą rozwodów w Maine. Coś jest na rzeczy…

Foto: Simon Cunningham / CC BY-2.0

  • Największą słabością statystyk jak zawsze jest czynnik ludzki – grupa reprezentatywna i sami przeprowadzający badanie i definiujący zależności.

    • Przy takim założeniu to nawet surowe dane nie byłyby wiarygodne.

  • Bo jest takie powiedzenie, że idzie dwóch facetów i jeden drugiemu wsadza palec do dupy. Statystycznie więc mamy dwóch facetów z palcem w dupie.
    No, rzekłam.

    • Nie znałem, przepiękne 🙂