Am 20. Oktober ist Weltstatistiktag, und viele Menschen werden sich dieser Tage wohl zwangsläufig mal wieder mit statistischen Daten befasst haben: Die Covid19-Pandemie hält uns in Atem und wird dies (Achtung: Prognose) auch noch eine Weile tun. Im November stehen die US-Wahlen an, die dieses Jahr auch in methodischer Hinsicht unter besonders schwierigen Bedingungen stattfinden. Aber auch im Alltag sind wir fortwährend einer Flut von Informationen ausgesetzt, bei deren Beurteilung ein solides Grundwissen der Statistik oft hilfreich ist. Dieser Kurzbeitrag soll - ganz ohne Formeln und Zahlen - ein Gedankenanstoß zur Relevanz der Statistik im Alltag sein.
Statistik zu verstehen ist wichtiger als Statistiken errechnen zu können
So kompliziert Statistik vielen Lernenden auch vorkommen mag, die Kernidee ist einfach: Statistik versucht aus einer in der Regel unübersichtlichen Datenmenge sinnvolle Informationen zu extrahieren, die dann für inhaltliche Schlussfolgerungen genutzt werden können. Im einfachsten und bekanntesten Fall ist das ein Mittelwert für eine Variable, zum Beispiel wenn Studierende ihren Notendurchschnitt ausrechnen. Oft geht es aber auch um Prognosen sowie um Zusammenhänge und Wirkungsrichtungen von mehreren Variablen, also um Fragestellungen wie „Welche Faktoren begünstigen gute Noten an einer Hochschule?“.
Ist es nun wichtig, dass Menschen in ihrem Alltag eigene Statistiken errechnen können? Aus meiner Sicht ist das nicht nötig, und es würde unseren Alltag vermutlich nicht besser machen, wenn alle die Formel für einen Korrelationskoeffizienten auswendig könnten. Viel wichtiger als das Rechnen wäre ein grundlegendes Verständnis für die Interpretation von Statistiken und die daraus abgeleiteten Aussagen, die wir täglich im Alltag hören und lesen können.
Zahlen können leicht (und sogar aus Versehen) missbraucht werden
Neulich las ich einen Zeitungsartikel zu einer Studie, die aussagte, dass Schüler*innen an Schulen, an denen sie die Lehrenden Siezen müssen, bessere Sprachkenntnisse haben als Schüler*innen an Schulen, an denen Lehrende geduzt werden dürfen. Dieser statistische Zusammenhang wurde mit der Schlussfolgerung versehen, dass man zukünftig lieber auf Siezen in Schulen bestehen solle, da dies die Sprachkompetenzen besser ausbilde. Die Interpretation ist sehr kritisch zu sehen, da es viele andere mögliche Erklärungen gibt, warum Schüler an „Siez-Schulen“ bessere Sprachkenntnisse haben.
Personen mit statistischer Grundausbildung erinnern sich jetzt: Ein statistischer Zusammenhang ist nicht immer ein inhaltlicher Zusammenhang und erst recht kein kausaler Zusammenhang. Diese Grundregel verdeutlicht auch die falsche Schlussfolgerung von Zeitschriftenartikeln aus dem Jahr 2013, dass Teilzeitjobs Männer krank machen würden, weil bei Männern in Teilzeitanstellung häufiger psychische Probleme beobachtet wurden.
Diese Arten von Fehlschlüssen aus Daten kommen häufiger vor als man denkt. Hier zwei weitere, reale Beispiele: Softdrinks machen Schüler*innen angeblich aggressiver, da man herausgefunden hat, dass aggressive Schüler*innen mehr zuckerhaltige Softdrinks mit in die Schule nehmen. Und schwangere Frauen bauen angeblich häufiger Autounfälle, weil sie in einem Krankenhaus bei der Behandlung nach einem Autounfall überrepräsentiert waren. In beiden Fällen sind ganz andere Ursachen für die vermeintlich gefundenen Effekte verantwortlich: Kinder mit hohem Softdrinkkonsum in Schulen unterscheiden sich beispielsweise auch im sozioökonomischen Status der Eltern und vielen weiteren Faktoren von anderen Kindern. Schwangere Frauen lassen sich bei einem Autounfall viel wahrscheinlicher zur Sicherheit und aus Sorge um ihr Kind untersuchen und sind deshalb überrepräsentiert im Krankenhaus. Bei letzterem Beispiel liegt der Fehler also schon bei der verzerrten Erhebung der Daten. Unser Präsident Prof. Dr. Björn Christensen hat Bücher und Kolumnen dazu verfasst und Websites wie „Die Unstatistik des Monats“ klären viele dieser Beispiele seriös sowie teils humorvoll auf.
Während die obigen Beispiele eher versehentliche Fehlinterpretationen von Statistiken darstellen, so können Statistiken natürlich auch bewusst zur Meinungsmache missbraucht werden. Typische Merkmale von fehlleitenden Statistiken sind: zu wenige beziehungsweise nicht repräsentative Daten, selektive oder verzerrte Daten als Grundlage, keine Beachtung alternativer Erklärungen für gefundene Effekte. Unseriöse Meldungen lassen sehr oft die wichtigen Informationen vermissen, die man bräuchte, um die Quelle auf Glaubwürdigkeit zu überprüfen. Es sollte immer klar sein, wer wann was mit welchem Ziel erhoben hat.
Methodenkenntnisse als Contra zu Meinungsmache und „Fake News“
Es gibt kein Allgemeinrezept (nicht einmal eine Eins in Statistik), um irreführenden Nachrichten sicher auf die Schliche zu kommen. Sie hören sich oft auf den ersten Blick gut an und vereinfachen die Welt auf angenehme Weise. Und gerade in einem Alltag, der von medialer Überflutung (mit wahren, halbwahren und falschen Informationen) geprägt ist, mögen plakative Aussagen zur Schonung gedanklicher (kognitiver) Ressourcen besonders reizvoll sein.
Ich habe die Hoffnung, dass Kenntnisse zu Methoden und Statistiken (in Kombination mit Medienkompetenz) zumindest dabei helfen, die Glaubwürdigkeit von Zahlen und Aussagen im Alltag besser beurteilen zu können. Und wenn dies bei vielen Menschen im Alltag der Fall wäre, würde es vielleicht auch die Gesellschaft dahingehend verändern, dass populistische, faktisch leicht zu widerlegende Aussagen weniger Gehör finden. Ein Beispiel: Wenn als „Beweisführung“ zu den schädlichen Folgen des 5G-Netzes angeführt wird, dass 5G in den gleichen Regionen wie das Coronavirus verbreitet ist (und zwei ähnlich aussehende Heatmaps der USA dazu gezeigt werden), so sollte man mit etwas methodischem Grundwissen leicht darauf kommen, dass dieses regional gleichförmige Auftreten wohl eher mit der Bevölkerungsdichte in den Ballungszentren zu tun hat. Gleiches gilt übrigens für das regionale Auftreten von Google Streetview und Corona.
Menschliche Gedankenmuster durch Statistik auf die Probe stellen
Warum ist Statistik also wichtig für den Alltag? Weil sie uns lehrt, in Tendenzen und Wahrscheinlichkeiten zu denken und dabei Fehler, Ungenauigkeiten und alternative Erklärungen in Betracht zu ziehen, anstatt in Schwarz-Weiß-Malerei zu enden. Anders gesagt: Weil sie, wenn sachgemäß angewendet, die Welt ein bisschen besser erklärt. Mit Statistiken können Vorurteile und Meinungsmache leider geschürt, aber glücklicherweise auch abgebaut werden. Und je mehr Menschen sich mit den Grundregeln seriöser Statistiken und daraus abgeleiteten Schlüssen befassen, desto eher dürften die positiven Effekte der Statistik zum Tragen kommen. Darum bin ich froh, dass es einen Weltstatistiktag gibt und ich dieses Fachgebiet anderen Menschen näherbringen darf.
Quellen der verwendeten Beispiele sind auf Anfrage beim Autor erhältlich.