„Ziel mir keng!“ kënnt nom Pisa Wëssensmagazin Sonndes owes op RTL Tëlee. Et kann ee sech d’Episoden awer och op RTL Play an um science.lu Youtube-Kanal ukucken: https://www.youtube.com/user/scienceluxembourg
De Prof. Christophe Ley ass Peer-Reviewer vun dësem Artikel.
Infobox
De Christophe Ley ass Associate Professor fir ugewannt Statistik beim Departement fir Mathematik vun der Universitéit Lëtzebuerg. Hien ass och President vun der "European Association for Advanced Statistics Courses" a vun der "Luxembourg Statistical Society", an Initiator vum internationale Netzwierk “Sports - Training and Research in Data Science Methods for Analytics and Injury Prevention Group”. Hien ass Empfänger vum Marie-Jeanne Laurent-Duhamel Präiss vun der Société Française de Statistique an Associate Editor fir d'Journals Annals of the Institute of Statistical Mathematics, Econometrics and Statistics, an Statistique et Société.
An de Medien gi mer dacks bombardéiert mat Zuelen a Statistiken.
Grad an Zäite vu Fake News an Alternative Facts ass et wichteg, sech Date genee unzekucken a richteg ze interpretéieren. Statistik ass hei immens wichteg. Sie hëlleft fir an Daten Trends a Muster ze erkennen a Konklusiounen draus ze zéien oder Entscheedungen ze treffen. Ma am Alldag kënnt et ëmmer nees – bewosst oder onbewosst – zu Feeler am Ëmgang mat Statistiken.
Mir weisen iech dofir hei 5 heefeg Interpretatiouns-Feeler vu Statistiken,a wéi dir se evitéiere kënnt.
Fänke mer direkt u mam Klassiker: Korrelatioun ass net automatesch Kausalitéit!
Eng positiv Korrelatioun hu mer, wann zwee Wäerter an déi selwescht Richtung weisen. Eng negativ Korrelatioun, wann deen ee Wäert rop geet, an deen anere rof.
Eng Kausalitéit hu mer wann ee wann also eng Ursaach-Wierkung-Relatioun tëscht béide besteet. Z.B. wat ee méi Alkohol an engem Owend drénkt, wat ee méi voll gëtt.
Anescht gesäit et an dësem Beispill aus: déi schwaarz Linn ass d’Consommatioun vu Botter an den USA, déi rout de Scheedungstaux am US-Bundesstaat Maine. Déi zwee Wäerter korreléieren ganz staark, ma et gëtt keng Kausalitéit. Et ass net well d’Leit an den USA manner Botter iessen, dass sech manner Leit a Maine scheede loossen.
Leider gesäit een deen dote Feeler dacks. An engem Titel gëtt dann z.B. behaapt: Leit déi an enger Studie vill roude Wäin gedronk hunn, sinn am Duerchschnëtt méi al ginn. Ma dat heescht net automatesch, dass den héijen Alter op de roude Wäin zeréckzeféieren ass. Vläicht waren des Leit sozial a kierperlech méi aktiv an sinn dofir méi al ginn?
Dofir eisen Tipp: Ëmmer hannerfroen, ob bei enger Korrelatioun och tatsächlech eng Kausalitéit virläit.
Komme mer zum Feeler Nummer 2: De prozentuale Wuesstem kucken, ouni de Kontext vun absolutten Zuelen.
Wann eng Entreprise ugëtt, si hätt 100% méi verkaf wéi de Mount virdrun, da kléngt dat mega.
Ma falls si de Mount virdrun 1 Artikel mat wéineg Emsatz verkaf haten an de Mount drop 2, ass d'Ausso mat den 100% zwar korrekt, ma awer net méi sou impressionant. Anescht ass et, wann eng Entreprise Milliounen Artikele pro Joer verkeeft, mat risegem Emsatz. Do ass eng Verkaafssteigerung vun e puer Prozent vill méi aussokräfteg wéi bei klengen absolutten Zuelen.
Oder, kucke mer eis fiktiv Salairen vu Cadren an Aarbechter an enger Firma un. De Management behaapt, d’Aarbechter hätte méi bäikrut: 10%! D’Cadre just 5%. Dës Grafik weist dat och korrekt un.
Mengt awer elo net, dass dat automatesch heescht, dass d’Aarbechter tatsächlech méi Sue krute wéi d’Cadren.
Huele mer z.B. un de Salaire vun den Aarbechter war ufanks 2000, an dee vun de Cadren 6000 EUR. Da kruten prozentual zwar wuel d’Aarbechter méi bäi, ma an absolutten Zuelen waren et awer d’Cadren déi besser dovu koumen. Si kruten 100€ méi bäi wéi d’Aarbechter.
Tipp: Bei prozentualem Wuesstem ëmmer och op déi absolut Zuele kucken.
Feeler Nummer 3: Achsen op Diagrammer a Graphiken net genau kucken
Huele mer e fiktiivt Beispill vun engem Walresultat vun enger Partei, am Verglach zu de leschte Walen. D'Partei seet si hätt immens vill Stëmme bäikritt. Effektiv gesäit et um Diagramm sou aus. Ma wann ee méi genee hikuckt, hu si ragezoomt. Wann een d’Graphik ganz gesäit, erkennt een dass den Ënnerscheed ganz geréng ass.
Graphike kënnen och gestaucht oder gestreckt ginn, fir dass Ënnerscheeder méi oder manner krass ausgesinn.
Tipp: Dofir ëmmer gutt kucken wéi d’Achse beschrëft sinn, a wat fir e Moossstaf benotzt gëtt.
Komme mer zum Feeler Nummer 4: De Simpsons-Paradox net erkennen.
Huele mer als Beispill rëm eng fiktiv Entreprise. An dëser verdéngen insgesamt d’Männer am Duerchschnëtt méi wéi d’Fraen. Wann ee lo awer an där Entreprise eenzel Kategorien, z.B. d’Chefetage, de middle Management, an d’AssistentInnen - analyséiert, da stellt ee fest dass a jiddwer eenzeler Kategorie d’Frae méi verdénge wéi d’Männer.
Wéi kann dat sinn? Ma am Fall vun dëser Entreprise läit dat dorun, dass och wann d’Fraen pro Kategorie zwar méi verdéngen wéi d’Männer, insgesamt méi Fraen an der schlecht bezuelter Kategorie vun den AssistentInnen schaffen, a manner an der Chef-Etage. Ouni déi zweet Info kéint ee fälschlecherweis mengen, dass d’Männer an där Entreprise méi Geld fir déi selwecht Aarbecht kréien.
Duerch déi zweet Analyse gesäit een awer dass de Contraire de Fall ass, ma dass de Problem doru läit, dass d’Männer déi besser Positiounen an där Entreprise hunn.
Tipp: Bei Aussoen zu Moyennen ëmmer hannerfroen, ob et an Ënnerkategorien net anescht ausgesäit?
Komme mer zu eisem leschte Feeler: De Median ass heiansdo méi aussokräfteg wéi de Mëttelwäert
Heifir stelle mer eis e klengt Duerf mat 100 Awunner vir. Am Duerchschnëtt hunn d’Awunner e Verméigen vun 100.000 EUR pro Kapp.
Lo zitt e Milliardär an dat Duerf, mat engem Verméigen vun 3 Milliarden EUR. Lo hu mer 101 Awunner mat engem Duerchschnëttsverméigen vu bemol ganzer 29,8 Milliounen EUR! Natierlech sinn déi aner Awunner net schlagaarteg méi räich ginn. Ma de Mëttelwäert ass einfach net immens aussokräfteg, wann een een oder puer Extremwäerter huet, an dat besonnesch bei klenge Populatiounen.
Hei wier et besser de Median ze wielen. De Median ass e Wäert dee genee an der Mëtt vun enger Zuelereih läit. Also an dësem Beispill ass de Median e Verméigen wat sou héich ass, dass déi eng Hallschent vun der Duerfbevëlkerung drënner läit, déi aner Hallschent driwwer. De Median ännert sech quasi net, wa just een Awunner bäizitt, egal wéi vill dee verdéngt. Wat vill méi der Realitéit vun deenen 100 aneren am Duerf entsprécht.
Fazit: Statistik ass immens nëtzlech. Si erlaabt et Date besser ze analyséieren an ze kontextualiséieren, fir dass wichteg Entscheedungen net mussen aus dem Bauch eraus getraff ginn.
Fir Feeler ze vermeiden brauch et dacks Kontextwëssen a Wëssen doriwwer wat eng Statistik ausseet a wat net.
Also haalt d’Aen op, an hannerfrot.
Auteur: Jean-Paul Bertemes (FNR)
Peer-Reviewer: Prof. Christope Ley (Universitéit Lëtzebuerg, GrewIA)
Editorin: Lucie Zeches (FNR)
Grafiken: George Dos Santos R., Antone Stepine (Headroom)
Réalisatioun a Schnëtt: Dominique Weber (SKIN)
Kamera: Océane Maître (SKIN)
Luucht : Dave Schmit (SKIN)