lördag 30 juli 2011

Kan man skämta om statistik?

Sällskapsliv kan var en prövning för en statistiker. Säg till mig, som en skämtsam reaktion på min professorliga ämnestillhörighet, att "det finns tre sorters lögn: lögn, förbannad lögn och statistik", och jag kan som bäst leverera ett ansträngt leende. Om du sedan drar till med att "en statistiker är en person som kan ha ena foten i en ishink, den andra i kokande vatten, och tycka att det i genomsnitt är ganska skönt" kan jag inte längre hålla tillbaka min irritation, utan blir tvungen att paja partystämningen medelst en längre utläggning om hur korkat ditt uttalande är.

Så vad gör detta mig till? En levande illustration till förhållandet "statistik är trist"? Eller helt enkelt bara en sur gammal professor som inte tillåter skämtsamheter om den egna disciplinen?

För att komplicera bilden en smula kan jag avslöja att det faktiskt finns statistikskämt som jag skrattar gott åt. Följande blev jag så förtjust i då jag såg den första gången att jag numera till och med har den på t-shirt:

Correlation

Detta är strippen Correlation i alla matematiknördars favoritserie xkcd. Den här, rubricerad Significant, är också rolig:

Significant

Så vad är då den avgörande skillnaden mellan dessa xkcd-strippar (se Cell phones för ännu ett lysande exempel, medan däremot Null hypothesis i mitt tycke är aningen lamare) och de inledande exempel som jag vägrar skratta åt?

De båda inledande putslutigheterna, om förbannade lögner repsektive ishinkar, intar den okunniga arrogansens attityd: "statistiker begriper inte vad de sysslar med, till skillnad från mig, som med hjälp av enbart mitt sunda förnuft kan påvisa en hel vetenskaps irrfärder". Den första av dem, om de förbannade lögnerna, innehåller visserligen ett rejält korn av sanning i att media ju dagligen matar oss med vilseledande statistik, men jag provoceras av att den bortser från att statistikvetenskapen syftar till, och faktiskt haft stora framgångar med, att utarbeta metoder för att leverera välgrundade och välavvägda slutsatser från osäkra datamaterial, tvärtemot det fria fabulerandet och ljugandet. Den andra, om ishinkarna, får verkligheten helt om bakfoten: en icke-statistiker glömmer ofta att beakta variationen i en population eller ett datamaterial, medan en välutbildad statistiker aldrig skulle begå det misstaget, då ju beaktandet av variation är ett av de absolut mest centrala tema som ständigt återkommer såväl i den statistiska slutledningsteorin som i statistikerns yrkesutövning.

Mot denna okunskap kontrasterar de insikter om statistiska fundamenta som xkcd:s skapare, Randall Munroe, uppenbarligen besitter. De båda ovan återgivna episoderna illustrerar, på ett lite skruvat och därför roande vis, centrala lärdomar som varje praktiserande statistiker, och därtill helst varje forskare inom empiriska vetenskaper, bör känna till. Den första handlar om den fundamentala svårigheten att (annat än under de ideala omständigheter som i många sammanhang inte låter sig åstadkommas) ur ett statistiskt samband konkludera ett orsakssamband, medan den andra varnar för det (bland statistiskt naiva forskare ack så vanliga) fiskandet efter statistisk signifikans utan beaktande av multipelinferensaspekter. Båda är (liksom strippen om Cell phones) idealiska utgångspunkter för diskussioner inom en grundkurs i statistik.

Sammanfattningsvis: Skämta gärna om statistik. Om du gör det med kunskap, finess och intelligens, och om ditt skämt är roligt, så kommer jag att skratta. Om det däremot bara är okunnigt och plumpt så skrattar jag inte.

2 kommentarer:

  1. Skämtet borde kanske lyda "Det finns tre sorters statistikanvändare: statistikanvändare, förbannade statistikanvändare och lögnare". Men det blir ju inte lika smidigt språk (och kanske för nära sanningen för att det ska vara värt att skratta åt).

    SvaraRadera
  2. Visst finns det humor i statistik. Jag hade en gång i tiden en lärobok som hette "Hur man ljuger med statistik". Mycket rolig. Har utkommit i sex upplagor i detta land (originalupplagan är usansk).

    SvaraRadera