Zijn vrouwen beter in het uitladen van de vaatwasmachine?

Het is een bekend cliché: bij het uitladen van de vaatwasmachine lijken mannen systematisch niet te weten in welke kast ze de propere vaat moeten zetten. Vrouwen lijken daar minder last van te hebben: slechts af en toe, per toeval, weten ze niet waar ze iets moeten opbergen. Systematische fouten zijn nochtans minder erg dan niet-systematische! Gezondheid en Wetenschap legt uit waarom.

Waarom wegen niet alle fouten even zwaar door?

Studies worden uitgevoerd door mensen, en mensen zijn zelden perfect: we maken bewust of onbewust fouten. Eigenaardig genoeg is de ene fout de andere niet. Hoe komt dat?

Een woordje uitleg …

Uiteraard moeten we ons best doen om fouten te vermijden, opdat de resultaten van een studie zo nauw mogelijk aansluiten bij de werkelijkheid en we op die manier juiste besluiten kunnen trekken.

Schematisch gezien kunnen twee belangrijke soorten fouten de resultaten van een onderzoek ondermijnen:

systematische fouten;
niet-systematische fouten.

Wat is het verschil?

Een klassiek onderzoeksvoorbeeld om het verschil tussen beide fouten duidelijk te maken, is het gebruik van een weegschaal.

Systematische fouten

Een systematische fout is eenvoudig uit te leggen: we hebben de weegschaal geijkt, en een zak van 50 kg weegt 51 kg, een zak van 100 kg weegt 101 kg, enz. De weegschaal is dus fout ingesteld en weegt 1 kg te veel. Op zich is dat niet zo erg: je moet overal een kilogram aftrekken om tot het juiste gewicht te komen.

Door de systematische fout bedraagt het gemiddelde 83 kg, maar is het in werkelijkheid 82 kg. Belangrijk is ook dat de onderlinge verhoudingen dezelfde blijven: zonder weegfout kun je bijvoorbeeld de deelnemers met een lichaamsgewicht van 80 kg vergelijken met deelnemers die 87 kg wegen, een verschil van 7 kg. Met weegfout vergelijk je deelnemers van 81 kg met deelnemers van 88 kg; ook een verschil van ... 7 kg.

En tot slot: of je nu 50 mensen gaat wegen of 10.000, de fout blijft steeds 1 kilogram bedragen. Met de tijd doet de weegschaal het niet beter.

Niet-systematische fouten

Een niet-systematische fout is moeilijker uit te leggen. Bij dergelijke fouten ken je de richting van de fout niet: in het geval van een weegschaal betekent dit dat je niet weet of iemand te veel of te weinig weegt volgens het aangegeven cijfer. Er gebeurt bijvoorbeeld een onderzoek naar het gewicht van 25 deelnemers. Sommigen worden 's ochtends gewogen en zijn lichter, anderen 's avonds en zijn dan zwaarder. Die gegevens ontvang je dan bijvoorbeeld via mail, zonder te weten wie 's ochtends en wie 's avonds gewogen werd.

Op een kleine groep van bijvoorbeeld 20 personen kan het goed zijn dat er willekeurig 15 personen 's ochtends gewogen werden, en 5 personen 's avonds. Maar je weet niet welke cijfers het gewicht juist weergeven, en welke niet.

Als de fout willekeurig is, is er één manier om uit dit wespennest te geraken, nl. het aantal deelnemers verhogen. Als je willekeurig 's ochtends en 's avonds weegt, dan ga je met 100 deelnemers waarschijnlijk meer naar de verhouding 50/50: dit betekent dat 50 deelnemers als ‘te zwaar’ zijn gewogen, en 50 als ‘te licht’. Hierdoor krijg je een goed gemiddelde. Maar je zal nooit weten wie in welke groep zit. Als je dan deelnemers van 80 kg gaat vergelijken met deelnemers van 87 kg, kan het verschil 7 kg bedragen, maar ook meer of minder dan dat.

Conclusie

De gevolgen van een niet-systematische fout kun je in een wetenschappelijk onderzoek beperken door het aantal deelnemers te verhogen, waardoor het gemiddelde accurater wordt. Voor niet-systematische fouten bij het uitladen van de vaatwasmachine ligt de oplossing helaas minder voor de hand...