Statistiek, hypothesetoetsing en de p-waarde

Artikel bewaren

Je hebt een account nodig om artikelen in je profiel op te slaan

Login of Maak een account aan

Serie Zicht op onderzoek

De geneeskunde is bij voorkeur gebaseerd op wetenschap, oftewel de beste behandeling van een klacht, ziekte of aandoening van een patiënt is wetenschappelijk bewezen. In het Engels heet dit evidence based medicine (EBM). De wetenschappelijk bewezen beste handelwijze wordt beschreven in richtlijnen. Binnen de huisartsgeneeskunde zijn de NHG-Standaarden hiervan een bekend voorbeeld. EBM is gebaseerd op vele soorten van onderzoek. Alleen goed opgezet onderzoek kan tot EBM leiden. Hoe controleer je of een onderzoek goed is opgezet? Tijdschrift voor praktijkondersteuning laat je in een serie artikelen kennismaken met verschillende soorten onderzoek en een goede opzet ervan. In voorgaande artikelen ging het over de betekenis van EBM voor de praktijk, richtlijnen en vragenlijsten. In de komende nummers besteden we nog aandacht aan klinisch onderzoek en het kritisch lezen van een medisch onderzoeksartikel.

Stel, we hebben een onderzoek met als resultaat dat medicijn anada mogelijk effectiever is dan middel betasic, dan kun je daarvoor in principe drie verklaringen geven: 1) De bevindingen in het onderzoek zijn juist: anada is inderdaad effectiever dan betasic. 2) De bevindingen in het onderzoek zijn niet juist: in werkelijkheid (in de gehele populatie) is anada niet beter dan betasic. 3) In dit onderzoek is anada toevallig beter dan betasic. Een conclusie op basis van een verkeerd uitgevoerd onderzoek is niet acceptabel; en een conclusie die op toeval berust, ook niet.

Steekproef

Als je wilt onderzoeken of mensen baat hebben bij een bepaald medicijn, hoe ga je dan te werk? Het is onmogelijk om te onderzoeken of het effect optreedt bij alle mensen, dus wordt er gewerkt met een steekproef. Maar je wilt graag weten of een medicijn effect heeft bij alle mensen. Er is dus altijd sprake van een bepaalde mate van onnauwkeurigheid. Een van de basisregels bij het doen van onderzoek is die onnauwkeurigheid ‘onder controle krijgen’. Het is een soort kansberekening. Op grond van onderzoek in een steekproef voorspel je de kans of waarschijnlijkheid dat een bepaald effect zal optreden in de populatie.

Steekproef

Op grond van onderzoek in een steekproef voorspel je de kans of waarschijnlijkheid dat een bepaald effect zal optreden in de populatie.

Hypotheses toetsen

Het doen van onderzoek begint met het formuleren van de onderzoeksvraag. Daarin geeft de onderzoeker zo concreet mogelijk aan welke vraag door middel van het onderzoek beantwoord moet worden. Vanuit de onderzoeksvraag worden hypotheses (veronderstellingen) geformuleerd.
Stel: je wilt onderzoeken of middel A effect heeft op virusinfecties. Je stelt dan een nulhypothese op (H0) op waarin wordt uitgedrukt dat middel A geen effect heeft op virusinfecties. En daarnaast stel je een alternatieve hypothese (HA) op die uitdrukt dat middel A wel effect heeft op virusinfecties.
Het lijkt vreemd om te beginnen met een hypothetische uitspraak dat er geen verband is. Maar stel dat je onderzoek zou doen naar het al dan niet bestaan van trollen. Jouw collega zegt: trollen bestaan echt niet, daar hoef je geen onderzoek naar te doen; en jij wilt het toch onderzoeken. Dan is het aan jou om te bewijzen dat trollen wel bestaan en hoeft jouw collega niet aan te tonen dat trollen niet bestaan. Bij wetenschappelijke bewijsvoering, hypothesetoetsing, volgt men in feite dezelfde gedachtegang.
Een onderzoek naar het bestaan van trollen zou in meerdere opzichten bijzonder zijn. Bij een onderzoek naar het bestaan van trollen is de nulhypothese ‘trollen bestaan niet’; en het vinden van één trol is voldoende om de nulhypothese te verwerpen. Een bijzondere nulhypothese; bij onderzoek naar behandelingen in de geneeskunde zijn nulhypotheses meestal van het type ‘a is beter dan b’ of ‘a is niet beter dan b’.
Pas als je erin geslaagd bent om aan te tonen dat de H0 met grote waarschijnlijkheid verworpen kan worden (oftewel dat een gevonden verschil in effect niet op toeval berust), mogen we zeggen dat er wél een verband is. Onderzoek draait dus om de vraag: mag ik H0 die zegt dat er geen verschil in effect is, verwerpen en HA accepteren? Om vast te stellen of je de H0 mag verwerpen, moet je een of meerdere statistische toetsen gebruiken. Welke statistische toets je gebruikt, is afhankelijk van de opzet van het onderzoek en het type uitkomstmaat. De H0 mag pas verworpen worden als je hebt aangetoond dat de waarschijnlijkheid dat het gevonden verschil op toeval berust, klein is.

P-waarde

Die waarschijnlijkheid (de probability) wordt uitgedrukt in een p-waarde. Hoe kleiner de p-waarde, hoe kleiner de waarschijnlijkheid dat je ten onrechte de H0 verwerpt. Vinden we bijvoorbeeld een p-waarde van 0,10, dan is er nog 10% kans dat we de nulhypothese (‘er is geen verschil’) ten onrechte verwerpen (dat er bijvoorbeeld sprake is van toeval). Tien procent is een vrij grote kans dat er sprake is dat het gevonden verschil in effect op toeval berust. Vinden we een p-waarde van 0,01, dan is er toch nog 1% kans dat er sprake is van toeval. In het medisch onderzoek wordt doorgaans een p-waarde van 0,05 als afkappunt aangehouden. Is de p-waarde kleiner dan 0,05 dan spreken we van ‘statistisch significant’. We accepteren dus dat er een kans van ten hoogste 5% is dat het gevonden verschil toch nog op toeval berust. Je hebt dan meer dan 95% zekerheid dat wat je in je onderzoek hebt aangetoond, werkelijk waar is. Vinden we geen significant verschil (dus een kans groter dan 5% dat het toeval is), dan mogen we in feite alleen maar zeggen dat we de nulhypothese niet hebben kunnen verwerpen. We mogen echter geen conclusies trekken over de werkelijkheid. Wel hebben we zo in zekere mate de onnauwkeurigheid ‘onder controle’.

Bladnaam:
Tijdschrift voor praktijkondersteuning 2015, nummer 4

Literatuurverwijzingen:

Literatuur

1Geldrop W, Knuistingh Neven A. Equivalentie: aantonen van gelijkheid. Huisarts Wet 2014;57:351.