Artikel bewaren

Je hebt een account nodig om artikelen in je profiel op te slaan

Login of Maak een account aan
Reacties0

Therapie (2): effectonderzoek

redactie

Waarom worden zieke mensen beter?

In het algemeen zijn er vier redenen die ervoor zorgen dat zieke mensen beter worden: 1. het natuurlijk beloop (de meeste aandoeningen zijn self-limiting), 2. het placebo-effect (als je gelooft dat iets werkzaam is, helpt het vaak ook), 3. het Hawthorne-effect (aandacht doet wonderen, door aandacht alleen gaan mensen zich beter voelen) en 4. het gunstige effect van de behandeling zelf. (Zie kader 1.)

Kader 1: Hawthorne, placebo en natuurlijk beloop

Mensen gaan vaak naar de dokter als hun klachten op het hoogtepunt zijn. Ook al helpt een behandeling helemaal niets, toch gaat het daarna beter met hen. Ten onrechte denkt men dat dit door de behandeling komt.
Het Hawthorne-effect dankt zijn naam aan een onderzoek naar het effect van verandering van werkomstandigheden op de arbeidsproductiviteit in een fabriek in het plaatsje Hawthorne in de Verenigde Staten. Men experimenteerde met verschillende arbeidsomstandigheden, maar ongeacht de aangebrachte wijzigingen bleek de productiviteit te stijgen. Deze stijging werd verklaard uit de interesse en aandacht die er was voor de arbeiders. Sindsdien staat het effect van interesse en aandacht bekend als het ‘Hawthorne-effect’.

Placebo is Latijn voor ‘ik zal behagen’. Met het placebo-effect wordt de niet-specifieke werking van een behandeling bedoeld die ontstaat omdat men verwacht dat iets zal helpen. Ook bij toediening van een chemisch inactieve stof leidt het geloof in de werkzaamheid van dat middel tot een verbetering bij de behandelde persoon.

Bij onderzoek naar de werkzaamheid van een bepaalde behandeling is het belangrijk om te weten of verbetering bij de onderzochte patiënten echt komt door de behandeling zelf (het specifieke behandelingsffect), of dat een of meerdere van de bovengenoemde aspecifieke effecten (natuurlijk beloop, placebo- of Hawthorne-effect) een rol spelen. Als je het specifieke behandeleffect wilt onderzoeken, moet je eigenlijk de aspecifieke effecten uitschakelen. Er is een vorm van wetenschappelijk onderzoek waarin je alleen het specifieke behandelingsverschil tussen groepen van patiënten met elkaar vergelijkt. Alle patiëntengroepen ondergaan dan de drie aspecifieke behandelingseffecten en één groep ondergaat tevens het specifieke behandelingseffect. Zo’n onderzoek is het gerandomiseerde effectonderzoek (of in het Engels: de randomized controlled trial = RCT).

De RCT

De RCT geldt als de beste vorm van effectonderzoek. De onderzoeker heeft immers maximale controle over de condities en kan zo verstorende invloeden (aspecifieke behandelingseffecten) het best uitschakelen. Meestal bestaat een RCT uit twee armen (twee groepen patiënten): een arm met het werkzame middel (de interventie-arm) en een arm zonder het werkzame middel (de controlearm). Bij een goed opgezette RCT is het enige verschil tussen de twee patiëntengroepen de werkzaamheid van het onderzochte geneesmiddel of de onderzochte behandeling (het specifieke behandelingseffect). De kern van een RCT is dat twee groepen patiënten dezelfde behandeling krijgen, uitgezonderd het werkzame bestanddeel. De C (controlled) in RCT staat voor controlebehandeling. Het effect in de interventiearm min het effect in de controlearm is dan het specifieke behandelingseffect. De proefpersonen mogen natuurlijk niet weten wie de echte en wie de nepbehandeling krijgt (blindering van de patiënten), want dan kan er alsnog sprake zijn van een placebo-effect.
Het effect van een behandeling is alleen goed vergelijkbaar als de patiënten in beide groepen evenveel kans hebben op het bereiken van de beoogde uitkomst (zie kader 2.) Om dat te bereiken verdeelt men de patiënten willekeurig over de twee groepen. Iedere patiënt heeft zo evenveel kans om in de interventiegroep of in de controlegroep terecht te komen. Dat noemt men randomisatie. Verder is belangrijk dat de uitkomsten zo objectief mogelijk worden vastgesteld en dat er zo weinig mogelijk uitval van de deelnemers is. Ten slotte speelt de wijze van analyseren een grote rol. Alles is er bij dit soort onderzoek op gericht om vertekening (Engels: bias) zoveel mogelijk te voorkomen.

Kader 2: onvergelijkbare patiëntengroepen

Voor een onderzoek naar het effect van een nieuw middel tegen hoge bloeddruk includeerde men gezonde vrijwilligers bij sportclubs, waarvan de leden een vergelijkbare sportieve inspanning leverden. De voetballers kregen het placebomiddel, de hockeyers het werkzame middel. De beide groepen verschilden niet van elkaar wat betreft leeftijd, cholesterolwaarde en uitgangsbloeddruk, Na enige jaren bleek de sterfte bij de voetballers hoger dan bij de hockeyers. Heranalyse bracht de verklaring aan het licht: verschil in rookgedrag. Voetballers roken vaker dan hockeyers.

Randomisatie

We weten eigenlijk nooit welke factoren allemaal van belang kunnen zijn voor het bereiken van een bepaalde uitkomst. Om te zorgen dat de patiënten in beide armen van het onderzoek toch zoveel mogelijk vergelijkbaar zijn, neemt men daarom zijn toevlucht tot randomiseren: het lot bepaalt in welke groep een patiënt terechtkomt. Omdat de verdeling van patiënten volledig willekeurig is, gaan we ervan uit dat ook hun eigenschappen (ook die waarvan we niet weten dat ze een rol spelen) willekeurig (en dus vergelijkbaar) zijn verdeeld. Er zijn verschillende vormen van randomisatie mogelijk. Het is daarbij van belang dat toewijzing echt ‘at random’ plaatsvindt. Mogelijkheden om de toewijzing te manipuleren moeten zoveel mogelijk worden voorkomen. Dokters kunnen patiënten bijvoorbeeld in een onderzoek opnemen, omdat ze denken dat de behandeling gunstig is voor hen. Weten ze van tevoren dat een patiënt in de controlearm terechtkomt, dan beïnvloedt dat hun beslissing. Een ernstig zieke patiënt kan dan bijvoorbeeld buiten het onderzoek gehouden worden. Er zijn allerlei vormen van pseudorandomisatie (om en om indelen, iedere derde patiënt, etcetera), waarbij degene die de patiënten insluit vooraf kan weten in welke arm een patiënt terechtkomt. Degene die patiënten insluit mag niet kunnen voorspellen in welke arm een patiënt terechtkomt. (Engels: concealment of randomization).

Blindering

In een RCT proberen onderzoekers het zuivere effect van een middel of behandeling te beoordelen. Om te voorkomen dat het placebo- of Hawthorne-effect de uitkomsten in een RCT beïnvloedt, mogen de patiënten, noch de behandelaars, noch de effectbeoordelaars in het onderzoek weten in welke arm een bepaalde patiënt is ingedeeld en ze mogen het ook niet kunnen ontdekken. Dat noemt men blinderen. Immers, als patiënten weten dat zij het werkzame middel krijgen, kan een placebo-effect optreden. En als patiënten in de interventiearm extra aandacht krijgen, kan er sprake zijn van het Hawthorne-effect. Behandelaars die bijvoorbeeld sterk geloven in de werkzaamheid van de behandeling, kunnen dat op de patiënten overdragen, met als gevolg een placebo-effect. Alle patiënten moeten dus op precies dezelfde manier worden behandeld en dat moet worden volgehouden totdat de gegevensverzameling van het onderzoek is afgesloten. Ook bij de beoordeling van het effect kan vertekening optreden. Bijvoorbeeld als degene die de uitkomst vaststelt op de hoogte is van de behandeling die een bepaalde patiënt heeft gekregen.

De patiënten

Om te zorgen dat patiënten het verschil tussen de behandelingen niet ontdekken, maken onderzoekers vaak gebruik van een placebomiddel of een placebobehandeling. Idealiter heeft het placebomiddel, afgezien van de werkzaamheid, precies dezelfde eigenschappen als het ‘echte’ medicijn: dezelfde kleur, geur, smaak, consistentie en bijwerkingen. Is dat niet het geval, dan bestaat immers het risico op ‘ontdekking’. Met medicijnen is dat meestal nog wel te doen, maar met bijvoorbeeld psychotherapie of fysiotherapie is dat veel moeilijker. Hoe geef je neppsychotherapie?
Onderzoekers maken niet altijd gebruik van een placebo. Soms willen ze juist twee verschillende behandelingen met elkaar vergelijken en soms mogen ze geen placebobehandeling gebruiken. Dat laatste is bijvoorbeeld het geval als er al een werkzame behandeling bestaat en het niet behandelen de proefpersonen zou schaden. Soms is het ook de bedoeling van het onderzoek om het effect van een medicijn of behandeling ‘in de praktijk’ te ontdekken. In dat geval moet je natuurlijk niet vergelijken met een placebo, want dan wil je juist het effect inclusief aspecifieke behandelingseffecten weten.
De patiënten in beide armen moeten niet alleen een vergelijkbaar medicijn of vergelijkbare behandeling krijgen, ze moeten ook even vaak en op dezelfde manier worden onderzocht of bevraagd om het Hawthorne-effect te voorkomen. Als patiënten in de ene arm immers veel meer aandacht krijgen, zal daar een sterker Hawthorne-effect optreden.

De behandelaars en effectbeoordelaars

Wat voor patiënten geldt, geldt ook voor de behandelaars. Als een behandelaar weet welke patiënten de experimentele behandeling krijgen, zal hij mogelijk meer geïnteresseerd zijn in het wel en wee van de patiënten in de interventie-arm. Hij kan daarmee een Hawthorne-effect veroorzaken.
Bij onderzoekers speelt nog een tweede fenomeen. Als een onderzoeker gelooft dat het onderzochte middel beter is dan het middel waarmee wordt vergeleken, kan hij bevooroordeeld zijn bij de interpretatie van de uitkomsten of bijvoorbeeld suggestief zijn richting de proefpersonen bij het afnemen van vragenlijsten. Daarom moet ook degene die het effect beoordeelt geblindeerd zijn. Die blindering van de effectbeoordelaar speelt overigens minder een rol naarmate de uitkomst objectiever kan worden vastgesteld. Als de uitkomst bijvoorbeeld mortaliteit is, zal er niet zo snel een verschil van interpretatie optreden. Bij de beoordeling van klachten kan wel erg gemakkelijk vertekening optreden. Dit speelt ook een rol bij de interpretatie van allerlei onderzoeksbevindingen, zoals bijvoorbeeld een thoraxfoto. Naarmate de uitkomst meer afhankelijk is van subjectieve beoordeling, is het belangrijker dat ook de effectbeoordelaar geblindeerd is.
Onderzoek waarbij zowel de patiënten als de onderzoekers geblindeerd zijn, noemt men dubbelblind (Engels: double blind).

Follow-up

Te veel uitval van patiënten kan leiden tot vertekening van resultaten. Patiënten vallen niet zomaar uit en als dit op grote schaal gebeurt, kan dit gemakkelijk verband houden met een selectieve uitval. De resultaten zijn dan niet meer geldig voor alle ingesloten patiënten, maar slechts voor degenen die het onderzoek hebben beëindigd. Voor de praktijk heeft zo’n onderzoek dan veel minder waarde. Om een goede vergelijking te kunnen maken moet er zeker geen selectieve uitval optreden in een van de armen. Je weet immers niet waarom patiënten uitvallen: misschien worden ze wel te ziek of hebben ze geen zin meer om nog aan het onderzoek mee te doen omdat ze zich veel beter voelen. Misschien hebben ze te veel last van bijwerkingen. Kortom, als de uitval in de ene arm groter is dan in de andere, is dat altijd verdacht.
Als er sprake is van uitval van patiënten moeten de onderzoekers altijd vermelden wat daarvan de redenen zijn. De lezer kan zich dan een oordeel vormen over die redenen en daarmee over de geldigheid van de resultaten.
Het is moeilijk om een algemeen geldende regel te geven voor het beoordelen van de uitval, maar als die groter is dan 80% moet je bijzonder op je hoede zijn.
[[tbl:313]]

Analyse

Het is van groot belang dat patiënten worden geanalyseerd in de arm waarin ze oorspronkelijk zijn ingedeeld en dat uitvallers worden meegeteld. We noemen dat de ‘intention to treat’-analyse (ITT). Als men de uitvallers niet meetelt, leidt dat in het algemeen tot overschatting van het behandelingseffect. Want dan vergelijkt men immers alleen degenen die de behandeling ook hebben volgehouden (en bijvoorbeeld niet te veel bijwerkingen hadden; zie kader 3). Vaak gebruikt men daarvoor een techniek waarbij de laatstgemeten waarde als eindpunt wordt geteld (Engels: last observation carried forward).
Soms is een ITT-analyse niet de beste analysevorm. Bijvoorbeeld als men wil aantonen dat de ene behandeling gelijkwaardig is aan de andere. We gaan dan niet op zoek naar verschillen, maar proberen juist aan te tonen dat een nieuwe behandeling minstens even goed is als een bestaande therapie. Dan zoeken we het maximale contrast. Als er een verschil is in uitkomst tussen de behandelingen is dat verschil het grootst als alle patiënten ook behandeld worden zoals bedoeld.

Kader 3: loss to follow-up

Bij een onderzoek naar het effect van een nieuw antihypertensivum wordt het nieuwe middel vergeleken met een diureticum. In beide armen van de trial zaten 200 patiënten. Na 2 jaar werden de bloeddrukken vergeleken van de patiënten die zich trouw hadden gemeld bij de onderzoekers. De systolische bloeddruk in de interventiearm bleek gemiddeld 8 mmHg lager, in de controlearm was dat 5 mmHg: een significant verschil. Er bleken echter in de interventiearm slechts 140 patiënten analyseerbaar, in de controlearm waren dat er 170. Toen men de analyse overdeed met als uitkomst de laatstgemeten bloeddruk bleken de uitvallers niet alleen een hogere bloeddruk te hebben, maar ook vaker in het ziekenhuis te zijn geweest (en daar behandeld met andere medicatie) ten gevolge van een TIA. Als men de resultaten daarvoor corrigeerde was het verschil in bloeddruk niet meer significant en bleek zelfs een toename van CVA’s in de interventiegroep.

Contaminatie

Tenslotte is er nog een vijfde element dat van belang kan zijn: co-interventies en contaminatie. Vooral bij langerdurend onderzoek of bij onderzoek waarbij mensen veel klachten hebben, kunnen interventies die niet in het onderzoeksprotocol waren opgenomen de resultaten verstoren. In een onderzoek naar de effecten van pijnstillers bij mensen met nekpijn worden wellicht relatief veel patiënten uit de placebogroep (zij hebben immers meer pijn) verwezen naar een fysiotherapeut. Een dergelijke co-interventie kan het uiteindelijke contrast tussen de beide armen verminderen.
Van contaminatie spreken we als patiënten in de controlegroep ook (een deel van) de onderzochte interventie krijgen. Contaminatie ligt bijvoorbeeld op de loer als dokters (of praktijkondersteuners) patiënten in de controlegroep en de interventiegroep op een verschillende manier moeten behandelen. (Zie kader 4.)

Kader 4: contaminatie

In een onderzoek naar het effect van het voelen van de pols bij oudere patiënten die werden gecontroleerd in verband met een hart- of vaatziekte, randomiseerde men de patiënten naar een interventiearm (wel voelen) en een controlearm (niet voelen). De uitkomst van het onderzoek was het aantal patiënten bij wie boezemfibrilleren werd vastgesteld. Aan het einde van het onderzoek bestond geen verschil tussen beide armen. Bij navraag bleken de deelnemende praktijkondersteuners gaandeweg ook bij patiënten in de controlearm de pols te voelen, omdat ze waarnamen dat in de interventiearm relatief vaak boezemfibrilleren werd vastgesteld.

Als aan genoemde elementen wordt voldaan dan is de RCT in principe goed opgezet en uitgevoerd en zijn de resultaten geldig. We zeggen dan dat de interne validiteit in orde is. In tabel 1 zetten we de belangrijkste elementen uit een RCT nog eens op een rijtje.

Het ultieme bewijs

Een vorm van onderzoek die we nog hoger aanslaan dan de RCT is het systematisch literatuuronderzoek (Engels: systematic review) en vooral een speciale variant daarvan: de meta-analyse (Engels: meta analysis). Een systematisch literatuuronderzoek vat, na een uitgebreide zoektocht door de literatuur, de resultaten van een aantal RCT’s samen. Bij een meta-analyse voegen onderzoekers de resultaten van alle gevonden RCT’s samen in een nieuw gegevensbestand en analyseren deze opnieuw. Het voordeel van zo’n meta-analyse is natuurlijk de grotere statistische bewijskracht en de mogelijkheid om subgroepen van patiënten (bijvoorbeeld vrouwen, verschillende etnische groepen, et cetera) te analyseren (kader 5).
Alle andere vormen van onderzoek, zoals het cohortonderzoek, het patiëntcontroleonderzoek en de patiëntenserie hebben minder bewijskracht dan de RCT. Deze onderzoeksvormen komen later nog aan de orde.
Terugkerend naar het vitamine-C-verhaal is de reden van het succes daarvan waarschijnlijk een combinatie van natuurlijk beloop, placebo- en Hawthorne-effect. Moeten we dit patiënten vertellen? Niet noodzakelijk want vitamine C is onschadelijk en niet duur. Daarnaast zijn niet-specifieke behandelingseffecten van niet te onderschatten waarde en daarom in de dagelijkse praktijk vaak niet ongewenst.

Kader 5

In de meeste onderzoeken naar het effect van bijvoorbeeld bloeddrukverlagende medicijnen worden alleen gezonde jonge mannen ingesloten, en dan nog voornamelijk blanke mannen. Bij veel dokters leefde het idee dat antihypertensiva een verschillende werking zouden kunnen hebben bij blanke en donkere mensen, maar geen enkel onderzoek had voldoende donkere mensen ingesloten. Door het samenvoegen van de resultaten van gepubliceerd onderzoek over donkere en blanke mensen afzonderlijk, kon ook over het effect bij negroïden een uitspraak worden gedaan. Bij hen bleken diuretica en calciumantagonisten effectiever dan andere middelen. (NHG-Standaard Cardiovasculair risicomanagement.)

Bladnaam:
Tijdschrift voor praktijkondersteuning 2009, nummer 1

Literatuurverwijzingen:

Literatuur

1Offringa M, Assendelft WJJ, Scholten RJPM. Inleiding in evidence-based medicine. Houten: Bohn Stafleu van Loghum, 2008.
2
Op de website van het Nederlandse Cochrane Centrum is veel Nederlandstalige informatie te vinden over evidence based medicine, zoals over de methodologie van wetenschappelijk onderzoek. Tevens zijn daar beoordelingsformulieren voor allerlei vormen van wetenschappelijk onderzoek te downloaden, bijvoorbeeld voor een RCT via [Checklists en andere downloads].
3www.cebm.net is de website van het Centre for Evidence Based Medicine. Op deze Engelstalige site staan allerlei handige tools en presentaties. Voor de liefhebber.