Artikel bewaren

Je hebt een account nodig om artikelen in je profiel op te slaan

Login of Maak een account aan
Reacties0

Diagnostiek: het nut van tests

redactie

Geneeskunde is een onzeker vak en we proberen die onzekerheid zo klein mogelijk te maken. Dat doen we met behulp van diagnostiek. Als een patiënt pijn op de borst heeft, maken we een ecg, als iemand langdurig hoest is er de thoraxfoto, en bij kortademigheid vertrouwen we op spirometrie of een BNP-bepaling. Zien we op het ecg geen ST-elevaties of -depressies dan zijn we gerustgesteld; het zal dan wel geen angina pectoris of hartinfarct zijn. Is de BNP niet verhoogd, dan is het hoogstwaarschijnlijk geen hartfalen en bij een irreversibele daling van de 1-secondewaarde (FEV1) hebben we waarschijnlijk te maken met COPD. Maar hoe zeker zijn we daar nu echt van? De laatste jaren blijkt steeds meer dat ook vrijwel al het diagnostisch onderzoek leidt tot onzekere uitkomsten, zij het dat we de mate van onzekerheid verkleinen door de juiste aanvullende diagnostiek. De mate waarin de onzekerheid afneemt door diagnostiek, is afhankelijk van de eigenschappen van de diagnostische test die wij gebruiken. Daarover gaat dit artikel.

Kader 1 Boezemfibrilleren

Boezemfibrilleren komt bij ouderen vrij vaak voor, maar zij voelen dit niet altijd, terwijl het wel kan leiden tot een CVA. De kans op een CVA bij boezemfibrilleren kan fors verminderen door het gebruik van acenocoumarol of acetylsalicylzuur, dus het loont de moeite om boezemfibrilleren op te sporen, ook al is het asymptomatisch. Het is daarom zinvol om bij oudere mensen de pols te voelen. Maar hoe goed voorspelt een irregulaire pols het bestaan van boezemfibrilleren? En hoe zeker weten we dat er geen sprake is van boezemfibrilleren als de pols regulair is? Om die vraag te beantwoorden heeft men herhaaldelijk onderzoek gedaan, waarbij men de bevindingen bij palpatie van de pols bij ouderen vergeleek met een ecg. De resultaten van dat onderzoek zijn samengevat in een review1 weergegeven in tabel 1.
[[tbl:324]]

De eigenschappen van een test

De eigenschappen van een diagnostische test (en dat kan een vraag zijn, een lichamelijk onderzoek of een aanvullende test) worden uitgedrukt in twee complementaire begrippen: sensitiviteit en specificiteit. Sensitiviteit geeft de proportie zieken aan die de test opspoort, specificiteit geeft de proportie niet-zieken aan die de test als niet-ziek identificeert.

Tabel 1 geeft de resultaten weer van een systematische review waarin men onderzocht wat de waarde is van het voelen van de pols. Er deden 2299 patiënten mee aan het onderzoek; bij 122 van hen kon men boezemfibrilleren vaststellen op een ecg, bij 2177 was geen sprake van boezemfibrilleren. Bij 725 van hen voelde men een irregulaire pols, bij 1574 was de pols regulair. Bij 115 van de 122 patiënten met boezemfibrilleren bleek de pols irregulair. Daaruit kunnen we de sensitiviteit berekenen: 115 (patiënten met boezemfibrilleren en onregelmatige pols) / 122 (alle patiënten met boezemfibrilleren op het ecg) en dat is 0,94 of 94%. De specificiteit is een stuk lager, namelijk: 1567 (alle mensen zonder onregelmatige pols en zonder boezemfibrilleren) / 2177 (alle mensen zonder boezemfibrilleren) en dat is 0,72 of 72%. Je kunt het ook anders zeggen: als iemand op het spreekuur komt met boezemfibrilleren en we voelen de pols, dan voelen we bij 94% een onregelmatige pols en als iemand zonder boezemfibrilleren op het spreekuur komt dan voelen we bij 72% geen onregelmatige pols.
Voor het berekenen van de testeigenschappen sensitiviteit en specificiteit gebruiken we de verticale kolommen van de vierveldentabel (tabel 1). In mathematische zin zijn de eigenschappen van een test daarmee onafhankelijk van de prevalentie van een aandoening.

Diagnostiek

Wat betekenen die eigenschappen voor onze diagnostiek? Hoewel we nu de eigenschappen van de test kennen, weten we daarmee nog niet wat het precies betekent als we een onregelmatige pols voelen. We willen immers weten hoe groot de kans is dat iemand boezemfibrilleren heeft als we een onregelmatige pols voelen. En dat is niet alleen afhankelijk van de eigenschappen van de test, maar ook van de voorafkans dat iemand boezemfibrilleren heeft. Dat noemen we de prevalentie van een aandoening. In tabel 1 kunnen we gemakkelijk uitrekenen dat de voorafkans (dus voordat we de pols voelden) op boezemfibrilleren 122 (alle patiënten met boezemfibrilleren) / 2299 (alle patiënten) = 5,3% was.
Nadat we een onregelmatige pols hebben vastgesteld, is de kans op boezemfibrilleren gestegen naar 115 (alle patiënten met boezemfibrilleren en een onregelmatige pols) / 725 (alle patiënten met een onregelmatige pols) = 15,9%. Dat noemen we de positief voorspellende waarde (VW+). De kans dat iemand zonder onregelmatige pols ook inderdaad geen boezemfibrilleren heeft, is 1567 (alle patiënten zonder onregelmatige pols en zonder boezemfibrilleren) / 1574 (alle patiënten zonder onregelmatige pols) = 99,6%. Dat noemen we de negatief voorspellende waarde (VW-). Het ontbreken van een onregelmatige pols sluit boezemfibrilleren dus vrijwel uit (dat komt door de hoge sensitiviteit), maar het voelen van een onregelmatige pols maakt het bestaan van boezemfibrilleren allerminst zeker.
Voor de berekening van de achterafkansen (de positief en negatief voorspellende waarden) gebruiken we de horizontale rijen van de vierveldentabel (tabel 1). Behalve de testeigenschappen heeft daarom de prevalentie van een aandoening grote invloed op de uitkomsten van die berekening. De positief en de negatief voorspellende waarden zijn voor ons het meest betekenisvol, maar worden dus – behalve door de testeigenschappen – ook bepaald door de prevalentie van een aandoening.

De invloed van de prevalentie

De genoemde getallen zijn afkomstig uit onderzoeken bij 65-plussers. Bij die leeftijdsgroep heeft 1 op de 20 mensen boezemfibrilleren. Doen we eenzelfde onderzoek bij veel jongere mensen dan veranderen de sensitiviteit en specificiteit niet of nauwelijks, maar de positief en negatief voorspellende waarden veranderen wel degelijk. De voorafkans (prevalentie van de aandoening) is bij jongeren immers anders (veel kleiner). Zouden we een groep 40-jarigen onderzoeken (prevalentie 1%) dan is de achterafkans op het bestaan van boezemfibrilleren bij een onregelmatige pols kleiner dan 4%. We moeten in dat geval 25-30 ecg’s maken om eenmaal boezemfibrilleren te vinden. Doen we een dergelijk onderzoek op een polikliniek cardiologie (met een prevalentie van 20% boezemfibrilleren), dan is de VW+ ongeveer 46% en de VW- ongeveer 98%.
De negatief voorspellende waarde blijft in dit voorbeeld hoog: tussen 98% en bijna 100%. Van het niet bestaan van boezemfibrilleren zijn we dus bijna zeker bij het ontbreken van een irregulaire pols. Een test met een hoge sensitiviteit is dus uitermate geschikt om een aandoening uit te sluiten, maar heeft vaak veel fout-positieve uitslagen. Bij een hoge specificiteit daarentegen zijn er meestal veel minder foutpositieven, maar missen we relatief veel zieken.

Screening

Bij screening onderzoek je mensen die geen klachten hebben en waarbij er geen aanwijzingen zijn voor een bepaalde aandoening. We hebben dan meestal te maken met een lage prevalentie van ziekte. Een geschikte test voor screening moet dan ook zowel zeer sensitief zijn (want we willen geen zieken missen) als zeer specifiek (want we willen ook niet het risico lopen op veel fout-positieve tests met als consequentie ongerustheid en vaak duur en invasief vervolgonderzoek).
Als 1 op de 100 mensen de beoogde aandoening zou hebben, is zelfs bij een test met een sensitiviteit van 99% en een specificiteit van 99% de positief voorspellende waarde slechts 50% (zie kader 2). De meeste tests hebben echter niet zulke goede testeigenschappen. Een toename van de sensitiviteit gaat bovendien meestal ten koste van de specificiteit en andersom. Of screening klinisch nuttig is, hangt van meer factoren af dan van alleen testeigenschappen, maar het is goed je te bedenken wat de voorspellende waarden zijn bij een (zeer) lage prevalentie.

Kader 2

[[tbl:326]]

Bij een prevalentie van 1% zijn 100 van de 10.000 geteste personen ziek, en 9.900 niet. Een test met een sensitiviteit van 99% identificeert 99 van de 100 zieke personen. Bij een specificiteit van 99% heeft 1% van de niet-zieken een positieve test.
De VW+ is dan dus 99 / 99 + 99 = 0,50 of 50%.

Wat geldt voor screening, geldt natuurlijk ook voor het doen van tests ter geruststelling: om bezorgdheid bij patiënten weg te nemen. Testen zonder dat daar een goede reden voor is (aanwijzingen voor het bestaan van ziekte) kan je in een lastige positie brengen. De meeste laboratoriumtests bijvoorbeeld hebben slechtere testeigenschappen dan 99% en dat betekent dat de kans op fout-positieven fors toeneemt. In het voorbeeld in kader 2 zal (bij een sensitiviteit en specificiteit van 0,99) de kans op ziekte bij een afwijkende uitslag slechts 16% zijn. Slechts 1 op de 7 patiënten met een positieve test is dan ziek (de tabel kun je nu zelf wel invullen). Testen leidt er in die situatie toe dat veel meer zieken dan niet-zieken een positieve testuitslag hebben. We maken in dit voorbeeld dus veel meer mensen achteraf ten onrechte ongerust dan dat we zieken opsporen, en dat terwijl de bedoeling juist was om ongerustheid weg te nemen. In het algemeen is de kans op ziekte zonder dat daar aanwijzingen voor zijn nog veel kleiner dan 1%. Op die manier kan testen ter geruststelling gemakkelijk leiden tot veel meer onrust.

Bladnaam:
Tijdschrift voor praktijkondersteuning 2009, nummer 4

Literatuurverwijzingen:

Literatuur

1Van Weert HC. Therapie (3) informatie zoeken. Tijdschr Praktijkondersteuning 2009;4:39-42.
2Cooke G, Doust J, Sanders S. Is pulse palpation helpful in detecting atrial fibrillation? A systematic review. J Fam Pract 2006;55:130-4.