Pour un résultat de test négatif, un RV- de 0,25 indique que les probabilités sont de 1:4 (faux négatifs: vrais négatifs) qu'un résultat de test négatif représente un patient atteint de maladie.
Les performances d'un test se mesurent par rapport à une référence « gold standard » qui peut être un examen de référence ou une expertise permettant de catégoriser les patients en « malade » ou « non malade ».
– il est standardisé ; – il permet de situer la conduite de chaque sujet dans un groupe de référence ; – le degré de précision des mesures qu'il permet est évalué (fidélité) ; – la signification théorique ou pratique de ces mesures est précisée (validité). »
CONCEPTSETOUTILS BehrouzKassaïJulieManièreKim-AnNguyenInserm,CIC201,Servicedepharmacologieclinique,HospicescivilsdeLyon,UniversitéLyon1Motsclés:testdiagnostique,indices,seuilsDOI:10.1684/med.2006.0010 OutilsUntestdiagnostique estunexamen d"imagerie,uneéchelle binariséeouun examenbiologiquedontle résultatdoitpermettre dedétecterla présenceoude prédirelasurvenued"unétat pathologique.Un"nouveau»testdoitêtre évaluéselonune mé-thodologieadaptéeavant d"êtreutiliséen routine.Cetteévaluation comporteplusieursphasesetpermettra infined"estimerlesperformances diagnostiquesenquantifiant lesindicesde précision,notammentla sensibilité,laspécificité, etlerapport descotes.Lavalorisationde cesindicesne suffitpasà validerletest.
Lesmodificationsque sonintégrationdansla démarchemédicaleentraîne etl"impactde sonutilisationen routinesurl"étatde santédespatients doiventaussiêtre quantifiés.Qu"attendred"un"testdiagnostique»?Lesindicesdeprécisiondestestsdiagnostiques(1repartie)Laméconnaissancedes méthodologiesadaptéesà l'évaluationdestests estunobstacle importantàl agénéralisationdela médecinefactuelleau domainediagnostique[1].D'importants progrèsontété effec-tuésdansle domainedela méthodologied'évaluationdestestsces dernièresannéesavec deréelsespoirs d'uneutilisationplus rationnelledeces examens[2].Maisl'absenced ecadreréglementaire biendéfinipourl'évaluationdes testsavantleur généralisationresteunobstacle majeuràl agénéralisationde plansdedéveloppementclinique rigoureuxpourles testsdiagnostiques.L'objectifde cetarticleest d'exposerlesbasesméthodologiques del'évaluationdes perfor-mancesdiagnostiquesd'un test.Danscettepremière partie,nousnous intéressonsauxrésultatsdu test:celui-ci peutêtrepositif ("anor-mal», c'est-à-direunevaleurobservée au-delàduseuil)ounégatif ("normal» c'est-à-direunevaleur ob-servéeendeçà duseuil),et lamaladieprésente ouabsente.Lesrésultats del'applicationdu testdiagnos-tiqueàune populationdansl'idéal oudansle cadredesonévaluationpeuvent êtrereprésentéssous laformed'untableau2 ×2(tableau1).Unesérie d'indicesaétéconstruiteà partirdesnombres decetableau -et parfoisd'autresinformations -pourcaractériser untestparses performances.Lesindicesdeprécisionetcombinaisonslesplussimples-Lasensibilité(Se)estla probabilitéd'avoirun testpositifquandon estmalade: a/( a+c). -Laspécificité(Sp)estla probabilitéd'avoirun testnégatifquandon n'estpasmalade :d/ (b+ d).-Lavaleurprédictivepositive dutest(VPP),lapro- babilitéd'avoirla maladiequandle testestpositif :a/(a +b).-Lavaleurprédictivenégative dutest(VPN),celledenepas avoirlamaladie quandletest estnégatif: d/(c +d).-Lesrapportsdevraisemblance (enanglaisLikeli-hoodRatio,LR)estiment lerapportentre laprobabi-litéd'avoirun testpositif(ou négatif)chezles sujetsmaladesàcelle d'avoiruntest positif(ounégatif) chezlessujetssains.
Lerapportde vraisemblancepositifestdoncLR(+) =(sensibilité)/ (1- spécificité)etné- gatifLR(-)= (1- sensibilité)/spécificité. -Le"DiagnosticOddsRatio »(DOR)ou lerapportdescotesdiagnostiques estconnucomme unindicestatistiquedans l'épidémiologiedesétudes368MÉDECINEoctobre200695161L : 219.992- Type : pINT06-10-1711:42:26 - Folio : p32- H : 306.994- Couleur : BlackYellowMagentaCyanTableau1.Tableau2×2issudel'évaluationd'untestdiagnostiqueMaladieprésenteMaladieabsenteTest+Vrai+(VP)= aFaux+(FP)=ba=bTest-Faux-(FN)=cVrai-(VN)=dc+dTotala+ cb+da+b+c +daestle nombredesujets atteintsetpour quiletest est"positif»;best lenombrede sujetsnonatteints parlamaladie pourlesquelsletestest "positif»;cest lenombrede maladespourlesquels letestest "négatif»;dest lenombrede sujetsnonatteints pourlesquelsletest est"négatif».cas-témoins.Ilreprésente laforcede l'associationentrele facteurderisque etlamaladie.
Ici,ilpourrait êtreutilisépour montrerlaforce del'associationentre lerésultatd'un testetlamaladie.
Cetindicecherche àquantifierla performanced'untestpar uneseulevaleur.Celle-cin'estpas influencéeparla prévalence,contrairementaux indicesprécédents.DORestle ratioentrela coted'êtremalade (probabilitéd'êtremaladediviséepar laprobabilitéde nepasêtre malade)lors-queletest estpositifet lacotede nepasêtre maladelorsqueletestest négatif.DOR= (VP/FN)/(FP/VN)=ad/bc =[Se/(1-Se)]/[(1 -Sp)/Sp]=LR+/LR- =[VPP/(1 -VPP)]/[(1-VPN)/VPN].Lavaleur duDORvarie de0à l'infini.Lesvaleurs hautessignifientune meilleureperformancedu test.Lava- leur=1 signifiequele testn'aaucune valeurdiscriminanteetunevaleur '1que letestest plussouventpositif chezlesmaladesquechez lessujetssains.
Lethéorèmede Bayesstipuleque lacoted'être maladeaprèsuntest(+ ou-)est égaleàl acoted'être maladeavantletest(+ ou-)que multiplielerapport devraisemblance(+ou-).
Laprévalencede lamaladiedans lapopulationétu- diéepermetde calculerlacote d'êtremaladeavantletestsielleest connue.Laprobabilité d'êtremaladepeut êtrecal-culéeàpartir delacote :Probabilitéd'êtremalade (test+o u-) =coted'êtremalade (testest+ ou- )1+cote d'êtremalade(test +ou -)Faganaproposé unnomogrammedès 1977(figure1)pourpermettredecalculer laprobabilitéde maladieàpartir desrésultatsd'untest [3].Qu"enpenser?LasensibilitéetlaspécificiténesontpasdesvaleursinvariablesetintrinsèquesàprévalencedemaladiedonnéeEnthéorie,ces indices,aucontraire decequi estenseignéhabituellementdansles ouvragespédagogiques,sont uni-quementconstantslorsque lapositivitédu testderéférence (quidéfinitla présencedela maladie)entraînede façoncau-salelapositivité dunouveautest.
Ondistingueen effet:-Levraitest diagnostique:ilestrelié demanièrecausale autestde référence(ouà lamaladie).
Parexemple,si l'ap-paritiond'uncancer ducôlondétecté parlacolonoscopie en-traînaitsystématiquementla présencedusang danslessel- les,lasensibilité etlaspécificité del'Hémoccult?seraientconstantescarle testdétecteraitla mêmeproportiond'hé- morragiefécale[4].
Cecasde figureestassez rare.-Letestprédictif :ilpréditl'apparition delamaladie.Lamajoritédestests quenousutilisons sontdece type.Unexempledetest prédictifestcelui delaprédiction decompli-cationcardiaqueavant lachirurgievasculaire parscannerau dypiramidole-thalium[5].On constateunegrande variabilitédesvaleursdes indicesdeprécisions évaluéespardifféren- tesétudes.-Letestcorrélationnel :lamaladiecause lapositivitédu testderéférence etdunouveau testsanslien forcémentcausalentreces deuxtests[4].
Parexemple,Hlatky etal.ont montréquepour lediagnosticd'une coronaropathie,enfonc- tiondel'âge, dusexe,du stadedel'exercice atteint,dela sévéritéetde laduréedes symptômes,lasensibilité dudé-calagedusegment ST('1 mm)àl'électrocardiographie d'ef-fortcomparéeà lacoronarographique variaitentre41 et89%etlaspécificité variaitentre70 et100% [6].Cependant,mêmepour lesvraistests diagnostiques,lasta- bilitédela sensibilitéetde laspécificitésont théoriques.Lesmesuresserontvariables enfonctionde lapathologieet dutestderéférence utilisé,dela populationetde laquestioncliniqueposée,de laplacedu nouveautestdans ladémarche(enplusou enremplacementd'un autretest)et delanature dutest(quel appareil,quelletechnique, quelétalonnage)[7].
Lavariationde cesindicesmettrait endoutele rationneld'uti-lisationdestests enpratiqueclinique courantefondésur l'hy-pothèsedeBayes etlaconstance delavraisemblance d'untest.Néanmoins,cette variationesten grandepartiedue auxbiaisdesélection, d'interprétation,devérification maisaussiàl'imperfectiondu testderéférence [8-12].Unpeuplussurlavariabilitédesindices:lesseuilsEnplusdes élémentsquenous venonsdeciter, unepartde lavariationde laprécisiondes testsestdue auxdifférentsseuilsutiliséspar lesobservateurspour classerlespatients enpositifsou négatifs.Parexemple, lorsd'uneétude chez1168femmes enpost-ménopauseprésentant unehémorra-gievaginale,l'ultrasonograhie endovaginaleaété évaluéepourlediagnostic decancerde l'endomètreavantle cure-tagechirurgical[13].
Cetteétudea évaluélaprécision dedif-férentsseuilsde l'épaisseurdela tumeurpourdéfinir le369octobre2006MÉDECINECONCEPTSETOUTILSOutils95161L : 219.992- Type : pINT06-10-1711:42:26 - Folio : p33- H : 306.994- Couleur : BlackYellowMagentaCyanFigure1.Le nomogrammedeFagan.
Figure2.Courbe ROC(sensibilitéen fonctionde1-spécificité ouReceiverOperating Characteristic)d'évaluationde différentsseuilsd'épais- seurdela tumeurmesuréepar l'ultrasonograhieendovaginalecomparée àl'examenanatomo-pathologique aprèscuretage.cancer.Lafigure2montrequelorsque leseuilde positivitéeststrict(< 20mm),la spécificitéestimportante carlaplu- partdestumeurs degrandeépaisseur sontdescancers (fai-blenombrede fauxpositifs).En revanche,lasensibilité estfaiblecarun grandnombredes tumeursavecune épaisseur<20 mmclasséesentumeursnon cancéreusessontdesfauxnégatifs.Un seuilplussouple (<5mm) seraaucontraire plussensibleet moinsspécifique.La courbeReceiverOpe- ratingCharacteristic(ROC) permetainside tenircomptede l'effetseuilet delacorrélation négativeentrela sensibilitéetlaspécificité.
Ladéfinitiondu seuilseraeffectuée selonlecontexteclinique,pour privilégierl'unou l'autredeces deuxindicesouchoisir lemeilleurcouple entermede précision.Unepartde subjectivitéimportantepersiste lorsdela défi-nitiond'unseuil depositivité,d'où l'importanced'utiliserune courbeROCpour fixerceseuil etdescourbes ROCrésu-méespoursynthétiser lesrésultatsde plusieursétudes[14].
LeproblèmedutestderéférencePourévalueru ntest diagnostique,saprécision doitêtrecomparéeàu ntestde référence,l'"étalon-or»(" goldstan-dard»),qui détermineralamaladie defaçonfiable.
Cepen-dant,lestests deréférencene sontjamaisparfaits etentraî-nentdoncdes erreursdeclassification delamaladie.
Lesbiaiscauséspar ceserreursde classificationdépendentde laprévalencede lamaladiee tde lac orrélationentreles 370MÉDECINEoctobre2006CONCEPTSETOUTILSOutils95161L : 219.992- Type : pINT06-10-1711:42:26 - Folio : p34- H : 306.994- Couleur : BlackYellowMagentaCyanerreursdunouveau testetcelles dutestde référence.Leserreursdesdeux testssontindépendantes quandellesne surviennentpassur lesmêmespatients, etàl'inverse, sontcorréléeslorsqu'ellessurviennent chezlesmêmes patients.Quandlaprécision dutestde référenceetla relationentreleserreursdes deuxtestssont connues,cesbiais pourraientêtrecorrigés[15] maislesméthodes decorrectionavec leserreurscorréléesne sontpasencore développées.Malheu-reusement,laprécision dutestde référenceestsouvent in-connuecaril amalété évalué.Laprécision d'untest,ou robustesse,estsa capacitéàreproduire lemêmerésultat sionrépétaitle testchezun mêmepatient.Par exemple,letestderéférence pourlediagnostic dethromboseveineuse profondeestla phlébographiequiest invasive,douloureuse,etmoyennementfiable avecunfaible tauxdeconcordance entredeuxobservateurs (Kappavariantde 0,57à0,90) [16].Laprécisionde laphlébographien'a pasétéévaluée.
Nousreviendronsdans lasecondepartie decetarticle, dansleprochainnuméro deMédecine,sur lesdifférentsproblè- mesméthodologiquesque posel'évaluationdes testsdia-gnostiques.Références:1.ReidMC, LachsMS,Feinstein AR.Useof methodologicalstandardsin diagnostictestresearch.
Gettingbetterbut stillnotgood.Jama.1995;274(8):645-51.2.BuntinxF, KnottnerusJA.Are weatthe startofa newerain diagnosticresearch?J ClinEpidemiol.2006;59(4):325-6. 3.FaganTJ.
Letter:Nomogramfor Bayestheorem.N EnglJMed. 1975;293(5):257.4.ChoiBC.Causalmodelingto estimatesensitivityand specificityofa testwhenprevalence changes.Epidemiology.1997;8(1):80-6. 5.WongT, DetskyAS.Preoperative cardiacriskassessment forpatientshaving peripheralvascularsurgery.
AnnInternMed. 1992;116(9):743-53.6.HlatkyMA, PryorDB,Harrell FEJr,Califf RM,MarkDB, RosatiRA.Factors affectingsensitivityand specificityofexercise electrocardiography.Multivariableanalysis.Am JMed.1984;77(1):64-71.7.IrwigL, BossuytP,Glasziou P,GatsonisC, LijmerJ.Designing studiestoensure thatestimatesof testaccuracyare transferable.BMJ.2002;324(7 338):669-71.8.DiamondGA.
ReverendBayes'silent majority.Analternative factoraffectingsensitivity andspecificityof exerciseelectrocardiography.Am JCardiol.1986;57(13):1175-80.9.DiamondGA.
Affirmativeactions: canthediscriminant accuracyofa testbed