[PDF] Mesures dassociations et Tests statistiques





Previous PDF Next PDF



Cours 1 : La statistique et les statistiques

Être en mesure de faire la différence entre population et échantillon entre données brutes et statistiques (descriptive); de savoir quel type d'échelle a 



Statistiques descriptives (4 h) • Rappels de Probabilités (4 h

Elle est généralement retranscrite dans un tableau de données. Rq : La statistique traite des propriétés des population plus que des individus particuliers de 



Mesures dassociations et Tests statistiques

Tests statistiques. Rappels une différence entre proportions (moyennes). • qui soit ? à celle observée sur ... Deux types d'erreurs en statistique :.



Le guide du secret statistique de lINSEE

en matière de statistiques définit le secret statistique. À l'échelon européen 1-2 du code des relations entre le public et l'administration).



Cours de Statistiques inférentielles

Nous allons chercher à faire l'inverse : l'inférence statistique consiste à Remarque : lorsque n est grand la différence entre n et n?1 devient ...



STATISTIQUES

L'étendue est la différence entre la plus grande valeur et la plus petite valeur. Définition : L'écart interquartile d'une série statistique de premier ...



21 LINTERPRÉTATION DES RÉSULTATS STATISTIQUES Thierry

La statistique appliquée consiste à chercher de l'information dans des données comparer les salaires entre les hommes et les femmes on compare les ...



STATISTIQUE DESCRIPTIVE

L'étendue notée e



Résumé du Cours de Statistique Descriptive

15 déc. 2010 1 Variables données statistiques



Cours de Statistiques niveau L1-L2

7 mai 2018 déviations entre “vraies" valeurs et valeurs observées. la répartition statistique d'une variable au sein de la population est.



Cours 1 : La statistique et les statistiques

Cours 1 La statistique et les statistiques 3 pratiquement impossible d’éviter des erreurs de mesure Les statistiques permettent de passer outre le bruit (la variabilité) dans les mesures pour permettre d’énoncer des lois générales Section 3 Statistiques descriptives vs inductives



Inférence Statistique: Résumés et exercices

L’objectif de l’inférence statistiques est de tester la généralisabilité des conclusions de l’analyse statistique descriptive pour trois objectifs statistiques : a) Comparaison d’un groupe d’observation à une distribution connue b) Comparaison de deux groupes d’observations c) Évaluation de la liaison entre deux variables



Searches related to différence entre la statistique et les statistiques PDF

La fréquence s'exprime en et on la note f Exemple : Dans un collège de 450 élèves 110 élèves ont 3 frères et sœurs Calculer la fréquence du nombre d'élèves ayant 3 frères ou sœurs f = 110 450 ? 0244 ? 244 La fréquence du nombre d'élèves ayant 3 frères ou sœurs vaut donc 244 Exercice 3 Exercice 4

Quels sont les différents types de statistiques ?

Les statistiques inférentielles, en revanche, permettent aux scientifiques de prendre les résultats d'un échantillon et de les généraliser à une population plus large. Les deux types de statistiques présentent des différences importantes. Statistiques descriptives

Quelle est la différence entre les statistiques descriptives et inférentielle ?

Le domaine des statistiques est divisé en deux grandes divisions : descriptive et inférentielle. Chacun de ces segments est important, offrant différentes techniques qui accomplissent différents objectifs. Les statistiques descriptives décrivent ce qui se passe dans une populationou un ensemble de données.

Qu'est-ce que les statistiques descriptives ?

Statistiques descriptives Les statistiques descriptives sont le type de statistiques qui vient probablement à l'esprit de la plupart des gens lorsqu'ils entendent le mot « statistiques ». Dans cette branche de la statistique, le but est de décrire. Les mesures numériques sont utilisées pour indiquer les caractéristiques d'un ensemble de données.

Quels sont les éléments qui appartiennent à la partie des statistiques ?

Il existe un certain nombre d'éléments qui appartiennent à cette partie des statistiques, tels que : La moyenneou la mesure du centre d'un ensemble de données, consistant en la moyenne, la médiane, le mode ou le milieu de gamme La propagation d'un ensemble de données, qui peut être mesurée avec la plageou l'écart type

Mesures dassociations et Tests statistiques

Mesures d'associations

et

Tests statistiques

Rappels

Mesures d'association

• Objectif des études - Descriptif - Analytique recherche de facteurs associés à un événement clinique / caractéristique particulière • 2 principales mesures d'association - Risque Relatif étude de cohorte - Odds ratio / rapport de cotes • étude cas-témoin • voir étude transversale

Rappel : Risque Relatif

Malades Non malades

Exposés a b R1=a/(a+b)

Non exposés c d R0=c/(c+d)

RR=1 le facteur n'est pas lié à la maladie

RR< 1 le facteur est associé à une diminution du risque de maladie (facteur protecteur) RR> 1 le facteur est associé à une augmentation du risque de maladie (facteur de risque) Estimation possible dans le cadre de cohorte pas de contrôle de la proportion de malades et de non malades + suivi dans le temps

(R0) exposénon si maladie la développer de Risque(R1)facteur au exposé si maladie la développer de RisqueRR

Exemple

choriorétinite pas de choriorétinite

Autres lésions

Toxoplasmiques191635

Pas d'autres 60 232 292

Lésion

79 248 327

RR=(19/35)/(60/292)=2.64

Les enfants présentant d'autres signes de toxoplasmose congénitale à la naissance ont un risque multiplié par plus de

2.5 de développer une choriorétinite au cours de leurs

enfance que ceux n'ayant pas de lésions OR

Malades Non malades

Exposés a b

Non exposés c d

• Même interprétation que le RR • Bonne estimation du RR si la maladie est rare dans la population (prévalence faible) • Utilisé dans les études cas-témoins (contrôle de la proportion de malades/non malades estimation RR impossible) cbda RR RROR u u 0)01( )11(1

Exemple

toxoplasmose pas de (cas) toxoplasmose

Viande insuffisamment 44 15 59

cuite

Pas de consommation 36 65 101

de viande insuf. cuite

80 80 160

OR=(44x65)/(36x15)=5.3

Les femmes ayant consommé de la viande insuffisamment cuite sont plus fréquemment contaminées par le toxoplasma gondii que les femmes n'en ayant pas consommé

Autres mesures d'association

• Plus accessoire - Excès de risque •R=R1-R0 •Si R=0pas d'association entre exposition et maladie - Risque attribuable • Proportion de cas de maladie dans la population qui seraient évités si l'exposition au facteur était supprimée avec p, fréquence de l'exposition dans la population - Fraction étiologique du risque (RA chez les exposés) • FER=(RR-1)/RR

1)1()1(

u

RRpRRpRA

Mesures d'association

• 2 principales - Risque Relatif - Odds ratio / rapport de cotes • Question : association significative ?

Rôle des statistiques

Population générale

Population cible

Echantillon

Estimations, Intervalles de confiances, tests

Inférence statistique

À moduler suivant la

représentativité de l'échantillonGénéralisation si les caractéristiques de la population cible ne sont pas trop éloignées de celles de la population générale

Signification statistique

• 2 méthodes - Intervalle de confiance - Test

Intervalle de confiance

• Intervalle dans lequel la vraie valeur a une probabilité p de se situer

Exemple IC à 95%:

• La vraie valeur a 95% de chances d'être à l'intérieur de l'intervalle, • et 5% de chances d'être à l'extérieur (2,5% au dessus de la borne sup, 2,5% en dessous de la borne inf) •Deux règles - Plus la taille de l'échantillon est grande, plus l'IC est étroit - Plus le risque d'erreur alpha accepté est grand, plus l'IC est étroit

IC à 95%IC à 90%

5% 2.5%

5%2.5%

Intervalle de confiance

• RR ou OR - Si l'intervalle de confiance comprends 1 pas d'association entre l'exposition et l'événement étudié - Si l'intervalle de confiance ne comprends pas 1 association significative entre l'exposition et l'événement étudié -Exemple • RR de développer une choriorétinite en cas de calcification intracrânienne chez des enfants atteints de toxoplasmose congénitale : 2.61 (1.49- 4.59)

Tests statistiques

• Résultat sur un échantillon m1m2 • Quel serait le résultat sur la population cible? problème des fluctuations d'échantillonnage -Population m1 m2 Si tire 100 échantillons différents m1=m2 dans un certain nombre d'entre eux -Population m1=m2 Si tire 100 échantillons différents m1 m2 dans un certain nombre d'entre eux

Tests statistiques et risque

d'erreurs •Test statistique - consiste à rejeter ou non une certaine hypothèse (hypothèse nulle) qui concerne la population étudiée aux vues des résultats observés sur l'échantillon inférence à la population cible - En pratique, calcul de la probabilité p (p-value) d'observer sur un échantillon quelconque de même effectif • une différence entre proportions (moyennes)

• qui soit à celle observée sur l'échantillon d'étude du fait du hasard (pas de différence dans la

population cible)

Tests statistiques et risque

d'erreurs •Deux types d'erreurs en statistique : -: probabilité de conclure à une différence alors qu'elle n'existe pas -p < (en général, 5%): différence significative c-a-d la différence observée ne peut pas être due au hasard -p : différence non significative , mais on ne peut pas exclure que cette différence existe réellement -ǀ: probabilité de conclure qu'il n'y a pas de différence alors qu'elle existe réellement et paramètres sont fixés en début d'étude (éléments du calcul du nombre de sujets nécessaire)

Tests statistiques et risque d'erreurs

Réalité dans la population

Pas de

différence (H0)Différence (H1)

Conclusion

du test

Pas de

différence significativeConclusion vraie

1-Ĵ

Conclusion

fausse

Différence

significativeConclusion fausse

Conclusion vraie

1-ǀ

'Puissance'

En pratique

• Test de l'association entre la présence d'un nouveau marqueur et la survenue d'un IDM - Données • P1=proportion d'IDM chez les patients porteurs du marqueur • P2= proportion d'IDM chez les patients non porteurs -Hypothèses • Hypothèse nulle : P1=P2 • Hypothèse alternative : P1P2

En pratique

• Au risque de 5% fixé a priori - Résultat du test -P=0.002 : » on a moins de 2 chances pour 1000 de se tromper en considérant que les deux pourcentages diffèrent et qu'il existe une association. » La différence observée ne peut être due au hasard -P=0.15 test non significatif : on a 15% de chance de se tromper si on considère que les deux pourcentages diffèrent » Soit effectivement pas de différence dans la population » Soit manque de puissance : on ne peut pas mettre en évidence une différence alors qu'elle existe

En pratique

• p-value (p) = probabilité de rejeter à tort l'hypothèse nulle - Risque alpha de 5% fixé a priori - p-value calculée pour le test > 0.05 pas de rejet de H0 (test non significatif) - p-value calculée pour le test 0.05 rejet de H0 (test significatif)

Principaux tests

variables Qualitative Quantitative

Qualitative Chi-2 de Pearson

-CA :

Effectif théorique 5

-Alternative: * correction de Yates * test exact de Fisher >2 groupes : ANOVA -CA : *normalité de la variable quant. dans chaque groupe * homogénéité des variances- Alternative : Kruskal-

Wallis

Quantitative 2 groupes : test de Student

-CA : *normalité de la variable quant. dans chaque groupe * homogénéité des variances- Alternative : Mann-WhitneyCorrélation de Pearson / régression linéaire

CA: normalité

-Alternative: corrélation des rangs de Spearman

Principaux tests

• Mesures répétées chez les mêmes sujets - Comparaison de pourcentage test=chi2 de McNemar - Comparaison de moyennes test? • 2 groupes : test de Student apparié • >2 groupes : ANOVA pour mesures répétées • Non paramétrique : Wilcoxon - Concordance? • Variables qualitatives : coefficient Kappa • Variables quantitatives : coefficient de corrélation intraclasse

Analyse

multivariée/multivariable • Permet de tenir compte de facteurs de confusion - Facteur lié à l'exposition et à la maladie - Possible explication association entre exposition et maladie -Exemple : •1

ère

observation : association du stade du cancer et du risque de décès •2

ème

observation : indication ou non d'une chimiothérapie en fonction du stade du cancer • Si étude - de l'association entre chimiothérapie et risque de décès effet péjoratif de la chimio - Idem + prise en compte du stade dans l'analyse effet bénéfique

• Le stade est un facteur de confusion dans l'étude de la relation entre chimio et décès

Analyse multivariée

• Permet de tenir compte de facteurs de confusion ajustement+++ - =estimation de • l'effet proprede la variable d'intérêt sur le risque de survenue de l'événement étudié • indépendamment de l'impact des facteurs de confusion - Méthode : modèle multivarié/multivariable

Relation de type Y=+X

Y= décès/autre critère de jugement=variable à expliquer X= variables explicatives (chimio, stade, age, sexe,...)

Exemple: Y=f(+

1 chimio + 2 stade + 3 age+ 4 sexe) Les éléments qui suivent seront revus en MM1

Modèles possibles en fonction de

la variable à expliquer (Y) • Variable quantitative régression linéaire : Y =+X - Surtout étude transversale / biologique

Régression linéaire

•Exemple: effet d'un traitement et de l'âge sur le taux de lymphocytes CD4 chez des patients VIH+ - Variable à expliquer = CD4 - Variables explicatives: X1=traitement (X= 1 quand le patient reçoit le traitement et 0 dans le cas contraire) et X2=âge (en années)

Equation : CD4= +

1 X 1 2 X 2 -CA : CD4 distribution # normale -Exemple : •CD4= +X 1 + (-2) X 2 • Interprétation pour un patient de 30 ans - Âge : le taux de CD4 diminue de 2 cellules/mm3 pour chaque année d'âge supplémentaire - Traitement : le taux de CD4 est égal à 100 +200 -2x30=240 si le patient reçoit le traitement et à 100-2x30=40 sinon

Modèles possibles en fonction de

la variable à expliquer - Variable à expliquer = compte d'événement peu fréquent dans une population () régression de Poisson : log()=+X • Surtout - études d'incidence, de mortalité, en population - Études de cohortes

Régression de Poisson

• Interprétation : -log() augmente de chaque fois que X augmente d'une unité - Exemple : log()=0.0025 + 0.25( département X vs département de référence )+ 0.02 âge - 0.2(sexe) -Exp()=risque relatif • RR département X vs département de référence = exp(0.25)=1.28 l'incidence est 1.28 fois plus importante dans le dept X que dans le dept de référence • RR pour l'âge : pour chaque augmentation d'une année d'âge l'incidence est augmenté de : exp(0.02)=1.02, soit 2%

Modèles possibles en fonction de

la variable à expliquer

Y = Variable qualitative à deux classes

(dichotomique) régression logistique Y= proportion =P logit (Y)= log(P/(1-P))=+X avec exp()=OR • Exemple : réponse au traitement • Surtout utilisé dans - Études cas-témoin - Études transversales - Études pronostiques avec établissement d'un score

Modèles possibles en fonction de

la variable à expliquer - Délai de survenue d'un événement (décès, récidive, infection opportuniste)

Analyse de survie (time-to-event analysis)

• Application : - études de cohortes, études pronostiques, essais thérapeutiques - Très utile en cas de suivi inégal entre les sujets : » estimation des probabilités de survenue d'un événement à chaque temps » en tenant compte des individus restant encore à risque dans l'étude à ce temps là et de ce qui s'est passé au temps précédent •Univarié -courbes de Kaplan-Meierestimation de la probabilité de survenue de l'événement à un temps donné - Test du logrank comparaison des courbes

00.10.20.30.40.50.60.70.80.91

0 6 12 18 24 30 36 42 48

Arm A (Surgery)Arm B (Chemo-radiation)

Patients at risk :

Arm A (surgery) 129 108 79 51 31 25 23 17 13

Arm B 130 122 84 61 40 29 25 21 14

(chemo-radiation) ITT time (months)

Médiane du délai de survie

Probabilité de survie à 1 an dans le bras A=67% Probabilité de décès à 1 an dans le bras A=100-67%=33%

Modèles possibles en fonction de

la variable à expliquer • Délai de survenue d'un événement (décès, récidive, infection opportuniste) analyse de survie (time-to-event analysis) -Univarié-Multivarié • Modèles paramétriques : exponentiel, Weibull • Modèle semi-paramétrique des risques proportionnels = modèle de Cox•estimation du RR=exp()

En résumé

• Analyse multivariée estimation de • l'effet proprede la variable d'intérêt X sur le risque de survenue de l'événement étudié Y • indépendamment de l'impact des facteurs de confusion

Choix du modèle dépend de la nature de Y• Y=Variable quantitative régression linéaire

• Y=Taux (incidence)régression de Poisson (RR) • Y= Variable dichotomique (0/1) régression logistique (OR) • Y=Délai de survenue d'un événement analyse de survie / modèle de Cox (RR) On obtient des mesures d'association (RR ou OR) ajustées, mais l'interprétation finale dépend de l'intervalle de confiance de ces mesuresquotesdbs_dbs28.pdfusesText_34
[PDF] objectif de la statistique

[PDF] type d'action de formation (article l.6313-1 du code du travail)

[PDF] traitement comptable rachat d'actions

[PDF] typologie des actions de formation professionnelle continue

[PDF] action ordinaire vs action privilégiées

[PDF] statut juridique association ? but non lucratif

[PDF] association culturelle

[PDF] association déclarée but lucratif

[PDF] association d'utilité publique

[PDF] différentes associations humanitaires

[PDF] 6068 autres matières et fournitures

[PDF] fournitures consommables définition

[PDF] matières consommables exemple

[PDF] compte comptable entretien vetement de travail

[PDF] catégories dépenses budget