Habituellement, il y a une plus grande variabilité entre les vraies J'ai des données dans un graphique Comment choisir quel test faire pour obtenir une dichotomique (présenter sa véritable valeur numérique, pas juste sig, ns, p
Previous PDF | Next PDF |
[PDF] Comment analyser et choisir un manuel de lecture pour le CP
Comment analyser et choisir Or, la construction par le professeur de sa interroge aussi la façon dont l'élève entre dans le savoir et la culture pour cette
[PDF] Comment analyser et choisir un manuel de lecture pour le CP
Comment analyser et choisir Or, la construction par le professeur de sa interroge aussi la façon dont l'élève entre dans le savoir et la culture pour cette
ORTHOGRAPHE- Homophones grammaticaux son/sont on/ont
Comment choisir entre son/sont ? → «Son » est toujours suivi d'un nom singulier Il veut dire « le sien » On peut le remplacer par « mon » Exemple : « C'est
[PDF] Comment choisir sa - sitEColes
La rédaction d'un guide pour choisir sa plateforme LMS entre pleinement dans notre activité d'information Avec ce guide, nous souhaitons faciliter le choix
[PDF] Comment choisir entre un PPS, un PAP, un PPRE ou un PAI ?
assure le suivi de la mise en œuvre du PPS afin de veiller à sa continuité et à sa cohérence Il est l'interlocuteur privilégié des parents Il réunit et anime les ESS Il
[PDF] Comment choisir entre lANOVA à 1 facteur (1-way), lANOVA à 2
Habituellement, il y a une plus grande variabilité entre les vraies J'ai des données dans un graphique Comment choisir quel test faire pour obtenir une dichotomique (présenter sa véritable valeur numérique, pas juste sig, ns, p
[PDF] HANDBALL - Académie Dijon EPS
Ressentir l'accompagnement de la balle avec sa main Apprécier que Choisir entre « je vais ou je donne » + se démarquer efficacement Description La règle de la touche permet de savoir quand le ballon sort et comment remettre en jeu
[PDF] Comment choisir entre Un PPS, un PAP, un PPRE, ou un PAI
Maison Départementale des Personnes Handicapées) Selon sa sévérité, la dyslexie peut être reconnue comme handicap par la CDA selon ce guide barème
[PDF] Chapitre 3 Etude de la liaison entre deux variables Analyse
Comment détecter une corrélation, quelle en est la forme, le sens (les sur l' échantillon est un résumé des données permettant de choisir entre H0 et H1 Exemple 1 : Sa valeur observée sur l'échantillon tiré au sort est r(x, y)=0,6071
[PDF] GUIDE DEs FormalItés aDmInIstratIvEs poUr créEr votre - CRI
la loi marocaine donne la possibilité de choisir entre plusieurs formes juridiques pour votre entreprise : sA personne physique personne morale (société) Association de fait CommeNt ChoiSiR uN Nom CommeRCiAL ou uNe eNSeigNe ?
[PDF] Comment choisir entre « ces » / « ses » / « c’est » / « s’est » / « sait » ?
[PDF] Comment choisir entre « dont » / « donc » / « d’on » ?
[PDF] Comment choisir entre « la » et « là » ?
[PDF] Comment choisir entre « ni » et « n’y » ?
[PDF] Comment choisir entre « ou » et « où » ?
[PDF] Comment choisir entre « peux » / « peut » / « peu » ?
[PDF] Comment choisir entre « quel(le)s » / « qu’elle(s) » ?
[PDF] Comment choisir entre « son » et « sont » ?
[PDF] Comment composer un mot
[PDF] Comment construire un tableau descriptif de l’évolution du système au cours de la transformation ?
[PDF] Comment décrire une image ?
[PDF] Comment dériver un mot
[PDF] Comment déterminer une quantité de matière (n) en connaissant la masse (m) et la masse molaire (M) ?
[PDF] Comment écrire un court récit
Statistiques pour biologistes
Atelier de formation 25 mai 2017
Journée de la recherche du CHU de Québec Université LavalAnne-Sophie Julien
Plateforme de recherche clinique
Plateformede rechercheclinique
Services offerts
Méthodologieet biostatistique(58$/heure)
Conception et préparationdu projetde recherche(question de recherche, choixdes paramètres, devis, rédactionprotocole, questionnaire) Gestiondes données(grille de collecte, codification, saisie, validation) Biostatistiques(protocole, design expérimental, calculde tailled'échantillon, randomisation, analyses statistiques, interprétation, rédaction& révisionarticle) Ateliers de formation (gratuitspour les membresdu CRCHU)01 Conception projetde recherche, 02 analyses statistiquesde base, 03 calculde taille
d'échantillon, 04 créationd'unebanquede donnéesExcel, 05 étapesadministratives, 06 BPC & MON, Budget de recherche, 10 développementde questionnaire et instrument, 11 études diagnostiques, 07 score de propension, 09 validation de modèlesparamétriques, 08+12à15 introduction à SPSS, R et SAS, analyses statistiquesavec SPSS, R et SAS Atelier 09 -Validation de modèlesparamétriquesSuite de l'atelierd'aujourd'hui
Date: 8 juin14h-16h
Lieu: CHUL, local H00-329
Contenu
Résidus
Postulatsfréquents
Validation ANOVA, régressionlinéaire& régressionlogistiqueInscription sur:
http://rce.crchudequebec.ulaval.ca/Question 1
Je ne sais pas si je doisfaire un test
unidirectionnel ou bidirectionnel.Univs Bi latéral
Exemples: comparaison de moyennes et test de corrélationTest unidirectionnel -> unilatéral (1 tail)
H0: Moyenne<= Moyenne2 / Corrélation<=0.30
H1: Moyenne1 > Moyenne2 / Corrélation>0.30
Test bidirectionnel-> bilatéral(2 tails)
H0: Moyenne1 = Moyenne2 / Corrélation= 0
H1: Moyenne1 т Moyenne2 / Corrélationт 0
Question 2
P>0.05
Puis-je conclure que les deux groupes sont égaux?Tests de supérioritéet d'ĠgalitĠ
Test de supériorité (ou différence)
H0: Moyenne1 = Moyenne2
H1: Moyenne1 т Moyenne2
-> On rejetteounon H0, maison ne l'acceptepas.Test d'ĠgalitĠ
H0͗ Moyenne1 тMoyenne2
H1: Moyenne1 =Moyenne2
-> EnrejetantH0, on peutconclureà l'ĠgalitĠ.Test de non-infériorité
Question 3
Quelle est la différence entre SD et SEM?
Et lequel est le mieux pour publier?
Mesure de localisation
Moyenne
Médiane
Mesures de dispersion associées à la moyenne Variance :une mesure de dispersion des données autour de la moyenne Écart-type :racine carré de la variance = ʍStatistiquesdescriptivespour variables continues
Source: Wikipédia
Histogrammed'une
loinormaleMesuresde dispersion
Écart-type (Standard Deviation)
Indicateurde la variabilitédes données
Présentédansles statistiquesdescriptives
Erreur-Type (Standard Error of the mean)
Écart-type divisépar la racinecarréede N
Mesurel'incertitudeassociéeà l'estimationde la moyennePrésentéedansles résultatsd'analyses
Référence: Nagele, P. (2001). Misuse of standard error of the mean (SEM) when reporting variability of a
sample. A critical evaluation of four anaesthesia journals. British Journal of Anaesthesia, 90 (4): 514-16.
Question 4
Comment définir le n?
J'ai un puit, mais un qPCRen triplicata.
J'ai une souris, mais 2 PCR
Unité expérimentale
Le traitement y est appliqué
Indépendantes
Unité échantillonnale
Les mesures y sont prises
Dépendantes
Exemple 1: Le plasma du patient 001 est stimulé par le produit X. On mesure la concentration d'une certaine protĠine. L'unitĠ échantillonnaleest la même que l'unitĠ edžpĠrimentale, le plasma du patient 001.
Types d'unitĠs
alors ces dernières sont considérées comme des répétitions du traitement.Chaquerépétitionestindépendante
présente pour plusieurs individus. Permetd'estimerl'erreurexpérimentale. Sans réplication, on ne peutfaire de tests (saufpour certainsdispositifsparticuliers)Répétitions
Chaque unité échantillonnalen'est pas indĠpendante.Modélisation
par unité expérimentale -> données indépendantes obtenues -> modèles2.Utiliser toutes les pseudos-répétitions, mais en tenant compte de leur
dépendance dans le modèle. -х pas de perte d'information, mais modğles statistiques plus complexesPseudos-répétitions
Habituellement, il y a une plus grande variabilité entre les vraies répétitions que les pseudos-répétitions. Dans le cas contraire, le nombre d'unitĠs échantillonnalespeut être augmenté pour mieux modéliser cette variabilité. Autrement, si on doit augmenter la taille d'Ġchantillon, on augmente le nombre de répétitions (unités expérimentales).Répétitionsvs pseudo-répétitions
Question 5
choisir quel test faire pour obtenir une valeur p? Choixd'analysePlusieursfacteursà considérer:L'objectif
La nature de la variable indépendante(les facteursprédictifs)Le design expérimental
Le type de données
Non corrélées(répétitionsseulement)
Corrélées(présencede pseudos-répétitionsoudonnéespairées, appariées)Le nombrede variables
Univariée(1 variable: distribution, descriptif)Bivariée(2 variables: association)
Multivariée(>2 variables: association): plusieursfacteurs, sélection, confusionSéried'analyses1
TestsV DépendanteVindépendante(s)Type de donnéesType d'analyse Test TContinueDichotomiqueNon corréléesBivariée Test T PairéContinueDichotomiqueCorréléesBivariée ANOVA (à 1 facteur)ContinueQualitative (inter)Non corréléesBivariée ANOVA (à 2 facteurs)Continue2 qualitatives(inter)Non corréléesMultivariéANOVA à mesures
répétées(à 1 facteur)ContinueQualitative (Facteurintra)CorréléesBivariéeANOVAà mesures
répétées(à 2 facteurs)Continue2 qualitatives
(1 inter + 1 intra ou2 intra)CorréléesMultivarié
Pour comparer des groupes(moyennes) avec uneVD continuePour voirl'effetde facteurssur uneVD continue
Séried'analyses2
TestsVariable
dépendanteVariable
indépendanteType de donnéesType d'analyse WilcoxonContinueDichotomiqueNon corréléesBivariéeWilcoxon Rangs
signésKruskall-WallisContinueQualitative
(1 facteurinter)Non corréléesBivariée
FriedmanContinueQualitative
(1facteurintra)CorréléesBivariée
Pour comparer des groupes(distributions) avec uneVD continuePour voirl'effetd'un facteursur uneVD continue
-> Normaliténon respectéeQuestion 6
Je veux comparer la moyenne de deux groupes,
mais j'ai un petit Ġchantillon. Est-ce que je peux utiliser le test de Wilcoxon?Les postulatsdu test T ne sontpas respectés,
doncje peuxfaire un test de Wilcoxon?Wilcoxonn'est pas toujours la solution
Objectifsdistincts2distributions avec mêmeforme, homogénéitédes variances -> test d'ĠgalitĠdes médianes2 distributions avec différentesformes, hétéroscédasticité-> test de dominance stochastique
Variables continuesValableaussipour Kruskall-Wallis (k>2)Petit échantillon, Wilcoxon pas mieuxTest de Wilcoxon
Comment choisir entre l'ANOVA à 1 facteur (1-way), l'ANOVA à 2 facteurs (2-ways) ou les comparaisons multiples?
On m'a dĠjă dit que lorsque le P de l'ANOVA était significatif, on pouvait ensuite procéder sans contrainte à des test de studentpar paires de groupes. Est-ce vrai ?
Comment choisir le post-testd'une ANOVA͍
Question 7
Réponse7
ANOVA à 1 facteur
VD = continue, VI = 1 facteur, variable qualitative (groupes) Objectif: Différencede moyennesentre les groupes?ANOVA à 2 facteurs
VD = continue, VIs = 2 facteurs, variables qualitatives(groupes) Objectifs: Différencede moyennesentre les groupes? Y-a-t-ilun effetdu facteur1?Du facteur2? Uneinteraction entre les 2?
Comparaisonsmultiples
Si un test global d'ANOVAestsignificatif(ieilexisteunedifférencede moyennes), où se trouvela différence Plusieurstests effectués, augmentele risqued'erreurde Type IAjustement/correction à effectuer
Exemple
On mesurele VO2Max de plusieurspatients, puison les diviseentroisgroupesselon leurIMC. On désiresavoir sile VO2Max estaffectépar la tranche d'IMCdu patient.P = 0,0016: Le VO2Max diffèrepour au
moinsun des trois groupesau seuilde 5%.Le groupe͞Surpoids" a un VO2Max
significativementinférieuraux deuxautres. ANOVAComparaisonmultiples
Si test global d'ANOVASIG -> comparaisonsmultiples par pairepour identifier entre quelsgroupesily a des différencessignificatives Corrections / ajustement: le seuilcombinédoitresterprèsde 5% Alpha combiné= 1 -( 1 -alpha_par_comparaison))^k, avec k comparaisonsQuelqueschoixd'ajustement
-Exploratoire; aucunajustement͗ Fisher's LSD -Traitementsvs contrôle: Dunnett -Donnéesbalancées: Tukey -Faiblenombre, planifiées: Bonferroni -Snooping, grand nombre, non planifiées: Scheffe -Génétique, trèsgrand nombre: Benjaminiand HochbergRéférence:
Milliken, G.A. and D.E. Johnson (2009).
Analysis of Messy Data Volume 1:
Designed Experiments, 2ndedition.
Chapman and Hall/CRC. 674 pages.
Question 8
Un test ANOVA dans Prismme confirme que les moyennes entre les groupes sont différentes (Are meanssignif. different? P<0.05). Par contre les post-testTukeyou Bonferronine me donne pas de différence significative entre tous les groupes.
Le test Newman-Keulsy parvient cependant. De même, si je fais un test de studententre les deux groupes problématiques en ANOVA, la différence est significative.
Dans mes données la variance est très grande (la déviation standard est plus grande que la moyenne).
Que faire dans une telle situation ?
Réponse8
Possibilitéde variables influentessivariance énorme Postulats de l'ANOVA respectés (normalité & hétérogénéité)?Si test global NS, pas de comparaisons multiples
Si test global SIG, comparaisons multiples
Sans correction = test T, probablement une significative Avec correction, pourraient toutes être NS si test global près de 5% Bonferroni, particulièrementconservateursi# comparaisonsélevé Newman-Keuls, similaireà Tukey, maismoinsconservateur(donc+ de résultatsSIG)Question 9
Outre augmenter le nombre d'échantillons analysés y-a-t'il d'autres moyens de parvenir à des différences significatives, exemple faire les analyses statistiques sur les données transformées en logarithme ? Si oui, comment justifie t'on ce type de transformation ?Réponse9
Puissance ј si N ј ,ǀariance љ ou effet / diffĠrence ј Modèle correctement spécifié, test plus puissantValidation de postulats
Transformation de Box-Cox pour Y
Exemple: concentrations -> log
Aussi: racine carrée, inverse, au carré, etc. Utile avec problèmes de normalité des résidusInterprétation commune
Validation de modèlesparamétriques
Postulats
Hypothèsesdu modèle
doiventêtrerespectésDépendentdu modèle
Normalitédes résidus
Homoscédasticitédes
résidus(variances égales)Linéarité
Indépendance(absence
d'auto-corrélation)Sources de biais
Valeursinfluentes
Multicolinéarité
Donnéesmanquantes
Pouvoirprédictifdu
modèlePouvoirexplicatifdes
variables explicativesValidation des prédictions
Validation croisée
Sans validation, la
conclusion d'une analyse pourraitêtreerronnée!
Résidus
Résidu ordinaire: ݁ൌܻെܻOùܻ= valeurobservéeet ܻ
Bon modèle: Résidustousprèsde 0
Résidustudentisé: ݁divisépar son écart-type Ramèneles résidussuruneéchelleconnue: scores ZNormalitédes résidus
Les modèlessupposentqueles résidussuiventunedistribution normalede moyenne0 et de variance ߪ Analyses robustesà unelégèredéviationde la normalitéRésultatsextrêmesmoinsaffectés
Grand kurtosis ї conservateur
Test T, ANOVA, Régressionlinéaire, Modèlelinéairemixte Validation graphique, par des statistiquesoudes testsHomogénéitédes variances
Les modèlessupposentqueles résidussuiventunedistribution normalede moyenne0 et de variance ߪ Lorsquela variance des résidusdiffèreselonles groupesoula valeur de Y, ily a hétéroscédasticité Test T, ANOVA, Régressionlinéaire& logistiqueValidation graphiqueoupar des tests
Linéarité
Le modèlede régressionlogistiquesuppose unerelation linéaireentre le logit de la probabilitéde succès(ʋ) et la VI
Si la relation n'estpas linéaire, le modèlene sera pas un bon indicateurde la relation Vérificationgraphiqueoupar test d'ajoutde termesde degréssupérieursNon corrélationdes résidus
Les modèlessupposentqueles résidusne sontpas corrélés: ܥ Lorsquecen'estpas le cas, ily a auto-corrélation, oudépendanceentre les observationsSupposéepour les principalesanalyses statistiques, saufles analyses pour donnéespairées(Mc Nemar, T Pairé, Wilcoxon rangssignés) et les modèlesmixtesouà effetsaléatoires
Vérificationgraphiqueoupar test
Valeursinfluentes
Valeuraberrante
Observations ayantune
combinaisonde valeurs (VI, VD) trèsdifférentedu restedes observations -> impact légerLevier
Observation ayant
unevaleurde VI loin de la moyennedes VI -> impact légerValeur influente
Observation avec levier
et valeur VD différente des autres avec même VI -> impact sur paramètres estimés et prédictionQuestion 10
Quel test doit-on effectuer pour justifier l'edžclusion de points singuliers? Dans quel contexte est-il acceptable d'edžclure une ǀaleur ͨaberrante»? Par exemple, certains réplicatsdonnant une valeur dĠpassant d'au moins 2 fois l'Ġcart type par rapport aux valeurs restantes. On voudrait pouvoir justifier leur exclusion afin de diminuer les écarts et pouvoir obtenir une significativité.Attention, "pour obtenirunesignificativité"
Distribution seulede la variable, pas suffisammentd'informationsGroupessous-jacents?
Population cible?
Postulatsvalidés?
Distribution normale, 95% entre +/-2 écarts-typesRéponse10
Source: Wikipédia
Valeursinfluentes
Corrigerla valeurs'ils'agitd'erreurde saisie
Supprimerl'obserǀationsiellene fait pas partiede la population cible Analyse de sensibilité(avec et sans l'obserǀation) siellefait partie de la population cibleQuestions 11
Quelles statistiques sont à utiliser avec les cultures cellulaires et un faible d'échantillon par groupe (triplicata)? Comment répartir les échantillons par plaque?
Quel test statistique utiliser pour comparer des traitements si on teste 2 molécules différentes à 3 doses en combinaison les unes avec les autres?Comment préparer l'expérience sur les animaux et quels tests sont à considérer pour analyser les effets de plusieurs traitements en prenant en compte le sexe d'animaux et le background génétique différent (wildtype, KO).
Blocage
unitĠs homogğnes ă l'intĠrieur de chacun.Restriction à la randomisation
alĠatoirement dans l'ensemble du dispositif. Les traitements sont donc soumis à différentes conditions de façon équivalente.Exemple:
Besoinde plusieursplaques pour uneexpérience
Conditions pourraientvarierd'uneplaque à l'autre S'assurerd'aǀoirtousles croisementspossiblesdanschaqueplaque pour contrôlerceproblèmeStructure des traitements
Facteurs croisés ou emboités
Effets fixes ou aléatoires
Mesures uniques ou répétées
Structure de randomisation
Références:
Montgomery, D.C. (2013). Design and Analysis of Experiments, 8thedition.Wiley. 752 pages.
Structure d'edžpĠrience
Effet fixe
Ces modalités ne pourraient pas être remplacĠes par d'autres sans changer l'objectif de recherche.
Effet aléatoire
Les modalitĠs utilisĠes pour l'effet alĠatoire sont un Ġchantillon de toutes celles disponibles.
On ne désire pas comparer les modalités entre elles. On veut que les conclusions soient généralisables à leur population complète. Les modalitĠs utilisĠes pourraient donc trğs bien ġtre remplacĠ par d'autres.Types d'effets
Famillede modèlesstatistiques
Estimation d'effetsfixes et aléatoires
Pour estimerl'ANOVAà mesuresrépétées, avec facteursintra seulementou intra+inter, l'ANOVAà effetsaléatoires, les devistelsque split plot, PBAC, etc.Interaction entre tousles effets
Permetde tenircomptede la dépendanceentre les observations (pseudos répétitions) oude contrôlerpour des effetsaléatoires(blocs)Trèsflexible
Modèleslinéairesmixtes
Réponse11
Selonle design expérimental, analyse statistiquedifférenteArbredu design aide grandement
Ordredanslequelles choses sontfaites
Facteursemboités/ Croisés
Facteursfixes / aléatoires
Modèleslinéairesmixtessuppose VD continue
Postulatsà valider
Ajoutdu sexeet background génétique
Facteursfixes oualéatoires?
Oùles ajouterdansl'arbre?
Design 1
Plan factorielà 2 facteurscroisés
Unitéexpérimentale= unitééchantillonnale= souris -> ANOVA à 2 facteurs(inter / fixes)Molécule(F)AB
Dose (F)
123161718Souris (D*M)
(A) = Erreur123123
Design 2
Plan à blocs aléatoirescomplets(PBAC)
Unitéexpérimentale= unitééchantillonnale= échantillonde souris -> ANOVA à mesuresrépétéesà 2 facteurs(intra / fixes) -> ModèlelinéairemixteSouris (A)123
Molécule(F)
123Dose (F)
AB ABAB 123123