[PDF] Comment choisir entre lANOVA à 1 facteur (1-way), lANOVA à 2 PDF Statistiques_en_recherche

Habituellement, il y a une plus grande variabilité entre les vraies J'ai des données dans un graphique Comment choisir quel test faire pour obtenir une dichotomique (présenter sa véritable valeur numérique, pas juste sig, ns, p

Comment analyser et choisir Or, la construction par le professeur de sa interroge aussi la façon dont l'élève entre dans le savoir et la culture pour cette

[PDF] Comment analyser et choisir un manuel de lecture pour le CP

Comment analyser et choisir Or, la construction par le professeur de sa interroge aussi la façon dont l'élève entre dans le savoir et la culture pour cette

ORTHOGRAPHE- Homophones grammaticaux son/sont on/ont

Comment choisir entre son/sont ? → «Son » est toujours suivi d'un nom singulier Il veut dire « le sien » On peut le remplacer par « mon » Exemple : « C'est

[PDF] Comment choisir sa - sitEColes

La rédaction d'un guide pour choisir sa plateforme LMS entre pleinement dans notre activité d'information Avec ce guide, nous souhaitons faciliter le choix

[PDF] Comment choisir entre un PPS, un PAP, un PPRE ou un PAI ?

assure le suivi de la mise en œuvre du PPS afin de veiller à sa continuité et à sa cohérence Il est l'interlocuteur privilégié des parents Il réunit et anime les ESS Il

[PDF] Comment choisir entre lANOVA à 1 facteur (1-way), lANOVA à 2

[PDF] HANDBALL - Académie Dijon EPS

Ressentir l'accompagnement de la balle avec sa main Apprécier que Choisir entre « je vais ou je donne » + se démarquer efficacement Description La règle de la touche permet de savoir quand le ballon sort et comment remettre en jeu

[PDF] Comment choisir entre Un PPS, un PAP, un PPRE, ou un PAI

Maison Départementale des Personnes Handicapées) Selon sa sévérité, la dyslexie peut être reconnue comme handicap par la CDA selon ce guide barème

[PDF] Chapitre 3 Etude de la liaison entre deux variables Analyse

Comment détecter une corrélation, quelle en est la forme, le sens (les sur l' échantillon est un résumé des données permettant de choisir entre H0 et H1 Exemple 1 : Sa valeur observée sur l'échantillon tiré au sort est r(x, y)=0,6071

[PDF] GUIDE DEs FormalItés aDmInIstratIvEs poUr créEr votre - CRI

la loi marocaine donne la possibilité de choisir entre plusieurs formes juridiques pour votre entreprise : sA personne physique personne morale (société) Association de fait CommeNt ChoiSiR uN Nom CommeRCiAL ou uNe eNSeigNe ?

Statistiques pour biologistes

Atelier de formation 25 mai 2017

Journée de la recherche du CHU de Québec Université Laval

Anne-Sophie Julien

Plateforme de recherche clinique

Plateformede rechercheclinique

Services offerts

Méthodologieet biostatistique(58$/heure)

Conception et préparationdu projetde recherche(question de recherche, choixdes paramètres, devis, rédactionprotocole, questionnaire) Gestiondes données(grille de collecte, codification, saisie, validation) Biostatistiques(protocole, design expérimental, calculde tailled'échantillon, randomisation, analyses statistiques, interprétation, rédaction& révisionarticle) Ateliers de formation (gratuitspour les membresdu CRCHU)

01 Conception projetde recherche, 02 analyses statistiquesde base, 03 calculde taille

d'échantillon, 04 créationd'unebanquede donnéesExcel, 05 étapesadministratives, 06 BPC & MON, Budget de recherche, 10 développementde questionnaire et instrument, 11 études diagnostiques, 07 score de propension, 09 validation de modèlesparamétriques, 08+12à15 introduction à SPSS, R et SAS, analyses statistiquesavec SPSS, R et SAS Atelier 09 -Validation de modèlesparamétriques

Suite de l'atelierd'aujourd'hui

Date: 8 juin14h-16h

Lieu: CHUL, local H00-329

Contenu

Résidus

Postulatsfréquents

Validation ANOVA, régressionlinéaire& régressionlogistique

Inscription sur:

http://rce.crchudequebec.ulaval.ca/

Question 1

Je ne sais pas si je doisfaire un test

unidirectionnel ou bidirectionnel.

Univs Bi latéral

Exemples: comparaison de moyennes et test de corrélation

Test unidirectionnel -> unilatéral (1 tail)

H0: Moyenne<= Moyenne2 / Corrélation<=0.30

H1: Moyenne1 > Moyenne2 / Corrélation>0.30

Test bidirectionnel-> bilatéral(2 tails)

H0: Moyenne1 = Moyenne2 / Corrélation= 0

H1: Moyenne1 т Moyenne2 / Corrélationт 0

Question 2

P>0.05

Puis-je conclure que les deux groupes sont égaux?

Tests de supérioritéet d'ĠgalitĠ

Test de supériorité (ou différence)

H0: Moyenne1 = Moyenne2

H1: Moyenne1 т Moyenne2

-> On rejetteounon H0, maison ne l'acceptepas.

Test d'ĠgalitĠ

H0͗ Moyenne1 тMoyenne2

H1: Moyenne1 =Moyenne2

-> EnrejetantH0, on peutconclureà l'ĠgalitĠ.

Test de non-infériorité

Question 3

Quelle est la différence entre SD et SEM?

Et lequel est le mieux pour publier?

Mesure de localisation

Moyenne

Médiane

Mesures de dispersion associées à la moyenne Variance :une mesure de dispersion des données autour de la moyenne Écart-type :racine carré de la variance = ʍ

Statistiquesdescriptivespour variables continues

Source: Wikipédia

Histogrammed'une

loinormale

Mesuresde dispersion

Écart-type (Standard Deviation)

Indicateurde la variabilitédes données

Présentédansles statistiquesdescriptives

Erreur-Type (Standard Error of the mean)

Écart-type divisépar la racinecarréede N

Mesurel'incertitudeassociéeà l'estimationde la moyenne

Présentéedansles résultatsd'analyses

Référence: Nagele, P. (2001). Misuse of standard error of the mean (SEM) when reporting variability of a

sample. A critical evaluation of four anaesthesia journals. British Journal of Anaesthesia, 90 (4): 514-16.

Question 4

Comment définir le n?

J'ai un puit, mais un qPCRen triplicata.

J'ai une souris, mais 2 PCR

Unité expérimentale

Le traitement y est appliqué

Indépendantes

Unité échantillonnale

Les mesures y sont prises

Dépendantes

Exemple 1: Le plasma du patient 001 est stimulé par le produit X. On mesure la concentration d'une certaine protĠine. L'unitĠ échantillonnaleest la même que l'unitĠ eǆpĠrimentale, le plasma du patient 001.

Types d'unitĠs

alors ces dernières sont considérées comme des répétitions du traitement.

Chaquerépétitionestindépendante

présente pour plusieurs individus. Permetd'estimerl'erreurexpérimentale. Sans réplication, on ne peutfaire de tests (saufpour certainsdispositifsparticuliers)

Répétitions

Chaque unité échantillonnalen'est pas indĠpendante.

Modélisation

par unité expérimentale -> données indépendantes obtenues -> modèles

2.Utiliser toutes les pseudos-répétitions, mais en tenant compte de leur

dépendance dans le modèle. -х pas de perte d'information, mais modğles statistiques plus complexes

Pseudos-répétitions

Habituellement, il y a une plus grande variabilité entre les vraies répétitions que les pseudos-répétitions. Dans le cas contraire, le nombre d'unitĠs échantillonnalespeut être augmenté pour mieux modéliser cette variabilité. Autrement, si on doit augmenter la taille d'Ġchantillon, on augmente le nombre de répétitions (unités expérimentales).

Répétitionsvs pseudo-répétitions

Question 5

choisir quel test faire pour obtenir une valeur p? Choixd'analysePlusieursfacteursà considérer:

L'objectif

La nature de la variable indépendante(les facteursprédictifs)

Le design expérimental

Le type de données

Non corrélées(répétitionsseulement)

Corrélées(présencede pseudos-répétitionsoudonnéespairées, appariées)

Le nombrede variables

Univariée(1 variable: distribution, descriptif)

Bivariée(2 variables: association)

Multivariée(>2 variables: association): plusieursfacteurs, sélection, confusion

Séried'analyses1

TestsV DépendanteVindépendante(s)Type de donnéesType d'analyse Test TContinueDichotomiqueNon corréléesBivariée Test T PairéContinueDichotomiqueCorréléesBivariée ANOVA (à 1 facteur)ContinueQualitative (inter)Non corréléesBivariée ANOVA (à 2 facteurs)Continue2 qualitatives(inter)Non corréléesMultivarié

ANOVA à mesures

répétées(à 1 facteur)ContinueQualitative (Facteurintra)CorréléesBivariée

ANOVAà mesures

répétées(à 2 facteurs)Continue

2 qualitatives

(1 inter + 1 intra ou2 intra)

CorréléesMultivarié

Pour comparer des groupes(moyennes) avec uneVD continue

Pour voirl'effetde facteurssur uneVD continue

Séried'analyses2

TestsVariable

dépendante

Variable

indépendanteType de donnéesType d'analyse WilcoxonContinueDichotomiqueNon corréléesBivariée

Wilcoxon Rangs

signés

Kruskall-WallisContinueQualitative

(1 facteurinter)

Non corréléesBivariée

FriedmanContinueQualitative

(1facteurintra)

CorréléesBivariée

Pour comparer des groupes(distributions) avec uneVD continue

Pour voirl'effetd'un facteursur uneVD continue

-> Normaliténon respectée

Question 6

Je veux comparer la moyenne de deux groupes,

mais j'ai un petit Ġchantillon. Est-ce que je peux utiliser le test de Wilcoxon?

Les postulatsdu test T ne sontpas respectés,

doncje peuxfaire un test de Wilcoxon?

Wilcoxonn'est pas toujours la solution

Objectifsdistincts2distributions avec mêmeforme, homogénéitédes variances -> test d'ĠgalitĠdes médianes2 distributions avec différentesformes, hétéroscédasticité-> test de dominance stochastique

Variables continuesValableaussipour Kruskall-Wallis (k>2)Petit échantillon, Wilcoxon pas mieux

Test de Wilcoxon

Comment choisir entre l'ANOVA à 1 facteur (1-way), l'ANOVA à 2 facteurs (2-ways) ou les comparaisons multiples?

On m'a dĠjă dit que lorsque le P de l'ANOVA était significatif, on pouvait ensuite procéder sans contrainte à des test de studentpar paires de groupes. Est-ce vrai ?

Comment choisir le post-testd'une ANOVA͍

Question 7

Réponse7

ANOVA à 1 facteur

VD = continue, VI = 1 facteur, variable qualitative (groupes) Objectif: Différencede moyennesentre les groupes?

ANOVA à 2 facteurs

VD = continue, VIs = 2 facteurs, variables qualitatives(groupes) Objectifs: Différencede moyennesentre les groupes? Y-a-t-ilun effetdu facteur1?

Du facteur2? Uneinteraction entre les 2?

Comparaisonsmultiples

Si un test global d'ANOVAestsignificatif(ieilexisteunedifférencede moyennes), où se trouvela différence Plusieurstests effectués, augmentele risqued'erreurde Type I

Ajustement/correction à effectuer

Exemple

On mesurele VO2Max de plusieurspatients, puison les diviseentroisgroupesselon leurIMC. On désiresavoir sile VO2Max estaffectépar la tranche d'IMCdu patient.

P = 0,0016: Le VO2Max diffèrepour au

moinsun des trois groupesau seuilde 5%.

Le groupe͞Surpoids" a un VO2Max

significativementinférieuraux deuxautres. ANOVA

Comparaisonmultiples

Si test global d'ANOVASIG -> comparaisonsmultiples par pairepour identifier entre quelsgroupesily a des différencessignificatives Corrections / ajustement: le seuilcombinédoitresterprèsde 5% Alpha combiné= 1 -( 1 -alpha_par_comparaison))^k, avec k comparaisons

Quelqueschoixd'ajustement

-Exploratoire; aucunajustement͗ Fisher's LSD -Traitementsvs contrôle: Dunnett -Donnéesbalancées: Tukey -Faiblenombre, planifiées: Bonferroni -Snooping, grand nombre, non planifiées: Scheffe -Génétique, trèsgrand nombre: Benjaminiand Hochberg

Référence:

Milliken, G.A. and D.E. Johnson (2009).

Analysis of Messy Data Volume 1:

Designed Experiments, 2ndedition.

Chapman and Hall/CRC. 674 pages.

Question 8

Un test ANOVA dans Prismme confirme que les moyennes entre les groupes sont différentes (Are meanssignif. different? P<0.05). Par contre les post-testTukeyou Bonferronine me donne pas de différence significative entre tous les groupes.

Le test Newman-Keulsy parvient cependant. De même, si je fais un test de studententre les deux groupes problématiques en ANOVA, la différence est significative.

Dans mes données la variance est très grande (la déviation standard est plus grande que la moyenne).

Que faire dans une telle situation ?

Réponse8

Possibilitéde variables influentessivariance énorme Postulats de l'ANOVA respectés (normalité & hétérogénéité)?

Si test global NS, pas de comparaisons multiples

Si test global SIG, comparaisons multiples

Sans correction = test T, probablement une significative Avec correction, pourraient toutes être NS si test global près de 5% Bonferroni, particulièrementconservateursi# comparaisonsélevé Newman-Keuls, similaireà Tukey, maismoinsconservateur(donc+ de résultatsSIG)

Question 9

Outre augmenter le nombre d'échantillons analysés y-a-t'il d'autres moyens de parvenir à des différences significatives, exemple faire les analyses statistiques sur les données transformées en logarithme ? Si oui, comment justifie t'on ce type de transformation ?

Réponse9

Puissance ј si N ј ,ǀariance љ ou effet / diffĠrence ј Modèle correctement spécifié, test plus puissant

Validation de postulats

Transformation de Box-Cox pour Y

Exemple: concentrations -> log

Aussi: racine carrée, inverse, au carré, etc. Utile avec problèmes de normalité des résidus

Interprétation commune

Validation de modèlesparamétriques

Postulats

Hypothèsesdu modèle

doiventêtrerespectés

Dépendentdu modèle

Normalitédes résidus

Homoscédasticitédes

résidus(variances égales)

Linéarité

Indépendance(absence

d'auto-corrélation)

Sources de biais

Valeursinfluentes

Multicolinéarité

Donnéesmanquantes

Pouvoirprédictifdu

modèle

Pouvoirexplicatifdes

variables explicatives

Validation des prédictions

Validation croisée

Sans validation, la

conclusion d'une analyse pourrait

êtreerronnée!

Résidus

Résidu ordinaire: ݁௜ൌܻ௜െ෠ܻ

Oùܻ௜= valeurobservéeet ෠ܻ

Bon modèle: Résidustousprèsde 0

Résidustudentisé: ݁௜divisépar son écart-type Ramèneles résidussuruneéchelleconnue: scores Z

Normalitédes résidus

Les modèlessupposentqueles résidussuiventunedistribution normalede moyenne0 et de variance ߪ Analyses robustesà unelégèredéviationde la normalité

Résultatsextrêmesmoinsaffectés

Grand kurtosis ї conservateur

Test T, ANOVA, Régressionlinéaire, Modèlelinéairemixte Validation graphique, par des statistiquesoudes tests

Homogénéitédes variances

Les modèlessupposentqueles résidussuiventunedistribution normalede moyenne0 et de variance ߪ Lorsquela variance des résidusdiffèreselonles groupesoula valeur de Y, ily a hétéroscédasticité Test T, ANOVA, Régressionlinéaire& logistique

Validation graphiqueoupar des tests

Linéarité

Le modèlede régressionlogistiquesuppose unerelation linéaireentre le logit de la probabilitéde succès(ʋ) et la VI

Si la relation n'estpas linéaire, le modèlene sera pas un bon indicateurde la relation Vérificationgraphiqueoupar test d'ajoutde termesde degréssupérieurs

Non corrélationdes résidus

Les modèlessupposentqueles résidusne sontpas corrélés: ܥ Lorsquecen'estpas le cas, ily a auto-corrélation, oudépendanceentre les observations

Supposéepour les principalesanalyses statistiques, saufles analyses pour donnéespairées(Mc Nemar, T Pairé, Wilcoxon rangssignés) et les modèlesmixtesouà effetsaléatoires

Vérificationgraphiqueoupar test

Valeursinfluentes

Valeuraberrante

Observations ayantune

combinaisonde valeurs (VI, VD) trèsdifférentedu restedes observations -> impact léger

Levier

Observation ayant

unevaleurde VI loin de la moyennedes VI -> impact léger

Valeur influente

Observation avec levier

et valeur VD différente des autres avec même VI -> impact sur paramètres estimés et prédiction

Question 10

Quel test doit-on effectuer pour justifier l'eǆclusion de points singuliers? Dans quel contexte est-il acceptable d'eǆclure une ǀaleur ͨaberrante»? Par exemple, certains réplicatsdonnant une valeur dĠpassant d'au moins 2 fois l'Ġcart type par rapport aux valeurs restantes. On voudrait pouvoir justifier leur exclusion afin de diminuer les écarts et pouvoir obtenir une significativité.

Attention, "pour obtenirunesignificativité"

Distribution seulede la variable, pas suffisammentd'informations

Groupessous-jacents?

Population cible?

Postulatsvalidés?

Distribution normale, 95% entre +/-2 écarts-types

Réponse10

Source: Wikipédia

Valeursinfluentes

Corrigerla valeurs'ils'agitd'erreurde saisie

Supprimerl'obserǀationsiellene fait pas partiede la population cible Analyse de sensibilité(avec et sans l'obserǀation) siellefait partie de la population cible

Questions 11

Quelles statistiques sont à utiliser avec les cultures cellulaires et un faible d'échantillon par groupe (triplicata)? Comment répartir les échantillons par plaque?

Quel test statistique utiliser pour comparer des traitements si on teste 2 molécules différentes à 3 doses en combinaison les unes avec les autres?Comment préparer l'expérience sur les animaux et quels tests sont à considérer pour analyser les effets de plusieurs traitements en prenant en compte le sexe d'animaux et le background génétique différent (wildtype, KO).

Blocage

unitĠs homogğnes ă l'intĠrieur de chacun.

Restriction à la randomisation

alĠatoirement dans l'ensemble du dispositif. Les traitements sont donc soumis à différentes conditions de façon équivalente.

Exemple:

Besoinde plusieursplaques pour uneexpérience

Conditions pourraientvarierd'uneplaque à l'autre S'assurerd'aǀoirtousles croisementspossiblesdanschaqueplaque pour contrôlerceproblème

Structure des traitements

Facteurs croisés ou emboités

Effets fixes ou aléatoires

Mesures uniques ou répétées

Structure de randomisation

Références:

Montgomery, D.C. (2013). Design and Analysis of Experiments, 8thedition.

Wiley. 752 pages.

Structure d'eǆpĠrience

Effet fixe

Ces modalités ne pourraient pas être remplacĠes par d'autres sans changer l'objectif de recherche.

Effet aléatoire

Les modalitĠs utilisĠes pour l'effet alĠatoire sont un Ġchantillon de toutes celles disponibles.

On ne désire pas comparer les modalités entre elles. On veut que les conclusions soient généralisables à leur population complète. Les modalitĠs utilisĠes pourraient donc trğs bien ġtre remplacĠ par d'autres.

Types d'effets

Famillede modèlesstatistiques

Estimation d'effetsfixes et aléatoires

Pour estimerl'ANOVAà mesuresrépétées, avec facteursintra seulementou intra+inter, l'ANOVAà effetsaléatoires, les devistelsque split plot, PBAC, etc.

Interaction entre tousles effets

Permetde tenircomptede la dépendanceentre les observations (pseudos répétitions) oude contrôlerpour des effetsaléatoires(blocs)

Trèsflexible

Modèleslinéairesmixtes

Réponse11

Selonle design expérimental, analyse statistiquedifférente

Arbredu design aide grandement

Ordredanslequelles choses sontfaites

Facteursemboités/ Croisés

Facteursfixes / aléatoires

Modèleslinéairesmixtessuppose VD continue

Postulatsà valider

Ajoutdu sexeet background génétique

Facteursfixes oualéatoires?

Oùles ajouterdansl'arbre?

Design 1

Plan factorielà 2 facteurscroisés

Unitéexpérimentale= unitééchantillonnale= souris -> ANOVA à 2 facteurs(inter / fixes)

Molécule(F)AB

Dose (F)

123161718Souris (D*M)

(A) = Erreur

123123

Design 2

Plan à blocs aléatoirescomplets(PBAC)

Unitéexpérimentale= unitééchantillonnale= échantillonde souris -> ANOVA à mesuresrépétéesà 2 facteurs(intra / fixes) -> Modèlelinéairemixte

Souris (A)123

Molécule(F)

123Dose (F)

AB ABAB 123
123

Design 3

Split plot dansun plan aléatoirecomplet

(PCA)

Molécule-> souris(parcelle

principale)

Dose -> échantillonde la souris

(sous-parcelle) -> ANOVA à mesuresrépétéesà 2 facteurs (1 inter + 1 intra, fixes) -> Modèlelinéairemixte

[PDF] [PDF] Comment choisir entre lANOVA à 1 facteur (1-way), lANOVA à 2

Statistiques pour biologistes

Atelier de formation 25 mai 2017

Anne-Sophie Julien

Plateforme de recherche clinique

Plateformede rechercheclinique

Services offerts

Méthodologieet biostatistique(58$/heure)

01 Conception projetde recherche, 02 analyses statistiquesde base, 03 calculde taille

Suite de l'atelierd'aujourd'hui

Date: 8 juin14h-16h

Lieu: CHUL, local H00-329

Contenu

Résidus

Postulatsfréquents

Inscription sur:

Question 1

Je ne sais pas si je doisfaire un test

Univs Bi latéral

Test unidirectionnel -> unilatéral (1 tail)

H0: Moyenne<= Moyenne2 / Corrélation<=0.30

H1: Moyenne1 > Moyenne2 / Corrélation>0.30

Test bidirectionnel-> bilatéral(2 tails)

H0: Moyenne1 = Moyenne2 / Corrélation= 0

H1: Moyenne1 т Moyenne2 / Corrélationт 0

Question 2

P>0.05

Tests de supérioritéet d'ĠgalitĠ

Test de supériorité (ou différence)

H0: Moyenne1 = Moyenne2

H1: Moyenne1 т Moyenne2

Test d'ĠgalitĠ

H0͗ Moyenne1 тMoyenne2

H1: Moyenne1 =Moyenne2

Test de non-infériorité

Question 3

Quelle est la différence entre SD et SEM?

Et lequel est le mieux pour publier?

Mesure de localisation

Moyenne

Médiane

Statistiquesdescriptivespour variables continues

Source: Wikipédia

Histogrammed'une

Mesuresde dispersion

Écart-type (Standard Deviation)

Indicateurde la variabilitédes données

Présentédansles statistiquesdescriptives

Erreur-Type (Standard Error of the mean)

Écart-type divisépar la racinecarréede N

Présentéedansles résultatsd'analyses

Question 4

Comment définir le n?

J'ai un puit, mais un qPCRen triplicata.

J'ai une souris, mais 2 PCR

Unité expérimentale

Le traitement y est appliqué

Indépendantes

Unité échantillonnale

Les mesures y sont prises

Dépendantes

Types d'unitĠs

Chaquerépétitionestindépendante

Répétitions

Modélisation

2.Utiliser toutes les pseudos-répétitions, mais en tenant compte de leur

Pseudos-répétitions

Répétitionsvs pseudo-répétitions

Question 5

L'objectif

Le design expérimental

Le type de données

Non corrélées(répétitionsseulement)

Le nombrede variables

Bivariée(2 variables: association)

Séried'analyses1

ANOVA à mesures

ANOVAà mesures

2 qualitatives

CorréléesMultivarié