3 nov 2016 · Etc M Nguile-Makao Ph D Imputation multiple/Proc MI MIANALYZE SAS 9 3
Previous PDF | Next PDF |
[PDF] Multiple Imputation for Missing Data: Concepts and - SAS Support
The paper presents SAS®procedures, PROC MI and PROC MIANALYZE, for creating multiple im- putations for incomplete multivariate data and for analyzing
[PDF] 265-2010: An Introduction to Multiple Imputation of - SAS Support
imputation using PROC MI, analysis of imputed data sets using SAS analysis impute missing data, the focus of this paper is use of multiple imputation methods
[PDF] Multiple Imputation of Missing Data Using SAS® - SAS Support
Central to this book is the method of multiple imputation (MI) for item missing data Supported by the SAS PROC MI and PROC MIANALYZE procedures, MI is
[PDF] for Multiple Imputation and Analysis of Longitudinal Data - SAS
15 avr 2018 · See the SAS/STAT PROC MI documentation, Rubin (1987), Schafer (1997), or Raghunathan (2016) for more on these topics Page 2 2 MULTIPLE IMPUTATION
[PDF] Utilisation de la procédure MI et MIANALYZE Pour limputation
3 nov 2016 · Etc M Nguile-Makao Ph D Imputation multiple/Proc MI MIANALYZE SAS 9 3
[PDF] Multiple imputation as a valid way of dealing with - LexJansen
It presents SAS (PROC MI and PROC MIANALYZE) and R (MICE package) procedures for creating multiple imputations for incomplete multivariate data, analyzes
[PDF] Missing Data Techniques with SAS - IDRE Stats
data, focusing on multiple imputation 2 Issues that Implementation of SAS Proc MI procedure Multiple values are imputed rather than a single value to
[PDF] Imputation de données manquantes sous SAS Le 14 octobre 2019
Niveau du cours SAS Base, savoir programmer en code SAS Connaître les modèles linéaires (régression linéaire multiple, régression logistique) Joindre le
[PDF] imputation par la médiane
[PDF] imputation rationnelle controle de gestion
[PDF] imputation rationnelle définition
[PDF] imputation rationnelle des charges fixes definition
[PDF] imputation rationnelle des charges fixes exercices corrigés
[PDF] imran hosein books arabic pdf
[PDF] imran hosein francais 2017
[PDF] imran hosein pdf francais
[PDF] imt
[PDF] imt orange
[PDF] imt paris
[PDF] imt pole emploi
[PDF] in company worksheets
[PDF] in windows vista
Données Manquantes
Imputation multiple MI
normalité assymptotiqueUtilisation de la procédure MI et MIANALYZEPour l"imputation multiple en SAS 9.3
M.Nguile-Makao Ph.D.
Pr. Vincent Vradet MD. Ph.D
Unité méthodologique du Centre Clinique et Évaluative en OncologieHôtel-Dieu de Québec Laval Université
____________3 novembre 2016
M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiquePlan1Généralité sur les données manquantes
Problématique des données manquantes
Méthodes d"analyse
2Imputation multiple MI
Théorie MI
Proc MI
Proc MIANALYZE
3Problème de Norm. Ass. des estimateurs
M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analyseDonnées manquantes
Plus de 95% des données utilisées dans des études statistiques contiennent de l"information manquantes.Sources :Essais cliniques .Sortie d"études .Perdus de vue .Enquêtes .Non réponse partielles .Non réponse totales .Erreurs de recueil de donnéesAnalyse de survie .Censure .TroncaturesEtc. M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analyseDéfinition DMs
Définition de DMs
.DMs d"un jeu de donnéesXest la matrice de données pour laquelle quelques valeurs réelles deXsont inconnues. .X=(Xij)i;j2Rpnun jeu de données,X=(Xo;Xm) oùXoest la matrice des observées etXmla matrice des manquantes. .R=(Rij)i;i2Rpnmatrice des indicatrices oùrij=1 si DM ou 0 sinon.Distribution de DMs .Mécanisme des DMs est spécifié par la distribution de R sachant X.Pr(R=rjX;)=p(rjxo;xm;)
Notation
: DM valeurs manquantesM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analyseTypologie des DMs
Little & Rubin (1987) proposent une typologie des DMsMAR: Missing At Random. .Probabilité qu"une observation soit manquante ne dépend pas des mesures observées ou des mesures non observées. p(rjxo;xm;)=p(r;):MCAR: Missing Completely At Random. .Connaissant les données observées, la probabilité qu"une observation soit manquante ne dépend pas des données non observées. p(rjxo;xm;)=p(rjxo;)MNAR: Missing Non At Random .Probabilité qu"une observation soit manquante dépend des données observés et des données non observées. p(rjxo;xm;)=p(rjxo;xm;)M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analysePattern des DMs
Diérents patterns des DMsLexique
(a) :DMsunivariées. (b) :DMsmonotones (c) :DMsnon monotonesM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analyseExemples
Exemples des DMs
Considérons une base de données (BD) des patients atteints du cancer de la prostate(PCa). BD=(âge, Gleason,PSA).MCAR
.La probabilité que l"âge soit NA ne dépend ni des valeurs observées et non observées du Gleason, ainsi que ceux de la PSA, de plus elle est la même pour tous les sujets.MAR .La probabilité que l"âge soit NA ne dépend que des valeurs observées du Gleason et la PSA (valeurs observées). Elle n"est pas la même pour tous les sujets.NMAR .La probabilité que l"âge soit NA dépend des non observées valeurs du Gleason et de la PSA (valeurs non observées). Elle n"est pas la même pour tous les sujets. M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantesMéthodes d"analyseImpacts des DMs
En présence des DMs de type MCAR
.Perte de précision (Puissance) .Aucun biaisEn présence des DMs de type MAR .Perte de précision (Puissance) .Aucun biais pour des méthodes d"inférence par maximum de vraisemblanceEn présence des DMs de type MNAR
.Perte de précision (Puissance) .BiaisRemarque
Il est très dicile de savoir quelle est le vraie mécanisme des DMs ou au moins laquelle detypologie est le plus probable. Il y a une part d"avis subjectif dans le choix mais ce peut-être un
avis éclairé! M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantes Méthodes d"analyseMéthodes suppression/tolérance des DMsAnalyse des cas-concrets .Suppression des DMs (problématique si NMAR))Analyse des cas disponibles .Suppression par paire ("Pairwise deletion") http ://www.ats.ucla.edu/stat/sas/modules/missing.htmTolère les DMs .Méthode CART Leonard Gordon.Using Classification and Regression Trees (CART) in SASREnterprise Miner
TMFor Applications in Public Health.Data Mining and TextAnalytics, SAS Global Forum (2013).
M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueProblématique des données manquantes Méthodes d"analyseMéthode d"imputation simpleImputation simple : Définition
.Méthode basée sur la substitution à une DM une valeur choisie de manière pertinente via des algorithmes.Méthodes en sas .Imputation par moyenne ou médiane .CMCF (Concept Most Common Attribute Value Fitting) .LOCF (Last observation carried forward, LOCF) .KNN (k-nearest neighbors) .Regression local (LOESS) .L"algorithm NIPALS (Nonlinear Iterative Partial Least Squares ) .L"algorithme EM (Expectation maximization)Remarque L"imputation simple est dangereuse car elle ne permet pas d"évaluer l"incertitude de la valeur imputée par rapport à la vrai valeur. D"ou imputation multiple! M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEMéthode star!
Imputation multiple (MI) Rubin 1987v1 v2 ... v3 NA NA NA v1 v2 ... v3 v31 ... v21 v1 v2 ... v3 v32 ... v22 v1 v2 ... v3 v3M ...v2M
Résultats combinés ES(Q, U) ES(Q
1 , U 1 ES(Q 2 , U 2 ES(Q i , U i ES(Q M , U MMI Analyse Combinaison Règle de Rubin M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEProcédure MI SAS
proc MI sas 9.3 .PROCMIBYvariables;
CLASSvariables;
EM;
FCS;
FREQvariable;
MCMC;
MONOTONE;
TRANSFORMtransform ( variablesVARvariables;Définitions
.FCS : imputation multivariée par chaîn (supposant une distribution conjointe existe). .MCMC : Monte Carlo Markov Chaine ..MONOTONE : pour la typologie monotone des DMM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEMéthodes associées à la proc MIMéthodes de la procédure MI sas 9.3
Pattern DM Variable Methodes
Monotone Continuous Monotone regression
Monotone predicted mean matching
Monotone propensity score
Monotone ordinal Monotone logistic regression
nominal Monotone discriminant functionArbitrary Continuous MCMC full-data imputation
MCMC monotone-data imputation
Arbitrary Continuous FCS regression
FCS predicted mean matching
Arbitrary ordinal FCS logistic regression
nominal FCS discriminant function M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEExemple de données
Les données
Figure:Data Prostate cancer (hotel-Dieux Québec) et Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEExemple MI
Imputation par défaut (MCMC )
.Programme(R1;1) proc mi data=Fish1seed =1396nimpute =5out =datimp0round =:1; varLength1 Length2 Length3 ;
run;Imputation par la méthode de régression (monotone) .Programme(R1;2) proc mi data=Fish1seed =1396nimpute =5out =datimp1round =:1; monotone reg (Length2)regpmm(Length3=Length1 Length2); var Length1 Length2 Length3 ;run;Imputation par la méthode de régression (arbitraire) .Programme(R1;3) proc mi data=Fish1seed =1396nimpute =5out =datimp2; FCS regression ; varLength3 Length1 Length2 ;
run;M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZERésultats du prog.R1;1Resultat du progR1;1Figure:Résultat de la MI du programme R1;1M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEDonnées complétés prog.R1;1Résultat du progR1;1Figure:Données complétés de Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZERésultats de la MI pour les prog.R1;2&R1;3RésultatR1;2Figure:Fish(SAS) RésultatR1;3Figure:Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEExemple 2
Imputation variable nominale prog.R2;1
.procmi data=datPca1seed =37851nimpute =5out =dPcaImp0; class agecl1 stade ; fcs logistic ; var br br _time marge stade ki67 agecl1 PSA0; run;Imputation multi-étapes prog.R2;2 .Étape 1 proc mi data=datPca1seed =155417nimpute =5out =dPcaImp1; mcmc impute =monotone; var br br _time marge ki67 PSA0; run; .Étape 2 proc mi data=dPcaImp1nimpute =1seed =51343out =datr; monotone reg ; var br br _time marge ki67 PSA0; by_Imputation_;run;M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEDonnées complétés prog.R2;1Résultat du progR2;1Figure:Données complétés de Pca M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEDonnées complétés prog.R2;2Résultat du progR2;2étape1Figure:Données complétés étape 1 PCa M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3
Données Manquantes
Imputation multiple MI
normalité assymptotiqueThéorie MIProc MI
Proc MIANALYZEDonnées complétés prog.R2;2Résultat du progR2;2étape 2Figure:Données complétés étape 2 PCa M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3