[PDF] [PDF] Utilisation de la procédure MI et MIANALYZE Pour limputation

3 nov 2016 · Etc M Nguile-Makao Ph D Imputation multiple/Proc MI MIANALYZE SAS 9 3 



Previous PDF Next PDF





[PDF] Multiple Imputation for Missing Data: Concepts and - SAS Support

The paper presents SAS®procedures, PROC MI and PROC MIANALYZE, for creating multiple im- putations for incomplete multivariate data and for analyzing



[PDF] 265-2010: An Introduction to Multiple Imputation of - SAS Support

imputation using PROC MI, analysis of imputed data sets using SAS analysis impute missing data, the focus of this paper is use of multiple imputation methods  



[PDF] Multiple Imputation of Missing Data Using SAS® - SAS Support

Central to this book is the method of multiple imputation (MI) for item missing data Supported by the SAS PROC MI and PROC MIANALYZE procedures, MI is  



[PDF] for Multiple Imputation and Analysis of Longitudinal Data - SAS

15 avr 2018 · See the SAS/STAT PROC MI documentation, Rubin (1987), Schafer (1997), or Raghunathan (2016) for more on these topics Page 2 2 MULTIPLE IMPUTATION 



[PDF] Utilisation de la procédure MI et MIANALYZE Pour limputation

3 nov 2016 · Etc M Nguile-Makao Ph D Imputation multiple/Proc MI MIANALYZE SAS 9 3 



[PDF] Multiple imputation as a valid way of dealing with - LexJansen

It presents SAS (PROC MI and PROC MIANALYZE) and R (MICE package) procedures for creating multiple imputations for incomplete multivariate data, analyzes 



[PDF] Missing Data Techniques with SAS - IDRE Stats

data, focusing on multiple imputation 2 Issues that Implementation of SAS Proc MI procedure Multiple values are imputed rather than a single value to



[PDF] Imputation de données manquantes sous SAS Le 14 octobre 2019

Niveau du cours SAS Base, savoir programmer en code SAS Connaître les modèles linéaires (régression linéaire multiple, régression logistique) Joindre le  

[PDF] imputation multiple sous r

[PDF] imputation par la médiane

[PDF] imputation rationnelle controle de gestion

[PDF] imputation rationnelle définition

[PDF] imputation rationnelle des charges fixes definition

[PDF] imputation rationnelle des charges fixes exercices corrigés

[PDF] imran hosein books arabic pdf

[PDF] imran hosein francais 2017

[PDF] imran hosein pdf francais

[PDF] imt

[PDF] imt orange

[PDF] imt paris

[PDF] imt pole emploi

[PDF] in company worksheets

[PDF] in windows vista

Données Manquantes

Imputation multiple MI

normalité assymptotiqueUtilisation de la procédure MI et MIANALYZE

Pour l"imputation multiple en SAS 9.3

M.Nguile-Makao Ph.D.

Pr. Vincent Vradet MD. Ph.D

Unité méthodologique du Centre Clinique et Évaluative en Oncologie

Hôtel-Dieu de Québec Laval Université

____________

3 novembre 2016

M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiquePlan

1Généralité sur les données manquantes

Problématique des données manquantes

Méthodes d"analyse

2Imputation multiple MI

Théorie MI

Proc MI

Proc MIANALYZE

3Problème de Norm. Ass. des estimateurs

M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analyseDonnées manquantes

Plus de 95% des données utilisées dans des études statistiques contiennent de l"information manquantes.Sources :Essais cliniques .Sortie d"études .Perdus de vue .Enquêtes .Non réponse partielles .Non réponse totales .Erreurs de recueil de donnéesAnalyse de survie .Censure .TroncaturesEtc. M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analyseDéfinition DMs

Définition de DMs

.DMs d"un jeu de donnéesXest la matrice de données pour laquelle quelques valeurs réelles deXsont inconnues. .X=(Xij)i;j2Rpnun jeu de données,X=(Xo;Xm) oùXoest la matrice des observées etXmla matrice des manquantes. .R=(Rij)i;i2Rpnmatrice des indicatrices oùrij=1 si DM ou 0 sinon.Distribution de DMs .Mécanisme des DMs est spécifié par la distribution de R sachant X.

Pr(R=rjX;)=p(rjxo;xm;)

Notation

: DM valeurs manquantesM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analyseTypologie des DMs

Little & Rubin (1987) proposent une typologie des DMsMAR: Missing At Random. .Probabilité qu"une observation soit manquante ne dépend pas des mesures observées ou des mesures non observées. p(rjxo;xm;)=p(r;):MCAR: Missing Completely At Random. .Connaissant les données observées, la probabilité qu"une observation soit manquante ne dépend pas des données non observées. p(rjxo;xm;)=p(rjxo;)MNAR: Missing Non At Random .Probabilité qu"une observation soit manquante dépend des données observés et des données non observées. p(rjxo;xm;)=p(rjxo;xm;)M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analysePattern des DMs

Diérents patterns des DMsLexique

(a) :DMsunivariées. (b) :DMsmonotones (c) :DMsnon monotonesM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analyseExemples

Exemples des DMs

Considérons une base de données (BD) des patients atteints du cancer de la prostate(PCa). BD=(âge, Gleason,PSA).MCAR

.La probabilité que l"âge soit NA ne dépend ni des valeurs observées et non observées du Gleason, ainsi que ceux de la PSA, de plus elle est la même pour tous les sujets.MAR .La probabilité que l"âge soit NA ne dépend que des valeurs observées du Gleason et la PSA (valeurs observées). Elle n"est pas la même pour tous les sujets.NMAR .La probabilité que l"âge soit NA dépend des non observées valeurs du Gleason et de la PSA (valeurs non observées). Elle n"est pas la même pour tous les sujets. M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes

Méthodes d"analyseImpacts des DMs

En présence des DMs de type MCAR

.Perte de précision (Puissance) .Aucun biaisEn présence des DMs de type MAR .Perte de précision (Puissance) .Aucun biais pour des méthodes d"inférence par maximum de vraisemblance

En présence des DMs de type MNAR

.Perte de précision (Puissance) .Biais

Remarque

Il est très dicile de savoir quelle est le vraie mécanisme des DMs ou au moins laquelle de

typologie est le plus probable. Il y a une part d"avis subjectif dans le choix mais ce peut-être un

avis éclairé! M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes Méthodes d"analyseMéthodes suppression/tolérance des DMsAnalyse des cas-concrets .Suppression des DMs (problématique si NMAR))Analyse des cas disponibles .Suppression par paire ("Pairwise deletion") http ://www.ats.ucla.edu/stat/sas/modules/missing.htmTolère les DMs .Méthode CART Leonard Gordon.Using Classification and Regression Trees (CART) in SASR

Enterprise Miner

TMFor Applications in Public Health.Data Mining and Text

Analytics, SAS Global Forum (2013).

M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueProblématique des données manquantes Méthodes d"analyseMéthode d"imputation simple

Imputation simple : Définition

.Méthode basée sur la substitution à une DM une valeur choisie de manière pertinente via des algorithmes.Méthodes en sas .Imputation par moyenne ou médiane .CMCF (Concept Most Common Attribute Value Fitting) .LOCF (Last observation carried forward, LOCF) .KNN (k-nearest neighbors) .Regression local (LOESS) .L"algorithm NIPALS (Nonlinear Iterative Partial Least Squares ) .L"algorithme EM (Expectation maximization)Remarque L"imputation simple est dangereuse car elle ne permet pas d"évaluer l"incertitude de la valeur imputée par rapport à la vrai valeur. D"ou imputation multiple! M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEMéthode star!

Imputation multiple (MI) Rubin 1987v1 v2 ... v3 NA NA NA v1 v2 ... v3 v31 ... v21 v1 v2 ... v3 v32 ... v22 v1 v2 ... v3 v3M ...v2M

Résultats combinés ES(Q, U) ES(Q

1 , U 1 ES(Q 2 , U 2 ES(Q i , U i ES(Q M , U M

MI Analyse Combinaison Règle de Rubin M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEProcédure MI SAS

proc MI sas 9.3 .PROCMI ;

BYvariables;

CLASSvariables;

EM;

FCS;

FREQvariable;

MCMC;

MONOTONE;

TRANSFORMtransform ( variables
)<...transform ( variables)>;

VARvariables;Définitions

.FCS : imputation multivariée par chaîn (supposant une distribution conjointe existe). .MCMC : Monte Carlo Markov Chaine .

.MONOTONE : pour la typologie monotone des DMM. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEMéthodes associées à la proc MI

Méthodes de la procédure MI sas 9.3

Pattern DM Variable Methodes

Monotone Continuous Monotone regression

Monotone predicted mean matching

Monotone propensity score

Monotone ordinal Monotone logistic regression

nominal Monotone discriminant function

Arbitrary Continuous MCMC full-data imputation

MCMC monotone-data imputation

Arbitrary Continuous FCS regression

FCS predicted mean matching

Arbitrary ordinal FCS logistic regression

nominal FCS discriminant function M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEExemple de données

Les données

Figure:Data Prostate cancer (hotel-Dieux Québec) et Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEExemple MI

Imputation par défaut (MCMC )

.Programme(R1;1) proc mi data=Fish1seed =1396nimpute =5out =datimp0round =:1; var

Length1 Length2 Length3 ;

run;Imputation par la méthode de régression (monotone) .Programme(R1;2) proc mi data=Fish1seed =1396nimpute =5out =datimp1round =:1; monotone reg (Length2)regpmm(Length3=Length1 Length2); var Length1 Length2 Length3 ;run;Imputation par la méthode de régression (arbitraire) .Programme(R1;3) proc mi data=Fish1seed =1396nimpute =5out =datimp2; FCS regression ; var

Length3 Length1 Length2 ;

run;M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZERésultats du prog.R1;1Resultat du progR1;1Figure:Résultat de la MI du programme R1;1M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEDonnées complétés prog.R1;1Résultat du progR1;1Figure:Données complétés de Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZERésultats de la MI pour les prog.R1;2&R1;3RésultatR1;2Figure:Fish(SAS) RésultatR1;3Figure:Fish (SAS) M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEExemple 2

Imputation variable nominale prog.R2;1

.procmi data=datPca1seed =37851nimpute =5out =dPcaImp0; class agecl1 stade ; fcs logistic ; var br br _time marge stade ki67 agecl1 PSA0; run;Imputation multi-étapes prog.R2;2 .Étape 1 proc mi data=datPca1seed =155417nimpute =5out =dPcaImp1; mcmc impute =monotone; var br br _time marge ki67 PSA0; run; .Étape 2 proc mi data=dPcaImp1nimpute =1seed =51343out =datr; monotone reg ; var br br _time marge ki67 PSA0; by_Imputation_;run;M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEDonnées complétés prog.R2;1Résultat du progR2;1Figure:Données complétés de Pca M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEDonnées complétés prog.R2;2Résultat du progR2;2étape1Figure:Données complétés étape 1 PCa M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEDonnées complétés prog.R2;2Résultat du progR2;2étape 2Figure:Données complétés étape 2 PCa M. Nguile-Makao Ph.DImputation multiple/Proc MI MIANALYZE SAS 9.3

Données Manquantes

Imputation multiple MI

normalité assymptotiqueThéorie MI

Proc MI

Proc MIANALYZEproc MIANALYZE

Syntaxe

.PROCMIAN ALYZE;BYvariables;CLASSvariables; MODELEFFECTSeects;