23 nov 2016 · permet de prendre en compte la variabilité interne aux classes et C'est une unité statistique qui peut être un sujet (être libre, motivé, etc ) ou Le taux de bonne affectation représenté par l'équation 3 1 Acc = ∑ c i=1 Mii N
Previous PDF | Next PDF |
[PDF] SIMMAC - Universidad de Costa Rica
de la economıa de libre mercado en el cumplimiento del objetivo de pleno sometimes to account for a terminating event (such as death), and sometimes to
[PDF] AGRADECIMIENTOS - simmac - Universidad de Costa Rica
25 fév 2020 · situaciones cuando los conjuntos w-límite en el plano libre de tumor son los puntos de equilibrio del sistema Comptes Rendus Mathématique We give account of the applications of this decomposition in the study of the
[PDF] thèse finale - Université Paris-Dauphine
23 nov 2016 · permet de prendre en compte la variabilité interne aux classes et C'est une unité statistique qui peut être un sujet (être libre, motivé, etc ) ou Le taux de bonne affectation représenté par l'équation 3 1 Acc = ∑ c i=1 Mii N
[PDF] CURRICULUM VITÆ de Pierre LAFAYE DE MICHEAUX Table des
Je compte également poursuivre les recherches que j'ai entamées 2012 - Mouloud Belbahri, mémoire de maıtrise avec stage, ADTR - Acc`es `a distance Informatisation du fonds documentaire du LabSAD `a l'aide du logiciel libre Koha
[PDF] A Visualization of Null Geodesics for the Bonnor - gandreolivaorg
12 fév 2014 · Software Libre 1Escuela de Fısica is also important to take into account, since several of these massive objects (black holes or neutron
[PDF] Recueil des Notices Et Mémoires de la Société - Forgotten Books
gnifie hommes libres) et par le genèse Scha him tien s pa s compte évidemmen t des quelques G é pi dè S comte G uilla ume de Provence s' empa ra en 975 du lignes cre uses n ettemen t acc usées et disposées en éven ta il 7
[PDF] RAPPORT DACTIVITE ANNEE 2006 - CREST
Professeur à l'Université Libre de Bruxelles Costas MEGHIR rendre compte des traits les plus spécifiques isolés dans le premier article Current Account Reversals and Long Term Imbalances: Application to the Central and Eastern
[PDF] Single User. Guide d Installation
[PDF] Site Internet. Maintenance
[PDF] Site internet. Vous voulez faire réaliser votre site internet par une agence web? 21 points à passer en revue pour rédiger votre cahier des charges
[PDF] SITE RH DE L INSERM MODE D EMPLOI
[PDF] Site vitrine / Boutique en ligne Site mobile / Hébergement / Nom de domaine E-mail / Référencement / Multilangues
[PDF] Site www.gentlemanselections.fr CONDITIONS GENERALES DE VENTE E-BOUTIQUE
[PDF] SITUATION FINANCIERE DE LA COMMUNE DE LA VERNAZ
[PDF] Situation sanitaire. en Nouvelle-Calédonie. www.dass.gouv.nc
[PDF] SNCF Agence Immobilière Régionale Communauté D Agglomération Dracénoise
[PDF] SNI Sud-Ouest opérateur immobilier globai au service de l intérêt général
[PDF] sociales (pour information) CIRCULAIRE DGS(SD6/A)/DGAS/DSS/2002/551 / du 30 octobre 2002 relative aux appartements de coordination thérapeutique (ACT)
[PDF] Société Aéroport Toulouse-Blagnac Service environnement / Aide à l insonorisation CS 90103 31703 Blagnac Cedex
[PDF] Société anonyme Sicafi publique de droit belge Uitbreidingstraat 18 2600 Berchem-Anvers Numéro d entreprise 0431.391.860
[PDF] SOCIÉTÉ D HABITATION DU QUÉBEC
THÈSE DE DOCTORAT
de l'Université de recherche Paris Sciences et LettresPSL Research University
Préparée àl'Université Paris-Dauphine
COMPOSITION DU JURY :
Soutenue le
par cole Doctorale de Dauphine - ED 543Spécialité
Dirigée parApprentissage Supervisé de Données Symboliques et l'Adaptation aux Données Massives et Distribuées.23.11.2016
Raja HADDAD
Witold LITWIN
University of California, Santa CruzM. Darrell LONGUniversité Paris Dauphine
M. Edwin DIDAY
M. Philippe Rigaux
CNAMMme Rosanna VERDE
Second University of Naples
Mme. Daniela GRIGORI
Université Paris Dauphine
M. Filipe AFONSO
Syrokko
Informatique
Président du jury
Membre du jury
Rapporteur
Rapporteure
Membre du jury
Membre du jury
Table des mati`eres
Introduction g´en´erale1
1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Probl
´ematiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.1 Extraction des Histogrammes
`a partir d"une Variable Continue . 22.2 Extension de la m
´ethode d"Arbre de D´ecision aux Donn´ees Symboliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.3 Extension de l"ADS aux Big Data . . . . . . . . . . . . . . . . . . . 3
3 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
4 Plan de la th
`ese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Analyse des donn´ees symboliques7
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Notions de base de l"ADS . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Des individus aux classes d"individus . . . . . . . . . . . . . . . . 9
2.2 Donn
´ees, variables, objets et tableaux symboliques . . . . . . . . 10 3´Etapes de l"ADS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.1 Construction des donn´ees symboliques . . . . . . . . . . . . . . . 13
3.2 Extension des m
´ethodes d"analyses classiques aux Donn´ees
Symboliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 Outils d"ADS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.1 Le logiciel SODAS (Symbolic Official Data Analysis System) . . . . 16
4.1.1 Le module d"extraction de donn
´ees symboliques DB2SO 16
4.1.2 M
´ethodes Symboliques impl´ement´ees dans SODAS . . 184.2 Le logiciel SYR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.2.1 Le module de construction et de manipulation de
donn ´ees symboliques TabSyr . . . . . . . . . . . . . . . . 20 iiTable des mati`eres4.2.2 Modules d"ADS impl´ement´es dans SYR . . . . . . . . . 25
4.3 Les librairies d"ADS dans R . . . . . . . . . . . . . . . . . . . . . . 28
4.3.1 RSDA- R to Symbolic Data Analysis . . . . . . . . . . . 29
4.3.2 Clamix . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3.3 HistDAWass : Histogram-Valued Data Analysis . . . . . 30
4.4 Comparaison entre les diff
´erents outils d"ADS . . . . . . . . . . . 30
5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2 Extraction des histogrammes les plus discriminants `a partir d"une variable
continue (HistSyr)351 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2 Discr
´etisation d"une variable continue :´etat de l"art . . . . . . . . . . . . 372.1 Discr
´etiser? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2 M ´ethodes de discr´etisation . . . . . . . . . . . . . . . . . . . . . . 382.2.1 M
´ethodes de discr´etisation non supervis´ee . . . . . . . . 382.2.2 M
´ethodes de discr´etisation supervis´ee . . . . . . . . . . 453 HistSyr : conversion d"une variable continue en histogrammes les plus
discriminants pour les classes d"individus . . . . . . . . . . . . . . . . . . 523.1 Pr
´esentation de la probl´ematique . . . . . . . . . . . . . . . . . . . 523.1.1 Une variable histogramme? . . . . . . . . . . . . . . . . 53
3.1.2 Discrimination entre les descriptions des classes d"indi-
vidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.2 Pr
´esentation de la solution . . . . . . . . . . . . . . . . . . . . . . 563.2.1 Le crit
`ere d"HistSyr . . . . . . . . . . . . . . . . . . . . . 563.2.2 L"algorithme d"HistSyr . . . . . . . . . . . . . . . . . . . 57
3.3 Les cas d"utilisation d"HistSyr . . . . . . . . . . . . . . . . . . . . . 61
3.3.1 Utilisation d"HistSyr pour la conversion d"une variable
continue en histogrammes . . . . . . . . . . . . . . . . . 623.3.2 R
´eduction du nombre de modalit´es des histogrammes . 643.4 HistSyr Vs autres m
´ethodes de discr´etisation . . . . . . . . . . . . 693.4.1 Tests sur des donn
´ees du r´epertoire UCI . . . . . . . . . 703.4.2 Tests sur des donn
´ees issues des´etudes de Syrokko . . . 76
4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3 Arbre de d´ecision symbolique SyrTree81
Table des mati`eresiii
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2 Arbres de d´ecision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1 D ´efinitions et notions de base . . . . . . . . . . . . . . . . . . . . . 832.1.1 Variables explicatives et la variable
`a expliquer . . . . . 842.1.2 Les nuds terminaux/non terminaux . . . . . . . . . . 85
2.1.3 Ensembles d"apprentissage / de test . . . . . . . . . . . 86
2.1.4 Entr
´ees / sorties d"un arbre de d´ecision . . . . . . . . . 862.1.5 Construction et
´elagage d"un arbre . . . . . . . . . . . . 87
2.1.6 Matrice de confusion et taux de bonne affectation . . . . 89
2.2 M ´ethodes d"arbre de d´ecision existantes . . . . . . . . . . . . . . . 912.2.1 M
´ethodes classiques . . . . . . . . . . . . . . . . . . . . . 912.2.2 M
´ethodes symboliques . . . . . . . . . . . . . . . . . . . 923 Nouvelle m
´ethode d"arbres de d´ecision symbolique : SyrTree . . . . . . . 933.1 Algorithme de construction d"un arbre de d
´ecision en utilisant
SyrTree . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 943.1.1 Conditions d"arr
et du d´ecoupage d"un nud . . . . . . 943.1.2 Crit
`eres de d´ecoupage . . . . . . . . . . . . . . . . . . . . 943.2 Classe d"affectation . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.3 M ´ethode d"´elagage de l"arbre SyrTree . . . . . . . . . . . . . . . . 1133.4 Le module de test et de validation de SyrTree . . . . . . . . . . . . 114
3.4.1 Affectation d"un individu classique (de premier ordre) . 114
3.4.2 Affectation d"individus symboliques (de deuxi
`eme ordre)1174 Strat
´egies de construction d"arbres`a partir de donn´ees classiques en utilisant SyrTree . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1224.1 Strat
´egie 1 : la construction des arbres sur les classes d"individus symboliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1234.1.1 Les
´etapes . . . . . . . . . . . . . . . . . . . . . . . . . . . 1234.2 Exemple illustratif en utilisant les donn
´ees des Iris de Fisher . . . 125
4.2.1 Avantages et inconv
´enients de l"arbre sur les classes
d"individus symboliques . . . . . . . . . . . . . . . . . . 1274.3 Strat
´egie 2 : Construction des arbres en se basant sur le r´esultat d"une classification . . . . . . . . . . . . . . . . . . . . . . . . . . . 1284.3.1 Les
´etapes . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 ivTable des mati`eres4.3.2 Exemple illustratif sur les donn´ees UCI de la base "
breast-cancer-wisconsin" . . . . . . . . . . . . . . . . . . 1295 SyrTree Vs autres m
´ethodes d"arbres de d´ecisions . . . . . . . . . . . . . 1316 Application de SyrTree sur des donn
´ees r´eelles . . . . . . . . . . . . . . . 134 6.1´Etude de l"influence des conditions environnementales sur lesmesures de corrosion . . . . . . . . . . . . . . . . . . . . . . . . . . 134