[PDF] APPLIQUE AU DATA MINING - bibliouniv-antananarivomg



Previous PDF Next PDF


















[PDF] cours arbre de décision

[PDF] classification par arbre de décision

[PDF] arbre de décision exemple

[PDF] arbre de décision cart

[PDF] construire un arbre de décision

[PDF] arbre de décision définition

[PDF] dénombrement cours 1ere s

[PDF] apollon et daphné résumé

[PDF] apollon et daphné leur histoire

[PDF] expression etre nature

[PDF] tp mise en évidence d'une réaction d'oxydoréductio

[PDF] apollon et daphné peinture

[PDF] apollon et daphné le bernin

[PDF] tp chimie réaction d oxydoréduction

[PDF] vertebres avec quilles

APPLIQUE AU DATA MINING - bibliouniv-antananarivomg N° : 05/EN/IA/2012 Année universitaire : 2011 2012 du

Option: Informatique Appliquée

APPLIQUE AU DATA MINING

Présenté par :

RALAMBOMAHAY Andriamparany Valim-bavaka

Soutenu le

Vendredi 13 Septembre 2013

ECOLE SUPERIEURE POLYTECHNIQUE

DEPARTEMENT ELECTRONIQUE

: 05/EN/IA/2012 Année universitaire : 2011 2012

EN ELECTRONIQUE

Option : Informatique Appliquée

APPLIQUE AU DATA MINING

Présenté par

RALAMBOMAHAY Andriamparany Valim-bavaka

Soutenu le

Vendredi 13 Septembre 2013

Devant le jury composé de

Président : Monsieur RAKOTOMIRAHO Soloniaina

Examinateurs : Monsieur RATSIMBA Mamy Nirina

Monsieur RANDRIAMAROSON Rivo Mahandrisoa

Monsieur HERINANTENAINA Edmond Fils

Directeur de Mémoire : Madame RABEHERIMANANA Lyliane Irène i

Remerciements

Je remerciH GLHX TXL P·a donné la force, le courage et la santé nécessaires à la réalisation de ce mémoire. Ensuite, Ó·MGUHVVH mes vifs remerciements aux personnes suivantes sans lesquelles ce

PpPRLUH Q·MXUMLP SX MNRXPLU

A Monsieur RATSIMBA Mamy Nirina, Chef du Département Electronique qui a approuvé la soutenance de ce mémoire et qui fut un membre inhérent du jury. A Monsieur RAKOTOMIRAHO Soloniaina SRXU O·ORQQHXU TX·LO M fait en acceptant GH SUpVLGHU OH ÓXU\ GH ŃHPPH VRXPHQMQŃH GH PpPRLUH GH ILQ G·pPXGHs. A tous les membres du jury qui ont bien voulu examiner, évaluer et apprécier ce travail malgré leurs multiples obligations :

Monsieur RANDRIAMAROSON Rivo Mahandrisoa

Monsieur HERINANTENAINA Edmond Fils

A Madame RABEHERIMANANA Lyliane Irène, mon directeur de mémoire pour

son énorme contribution à la réalisation de ce mémoire. Je tiens à apprécier ses grandes

ŃRQQMLVVMQŃHV TX·HOOH M SMUPMJpHV ORUV GH O·pOMNRUMPLRQ GH ŃH PUMYMLO VMQV MYRLU PpQMJp VRQ

précieux temps. A tous les enseignants du Département Electronique, ainsi que les enseignants et responsables dH O·(ŃROH 6XSpULHXUH 3RO\PHŃOQLTXH TXL RQP MVVXUp ma formation durant mon cursus universitaire. A mes parents et PHV TXMPUH IUqUHV HP V±XUV SRXU OHXU VRXPLHQ MIIHŃPLI HP ILQMQŃLHUB (P HQILQ j PRXV ŃHX[ TXL RQP ŃRQPULNXp GH SUqV RX GH ORLQ j O·pOMNRUMtion de ce présent mémoire.

Valim-bavaka

ii

Résumé

Les arbres de décisions sont des modèles de classification utilisés en Data Mining pour effectuer des prédictions. Ce mémoire montre données. Toutefois, le Data Mining

Le principal objectif de ce mémoire un

arbre de décision. Pour cela, quelques notions théoriques sont fournies

des modèles est effectuée à partir du jeu de données NSL-KDD qui est la dérivée du jeu de

données , connu surtout dans la compétition du Data Mining.

Dans la simulati

partir du logiciel R est à effectuer. iii

Abstract

The known field of Data Mining uses decisions trees in order to make some However, the fact is that in reality, the process of inducing trees is only a piece of the puzzle in the whole Data Mining process. process is the main purpose of this memory and some theory are supplied for that. The model built is based upon the NSL KDD dataset which has the up. This data set has been acknowledged by the Data Mining user community for a learning induction task. During the simulation, one model of decision tree was created by using the R software. This model was evaluated to conclude its performance. iv

Table des matières

Remerciements ............................................................................................................................ i

Résumé ....................................................................................................................................... ii

Abstract ..................................................................................................................................... iii

Table des matières ..................................................................................................................... iv

Liste des tableaux .................................................................................................................... viii

Liste des figures ........................................................................................................................ ix

Introduction ............................................................................................................................... 1

Chapitre I Notions de base sur le Data Mining ...................................................................... 3

I.1. Introduction ..................................................................................................................... 3

I.2 Généralités sur le Data Mining ........................................................................................ 3

I.2.1. Définitions ................................................................................................................... 3

I.2.2. Objectif ........................................................................................................................ 3

I.2.3. Terminologies du Data Mining ................................................................................... 4

I.2.4. Différentes catégories de DM ...................................................................................... 5

I.2.5. Data Mining .............................................................................. 5 I.2.6. Data Mining ................................................................... 7

I.3. Apprentissage automatique " machine learning » ......................................................... 7

I.3.1. Définitions ................................................................................................................... 7

I.3.2. Origines du machine learning .................................................................................... 7

I.3.3 ...................................................................................... 8

I.3.4 Apprentissage supervisé .............................................................................................. 8

I.4. Arbre de décision ............................................................................................................ 9

I.4.1. Généralités ................................................................................................................... 9

I.4.2. Définition ..................................................................................................................... 9

I.4.3. ....................................................................... 9 I.4.4. ........................................................................ 10 I.4.5. ......................................................... 12

I.4.6. Avantages et inconvénients des arbres de décisions ................................................. 13

I.4.7. Evolution des arbres de décisions .............................................................................. 13

I.5. Conclusion ..................................................................................................................... 15

Chapitre II ....................................................... 16

II.1. Introduction ................................................................................................................... 16

II.2. Concept de base ......................................................................................................... 16

II.2.1. Principe ...................................................................................................................... 16

........................................................................................... 17 ........................................................................................ 19 v

II.3. Algorithme CART ......................................................................................................... 20

II.3.1. .............................................................................................. 21

II.3.2. Pseudo-code ............................................................................................................... 22

II.3.3. ........................................................................................................... 23

II.4. Elagage ...................................................................................................................... 23

II.4.1. Définition ................................................................................................................... 23

II.4.2. Cost complexity pruning ............................................................................................ 24

II.5. Conclusion ....................................................................................................................... 25

Chapitre III Présentation des outils de simulation ................................................................ 26

III.1. Introduction .............................................................................................................. 26

III.2. ........................................................................................................ 26

III.2.1. Contraintes sur les données ..................................................................................... 26

III.2.2. Utilisation du jeu de données NSL KDD ............................................................. 26

quotesdbs_dbs28.pdfusesText_34