En effet, les seuils de qualité des données pour la fouille de données sont bien plus élevés que ceux pour les utilisations habituelles d’un entrepôt de données. Par exemple, il est nécessaire de passer les données en revue à la recherche des valeurs nulles qui sont inacceptables dans le cadre de certaines techniques d’analyse.
La fouille de données doit être organisée selon cinq étapes consécutives : identification des problèmes de l’activité, préparation de l’architecture, préparation des données, analyse et livraison des connaissances. Durant la première étape, il convient d’identifier, de préciser et de qualifier les questions pour la fouille de données.
▶L’analyse et la fouille de donnéesest un des traitements. ▶Analyse et fouille de données = data mining ▶Ensemble des techniques d’exploration de données permettant d’extraire des connaissances sous la forme de modèles de descriptionafin de : ▶Décrirele comportement actuel des données. ▶Et/ouPrédirele comportement futur des données.
La fouille de données : panorama des méthodes fouille de données méthodes prédictives méthodes descriptives 6 / 79 La fouille de données : panorama des méthodes méthodes prédictives classification supervisée prédire Y quali. régression prédire Y quanti. méthodes descriptives détections de liens recherche d’associations analyse factorielle