Le data mining ou fouille de données constitue un ensemble de méthodes exploratoires qui vont vous permettre de trouver un sens à ces données, de détecter les échantillons atypiques, les mesures aberrantes et d'identifier des groupes d'individus ou des tendances fortes.
Dans Data Mining machine learning est habituellement utilisés pour la prédiction et classification.
Machine learning se divise en deux : Apprentissage supervisé (learn by example) et apprentissage non supervisé.
Nettoyage et préparation des données.
Le nettoyage et la préparation des données constituent une étape essentielle du processus d'exploration des données. Modèles de suivi. Classification. Association. Détection des anomalies. Regroupement (clustering) Régression. Prédiction.