Un problème subsiste malgré tout : réunir les données de plusieurs sources et de diférents formats. De même, la transformation des données brutes en données exploitables pour le data mining reste une nécessité. Autant de tâches auxquelles les data scientists consacrent encore l’essentiel de leur temps. • Explorer les données.
Grâce aux solutions SAS de data mining, vous pouvez simplifier le processus de découverte et développer rapidement des modèles pour comprendre les relations essen- tielles et identifier les schémas les plus déterminants. SAS Enterprise Miner est un environnement graphique complet dédié au data mining.
Il est en outre possible d’enregistrer les ressources de déve– loppement de modèles et de scoring dans SAS® Decision Manager, environnement web centralisé de gestion du cycle de vie et de la gouvernance des ressources de modélisation provenant de SAS ou d’autres fournisseurs (outils d’analyse Open Source, notamment).
Diférentes tech- niques de modélisation (forêts aléatoires, machines à vecteurs de support, réseaux de neurones et classification) sont couplées à des fonctionnalités de préparation et d’exploration des données, et de scoring.