Les modèles statistiques n’existent pas ! (Ou vraiment pas beaucoup) Ce sont les modèles stochastiques (probabilistes) qui importent le plus. Les statistiques complètent la modélisation stochastique en détaillant par des paramètres (vecteurs, fonctions numériques) les choix précis de lois déjà adoptées.
La modélisation statistique est une manière simplifiée et formalisée mathématiquement de s’approcher de la réalité et, en d’autres termes, de décrire les processus qui génèrent vos données. De façon optionnelle, elle permet de faire des prédictions à partir de cette approximation. Le modèle statistique est l’équation mathématique utilisée.
Les méthodes de modélisation statistique sont très nombreuses et en constante évolution/amélioration. Il s’agit plutôt de démarches /méthodes que de modèles figés pour: Traiter des masses de données de plus en plus volumineuses (internet, biologie à haut débit, climat, imagerie, marketing...) 2.1. Modèles (?) préliminaires
Les noeuds modélisation statistique suivants sont disponibles. Les modèles de régression linéaire prédisent une cible continue en fonction de relations linéaires entre la cible et un ou plusieurs prédicteurs. La régression logistique est une technique statistique de classification des enregistrements sur la base des valeurs des champs d'entrée.