Le premier graphique nous informe de la distribution des résidus en fonction des valeurs prédites par le modèle de régression linéaire. Chaque point représente la distance entre la variable réponse et la réponse prédite par le modèle. Il nous informe sur l’ indépendance des résidus et sur leur distribution.
Il faut se rappeler qu’avec la régression linéaire, nous avons besoin d’une distribution uniforme des résidus (condition d’ homoscédasticité ). Sur l’axe des y nous retrouvons les résidus ϵi ϵ i et sur l’axe des x les valeurs prédites ^yi = β0 +β1 ×xi y i ^ = β 0 + β 1 × x i.
La régression linéaire multiple sont définies par les variables y y représentant la variable réponse ( continue) et x x pour les variables explicatives ( continues ou catégoriques ). La relation entre la variable réponse et les prédicteurs se définit comme pour la régression simple.
Dans le langage de programmation R, l’équation est traduite par : où la variable prédite est placée à gauche du tilde et la variable prédicteur est à droite. Effectuer une régression linéaire avec R se découpe en trois étapes: Formuler et exécuter un modèle linéaire basé sur un hypothèse