[PDF] [PDF] Ajustement dun nuage de points - Christophe Chesneau





Previous PDF Next PDF



[PDF] STATISTIQUES - maths et tiques

On reprend les données de la méthode du paragraphe I 1) Soit G1 le point moyen associé aux trois premiers points du nuage et G2 le point



[PDF] Ajustements I Nuage de points 1) Série statistique à deux variables

Le point G de coordonnées ( x ; y ) est appelé le point moyen du nuage de points associé à cette série statistique à deux variables II Ajustement affine par 



[PDF] I Nuage de points II Point moyen

Résumé n?4 : Statistiques à 2 variables 2012-2013 I Nuage de points ?? Série "double" ou série "à 2 variables" : Sur des individus d'une population 



[PDF] Ajustement dun nuage de points - Christophe Chesneau

8 jan 2018 · 1 Contexte statistique 5 2 Méthode des points observés 13 3 Méthode des points moyens 17 4 Méthode des moindres carrés



[PDF] Chapitre 2 LES NUAGES DE POINTS

Projetons le nuage de points sur la droite D Ce faisant nous construisons une statistique à une dimension dont la variable est Å On vérifie que la moyenne de 



[PDF] module 7 – le nuage statistique et la corrélation - Pages

Chaque individu est représenté par un point sur le diagramme L'ensemble des points s'appelle le nuage statistique Les échelles devraient être choisies de 



[PDF] Chapitre 4 – Analyse dun nuage de points I Inertie dun - DI ENS

C'est une mesure de la dispersion du nuage autour du point considéré Y Théorème de Huygens : I(Y) = I(G) + d2(G Y) L'inertie est donc minimale quand Y=G



[PDF] LE MODÈLE LINÉAIRE SIMPLE DONNÉES NUAGES DE POINTS Il

En figurant ainsi les N observations on obtient le nuage des points associé au couple de séries statistiques Les nuages de points associés à des séries 



[PDF] 1 Données nuages de points 2 Ajustement linéaire

une série statistique mais deux séries ou deux carac- tères enregistrés à I'intérieur d'une Les nuages de points associés à des séries statistiques



[PDF] Statistique descriptive à deux variables

La méthode consiste à partager le nuage de points en deux sous-nuages et de calculer pour chacun le point moyen G1 et G2 La droite d'ajustement est alors la 



[PDF] Ajustement dun nuage de points - Christophe Chesneau

Table des matières 1 Contexte statistique 5 2 Méthode des points observés 13 3 Méthode des points moyens 17 4 Méthode des moindres carrés



[PDF] STATISTIQUES - maths et tiques

Le point moyen G du nuage de points a pour coordonnées (13 ; 65) On peut placer ce point dans le repère Les coordonnées du point moyen G sont tel que est la 



[PDF] Ajustements I Nuage de points 1) Série statistique à deux variables

I Nuage de points 1) Série statistique à deux variables On suppose que suite à une étude faite on s'intéresse à deux caractères quantitatifs (ie deux 



[PDF] Statistiques `a deux variables

Définition 3 : On appelle point moyen d'un nuage de points le point G de coordonnées (x; y) o`u x est la moyenne de x1x2 xn et y est la moyenne de y1 



[PDF] Chapitre 2 LES NUAGES DE POINTS

Projetons le nuage de points sur la droite D Ce faisant nous construisons une statistique à une dimension dont la variable est Å On vérifie que la moyenne de 



[PDF] SÉRIES STATISTIQUES À DEUX VARIABLES - Pierre Lux

Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informations de nature qualitative



[PDF] I Nuage de points II Point moyen

Lorsque les points d'un nuage de la série statistique sont approximativement alignés on cherche une droite qui passe au plus près de tous les points Cela 



[PDF] Séries statistiques `a deux variables numériques Nuage de point

14 mai 2009 · Les droites de régression de Y en X et de X en Y passent par le point moyen du nuage de points 2 La droite de régression n'est pas modifiée 



[PDF] Série statistique à deux variables A

L'ensemble des points constitue le nuage de points associé à la série statistique double Le plus souvent on représente le nuage de points par des petites 



[PDF] module 7 – le nuage statistique et la corrélation - Pages

L'ensemble des points s'appelle le nuage statistique Les échelles devraient être choisies de sorte que la représentation d'un écart type sur l'échelle de la 

  • Comment déterminer le nuage de points ?

    Un nuage de points ou diagramme de dispersion est une représentation graphique dans un repère du plan d'une série statistique à deux variables X et Y. Chaque individu i est représenté par un point dont les coordonnées sont les valeurs respectives des variables X et Y prises par l'individu i.
  • Comment interpréter un nuage de points ?

    Le nuage de points est particulièrement utile lorsque les valeurs des variables sur l'axe des y dépendent des valeurs de la variable de l'axe des x. Dans un nuage de points, les points sont placés sans être reliés. La tendance qui en résulte indique le type et la force de la relation entre deux ou plusieurs variables.
  • Lorsque les gouttes deviennent plus grosses et plus lourdes, le nuage les libère et il pleut. La forme du nuage vous indique si vous devez vous attendre à des précipitations et quel sera leur type. La météo dépend dans une large mesure de la géographie de l'endroit où vous vous trouvez.

Université de Caen-Normandie

Ajustement d"un nuage de pointsChristophe Chesneau https://chesneau.users.lmno.cnrs.fr/Caen, le 03 Janvier 2023

Table des matières

Table des matières

1 Contexte statistique 5

2 Méthode des points observés 13

3 Méthode des points moyens 17

4 Méthode des moindres carrés 23

5 Pour s"entraîner31

6 Quelques compléments 33

Note Ce document résume les principales méthodes d"ajustement d"un nuage de points abordées dans les filières appliquées (Terminale STMG, BTS CGO, Licence 1...). Des exemples et des graphiques viennent illustrer ces méthodes. Je vous invite à me contacter pour tout commentaire : christophe.chesneau@gmail.com

Bonne lecture!C. Chesneau3

1 Contexte statistique

1 Contexte statistique

Point de départ

On souhaite prévoir et/ou expliquer les valeurs d"une variable numériqueYà partir des valeurs

d"une variable numériqueX. Pour ce faire, on dispose de données qui sontnvaleurs du couple de

variables(X;Y)notées(x1;y1);(x2;y2);:::;(xn;yn). Elles se présentent généralement sous la forme

d"un tableau :x ix1x2...xny

iy1y2...ynAinsi, quandXvautx1, on a mesuré la valeury1pourY, quandXvautx2, on a mesuré la valeury2

pourY...

Exemples

Exemple 1

. Une étude a été menée auprès de12étudiants afin d"expliquer le score à un examen de

mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque étudiant, on

dispose : du temps de révision en heures (variableX), du score obtenu sur800points (variableY).

Les résultats sont :x

i4 9 10 14 4 7 12 1 3 8 11 5y

i390 580 650 730 410 530 600 350 400 590 640 450Ainsi, avec une préparation de4heures, le premier étudiant a obtenu le score de390à l"examen, avec

une préparation de9heures, le deuxième étudiant a obtenu le score de580à l"examen...

Exemple 2

. On étudie l"évolution du nombre d"inscriptions à un jeu en ligne au cours du temps. Pour chaque mois de l"année2016, on dispose : du rang du mois (variableX; janvier est rang1, février est le rang2...), du nombre d"inscriptions en milliers (variableY).C. Chesneau5

1 Contexte statistique

Les résultats sont :

x i1 2 3 4 5 6 7 8 9 10 11 12y

i37 43 41 40 51 47 48 54 56 64 66 73Ainsi, au moins de janvier2016, il y a eut37000inscriptions au jeu, en Février2016il y a eut43000

inscriptions au jeu...

Nuage de points

Les observations peuvent être représentées sur le repère orthonormé(O;I;J)parnpoints :PointsM1M2...MnCoordonnées(x1;y1) (x2;y2)...(xn;yn)L"ensemble de ces points est appelé nuage de points. La silhouette de ce nuage de points est une

indication précieuse sur la nature de la relation entreYetX.

Ajustement affine du nuage de points

Si la silhouette du nuage de points est étirée dans une direction, une relation affine/linéaire entre

YetXest envisageable : on suppose l"existence de deux coefficients réels inconnusettels que Y=+X

plus un terme d"erreur secondaire "de valeur moyenne nulle" et "indépendant deX" représentant une

somme des petites variations aléatoires (erreurs de mesures, effets non prévisibles...). Telle est la forme

générique d"un modèle statistique connu :le modèle de régression linéaire simple. Pour toute valeurxdeX, une valeur estiméeydeYest donnée par : y=a+bx;

oùadésigne une valeur estimée deetbdésigne une valeur estimée de, toutes deux calculées à

l"aide des données.

Ainsi, à partir des valeursxdeX, estimer avec précision les valeurs deYcorrespondantes revient à

détermineraetbde sorte à ce que la droite d"équationy=a+bxajuste au mieux le nuage de points.C. Chesneau6

1 Contexte statistique

Exemples

Retour sur l"exemple 1

. Une étude a été menée auprès de12étudiants afin d"expliquer le score à un

examen de mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque

étudiant, on dispose du temps de révision en heures (variableX) et du score obtenu sur800points

(variableY). Les résultats sont :x i4 9 10 14 4 7 12 1 3 8 11 5y i390 580 650 730 410 530 600 350 400 590 640 450Le nuage de points associé est :

Par exemple, le deuxième point du nuage en partant de la gauche correspond à l"étudiant numéro9:

le pointM9correspondant est de coordonnées(3;400).

La silhouette du nuage de points est étirée dans une direction, une relation affine entreYetXest

envisageable. Ainsi, à partir des valeursxdeX, estimer avec précision les valeurs deYcorrespondantes

revient à détermineraetbde sorte à ce que la droite d"équationy=a+bxajuste au mieux le nuage

de points.C. Chesneau7

1 Contexte statistique

Après plusieurs essais graphiques "à l"oeil", en utilisant la calculatrice (ou autre), on constate que

la droite suivante ajuste "pas trop mal" le nuage de points :Ainsi, avec cette méthode "au jugé", on propose les coefficientsa= 300etb= 29;5, pour une droite

d"équation :y=a+bx. Avec cette équation, on peut alors faire des prévisions. Par exemple, une valeur

estimée du score d"un étudiant ayant consacré16heures de préparation à l"examen est : y=a+bx= 300 + 29;516 = 772:

Commentaire : Ce score est en fait une valeur estimée de la moyenne de tous les scores des étudiants

ayant fait une préparation de16heures, valeur que l"on attribue à tous ces étudiants.

Aussi, avec cet ajustement, un étudiant peut espérer avoir la moyenne, donc un score de plus de

400sur800, en ayant fait une préparation de plus dexheures, avecxvérifiant :

y400,300 + 29;5x400,x40030029;5= 3:389831:C. Chesneau8

1 Contexte statistique

Retour sur l"exemple 2

. On étudie l"évolution du nombre d"inscriptions à un jeu en ligne au cours du temps. Pour chaque mois de l"année2016, on dispose du rang du mois (variableX; janvier est rang1,

février est le rang2...) et du nombre d"inscriptions en milliers (variableY). Les résultats sont :x

i1 2 3 4 5 6 7 8 9 10 11 12y i37 43 41 40 51 47 48 54 56 64 66 73Le nuage de points associé est :

Par exemple, le quatrième point du nuage en partant de la gauche correspond au rang4Avril : le point

M

4correspondant est de coordonnées(4;40).

La silhouette du nuage de points est étirée dans une direction, une relation affine entreYetXest

envisageable. Ainsi, à partir des valeursxdeX, estimer avec précision les valeurs deYcorrespondantes

revient à détermineraetbde sorte à ce que la droite d"équationy=a+bxajuste au mieux le nuage

de points.C. Chesneau9

1 Contexte statistique

De nouveau, après plusieurs essais graphiques "à l"oeil", en utilisant la calculatrice (ou autre), on

constate que la droite suivante ajuste "pas trop mal" le nuage de points :Ainsi, avec cette méthode "au jugé", on propose les coefficientsa= 35etb= 2;5, pour une droite

d"équation :y=a+bx. Avec cette équation, on peut alors faire des prévisions. Par exemple, au rang13

correspondant au mois de janvier2017, une valeur estimée du nombre d"inscriptions au jeu en milliers

est : y=a+bx= 35 + 2;513 = 67;5: Ainsi, en janvier2017, on prévoit67500inscriptions. Aussi, avec cet ajustement, on peut espérer que le nombre d"inscriptions au jeu dépasse80000au rangx, avecxvérifiant : y80,35 + 2;5x80,x80352;5= 18:

Cela correspond à Juin2017.C. Chesneau10

1 Contexte statistique

Méthodes

La méthode "au jugé" dépend de l"utilisateur et donne donc des prévisions subjectives; le choix de

aetbne repose sur aucun socle théorique. Plusieurs autres méthodes existent. Il y a notamment :

la méthode des points observés, la méthode des points moyens, la méthode des moindres carrés.

Ces méthodes amènent des estimations deaetbdifférentes. Elle sont présentées ci-après.C. Chesneau11

2 Méthode des points observés

2 Méthode des points observés

Résultat central : Équation d"une droite passant par deux points SoientAetBdeux points sur le repère orthonormé(O;I;J)de coordonnées respectives(xA;yA) et(xB;yB). Alors la droite passant par les pointsAetBa pour équationy=a+bx, avec b=yByAx

BxA; a=yAbxA:

Méthode des points observés

La méthode des points observés propose d"ajuster le nuage de points par une droite passant par le

pointMjde coordonnées(xj;yj)et le pointMkde coordonnées(xk;yk)choisis parmiM1;M2;:::;Mn.

Cette droite est d"équationy=a+bx, avec

b=ykyjx kxj; a=yjbxj: Une idée est de choisirMjetMktels que la droite qui y passent ajuste "visiblement bien" le nuage de points.

Méthode des points extrêmes

La méthode des points extrêmes est un cas particulier de la méthode des points observés. Elle

propose d"ajuster le nuage de points par une droite passant par le pointMjsitué le plus à gauche et

le pointMksitué le plus à droite.

Exemples

Retour sur l"exemple 1

. Une étude a été menée auprès de12étudiants afin d"expliquer le score à un

examen de mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque

étudiant, on dispose du temps de révision en heures (variableX) et du score obtenu sur800points

(variableY). Les résultats sont :x i4 9 10 14 4 7 12 1 3 8 11 5y i390 580 650 730 410 530 600 350 400 590 640 450C. Chesneau13

2 Méthode des points observés

La méthode des points extrêmes propose la droite suivante :

On a alors considéré le point situé le plus à gauche du nuage de points et le point situé le plus à droite.

Le premier point étantM8de coordonnées(1;350)et le deuxième point étantM4de coordonnées

(14;730). En utilisant ces coordonnées, l"équation de la droite esty=a+bx, avec b=730350141= 29;23077; a= 35029;230771 = 320;7692:

Avec cette équation, on peut alors faire des prévisions. Par exemple, une valeur estimée du score d"un

étudiant ayant consacré16heures de préparation à l"examen est : y=a+bx= 320;7692 + 29;2307716 = 788;4615: Ainsi, on prévoit un score de789pour un tel étudiant.

Retour sur l"exemple 2

. On étudie l"évolution du nombre d"inscriptions à un jeu en ligne au cours du temps.C. Chesneau14

2 Méthode des points observés

Pour chaque mois de l"année2016, on dispose du rang du mois (variableX; janvier est rang1,

février est le rang2...) et du nombre d"inscriptions en milliers (variableY). Les résultats sont :x

i1 2 3 4 5 6 7 8 9 10 11 12y

i37 43 41 40 51 47 48 54 56 64 66 73La méthode des points extrêmes propose la droite suivante :

On a alors considéré le point situé le plus à gauche du nuage de points et le point situé le plus à droite.

Le premier point étantM1de coordonnées(1;37)et le dernier point étantM12de coordonnées(12;73).

En utilisant ces coordonnées, l"équation de cette droite esty=a+bx, avec b=7337121= 3;272727; a= 373;2727271 = 33;72727:C. Chesneau15

2 Méthode des points observés

Avec cette équation, on peut alors faire des prévisions. Par exemple, au rang13correspondant au

mois de janvier2017, une valeur estimée du nombre d"inscriptions au jeu en milliers est : y=a+bx= 33;72727 + 3;27272713 = 76;27272: Ainsi, on prévoit76500inscriptions en janvier2017.C. Chesneau16

3 Méthode des points moyens

3 Méthode des points moyens

Point moyen

Le point moyen d"un ensemble de points est un pointGde coordonnées la moyenne des coordonnées des points de cet ensemble. Par exemple, le point moyen du nuage de points formé deM1;M2;:::;Mn

(de coordonnées respectives(x1;y1);(x2;y2);:::;(xn;yn)) est le pointGde coordonnées(x;y), oùxetydésignent les moyennes :x=1n

n X i=1x i;y=1n n X i=1y i: Méthode des points moyens (ou méthode de Mayer) La méthode des points moyens propose d"ajuster le nuage de points par une droite passant par les deux points moyensG1etG2de deux ensembles de points du nuage, l"un formé des points les plus à

gauche, et l"autre formé des points les plus à droite. Ainsi, ces deux ensembles forment une partition

du nuage de points et contiennent le même nombre de points (plus un pour l"un sinest impair).

Ainsi, pourG1de coordonnées(x

1;y

1)etG2de coordonnées(x

2;y

2), la méthode des points moyens

propose la droite d"équationy=a+bx, avec b=y 2y 1x 2x

1; a=y

1bx 1:

Exemples

Retour sur l"exemple 1

. Une étude a été menée auprès de12étudiants afin d"expliquer le score à un

examen de mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque

étudiant, on dispose du temps de révision en heures (variableX) et du score obtenu sur800points

(variableY). Les résultats sont :x i4 9 10 14 4 7 12 1 3 8 11 5y i390 580 650 730 410 530 600 350 400 590 640 450C. Chesneau17

3 Méthode des points moyens

La méthode des points moyens propose la droite suivante :

On a alors considéré deux ensembles de points du nuage. L"un est formé des points les plus à gauche

(en bleue) :M

8M9M1M5M12M6(1;350) (3;400) (4;390) (4;410) (5;450) (7;530)

L"autre est formé des points les plus à droite (en vert) : M

10M2M3M11M7M4(8;590) (9;580) (10;650) (11;640) (12;600) (14;730)

On a déterminé les points moyensG1etG2de ces ensembles.C. Chesneau18

3 Méthode des points moyens

Ainsi,G1est de coordonnées :

(x 1;y

1) =1 + 3 + 4 + 4 + 5 + 76

;350 + 400 + 390 + 410 + 450 + 5306 = (4;421;6667) etG2est de coordonnées : (x 2;y

2) =8 + 9 + 10 + 11 + 12 + 146

;590 + 580 + 650 + 640 + 600 + 7306 = (10;66667;631;66667): En utilisant ces coordonnées, l"équation de la droite passant parG1etG2esty=a+bx, avec b=631;66667421;666710;666674= 31;5; a= 421;666731;54 = 295;6667:

Avec cette équation, on peut alors faire des prévisions. Par exemple, une valeur estimée du score d"un

étudiant ayant consacré16heures de préparation à l"examen est : y=a+bx= 295;6667 + 31;516 = 799;6667: Ainsi, on prévoit un score de800pour un tel étudiant.

Retour sur l"exemple 2

. On étudie l"évolution du nombre d"inscriptions à un jeu en ligne au cours du temps. Pour chaque mois de l"année2016, on dispose du rang du mois (variableX; janvier est rang1,

février est le rang2...) et du nombre d"inscriptions en milliers (variableY). Les résultats sont :x

i1 2 3 4 5 6 7 8 9 10 11 12y i37 43 41 40 51 47 48 54 56 64 66 73C. Chesneau19

3 Méthode des points moyens

La méthode des points moyens propose la droite suivante :

On a alors considéré deux ensembles de points du nuage. L"un est formé des points les plus à gauche

(en bleue) :M

1M2M3M4M5M6(1;37) (2;43) (3;41) (4;40) (5;51) (6;47)

L"autre est formé des points les plus à droite (en vert) : M

7M8M9M10M11M12(7;48) (8;54) (9;56) (10;64) (11;66) (12;73)

On a déterminé les points moyensG1etG2de ces ensembles.C. Chesneau20

3 Méthode des points moyens

Ainsi,G1est de coordonnées :

(x 1;y

1) =1 + 2 + 3 + 4 + 5 + 66

;37 + 43 + 41 + 40 + 51 + 476 = (3;5;43;16667) etG2est de coordonnées : (x 2;y

2) =7 + 8 + 9 + 10 + 11 + 126

;48 + 54 + 56 + 64 + 66 + 736 = (9;5;60;16667): En utilisant ces coordonnées, l"équation de la droite passant parG1etG2esty=a+bx, avec b=60;1666743;166679;53;5= 2;833333; a= 43;166672;8333333;5 = 33;25:

Avec cette équation, on peut alors faire des prévisions. Par exemple, au rang13correspondant au mois

de janvier2017, une valeur estimée du nombre d"inscriptions au jeu en milliers est : y=a+bx= 33;25 + 2;83333313 = 70;08333: Ainsi, on prévoit70080inscriptions en janvier2017.C. Chesneau21

4 Méthode des moindres carrés

4 Méthode des moindres carrés

Méthode des moindres carrés

La méthode des moindres carrés propose d"ajuster le nuage de points par une droite d"équation

y=a+bx, avecaetbqui rendent minimale la somme des carrés :nX i=1(yi(a+bxi))2. Cette droite, que l"on suppose unique, est appelée droite de régression.

L"idée de cette méthode est de déterminer une droite qui minimise une mesure totale des écarts

entre les points du nuage et les points de mêmes abscisses se trouvant sur la droite. Ainsi, plus cette

mesure est petite, plus la droite est proche de tous les points du nuage, meilleur est l"ajustement.

Illustration

Dans le graphique ci-dessous, chaque segment violet relie un point du nuage et le point de même abscisse se trouvant sur la droite d"équationy=a+bx:C. Chesneau23

4 Méthode des moindres carrés

Ainsi, pour touti2 f1;:::;ng, lei-ème segment relie le pointMide coordonnées(xi;yi)et le point P ide coordonnées(xi;a+bxi). La longueur de ce segment correspond à la distancedi=jyi(a+bxi)j. On cherche donc à minimiser la somme des carrés de ces distances : nX i=1d 2i.

Notations

quotesdbs_dbs42.pdfusesText_42
[PDF] exercice covariance statistique corrigé

[PDF] psychologie et pédagogie jean piaget

[PDF] pédagogie et éducation différence

[PDF] spallation cosmique

[PDF] nucléosynthèse primordiale

[PDF] la personne que j'admire le plus est ma mere

[PDF] nucléosynthèse des éléments chimiques

[PDF] nucléosynthèse interstellaire

[PDF] nucléosynthèse dans les étoiles

[PDF] nucléosynthèse explosive

[PDF] nucléosynthèse stellaire pdf

[PDF] recettes du 18ème siècle

[PDF] menu du 19 siecle

[PDF] menu au 18eme siecle

[PDF] alfred de musset la nuit de mai le pélican analyse