[PDF] Statistiques en Scilab 2.1 Modalités. Dé





Previous PDF Next PDF



Statistique Descriptive - Lexique

03.11.2011 divisent une série statistique en 100 parties d'effectifs égaux. ... modalités ou classes d'une variable statistique et des effectifs ou.



Cours de statistique descriptive - Archive ouverte HAL

02.08.2016 et à comparer des « séries statistiques ». ... Les modalités d'une variable qualitative sont les différentes catégories d'une nomenclature.



1. Mode - Classe modale 2. Médiane - Classe médiane

Une série statistique peut avoir plusieurs modes ou classes modales. Le mode ou la classe modale désigne l'endroit ùla répartilion est la plus dense et 



Paramètres statistiques

Pour chaque modalité mi l'effectif associé est ni



Paramètres statistiques

279. ! La moyenne n'est pas nécessairement une modalité. La moyenne de X est le nombre qui approche le mieux la série statistique.



La série ci-dessus concerne les notes de 20 étudiants. On souhaite

Une variable statistique peut présenter des modes locaux (modalités dont la fréquence est supérieure ou égale aux fréquences adjacentes). Cette situation est 



Statistiques en Scilab

2.1 Modalités. Définition 2.1 : Modalités. Les valeurs prises par une variable X s'appellent les modalités de X. Définition 2.2 : Série statistique.



Statistiques descriptives et exercices

4.1 Représentation des séries statistiques à deux variables . Les modalités d'une variable statistique sont les différentes valeurs que peut prendre.



1 Chapitre 03 : Etude dune variable statistique continue

ceux qui ont une infinité de modalités). Question : Comment étudier ce caractère ? Réponse : Partager les valeurs prises par X en classes de valeurs.



Statistiques en Scilab

Série statistique à deux variables nuage de points associé. Les valeurs prises par une variable X s'appellent les modalités de X.



[PDF] Séries Statistiques Simples - EcoFoG

Séries statistiques simples 2 1 Moyenne arithmétique 2 2 Mode Classe modale 2 3 Effectifs Fréquences cumulées 2 4 Médianes



[PDF] STATISTIQUE DESCRIPTIVE

Dans le cas d'une variable statistique continue on parle plutôt de classe modale NB : Le mode ou la classe modale n'est pas obligatoirement unique 3 1 2 La 



[PDF] Statistiques descriptives et exercices

Les valeurs des variables sont aussi appelées modalités 6 Pour une variable qualitative chaque individu statistique ne peut avoir qu'une seule modalité 7



[PDF] Résumé du Cours de Statistique Descriptive - UniNE

15 déc 2010 · Les valeurs possibles de la variable sont appelées modalités On appelle série statistique la suite des valeurs prises par une variable 



[PDF] Les paramètres statistiques de centralité

Une série numérique peut être résumée par deux paramètres statistiques : - le centre d'une distribution des valeurs représentant leur tendance d'ensemble;



[PDF] Séries regroupées par modalités - Unemainlavelautre

Les modalités d'une série statistiques sont les valeurs différentes de la série À la série des modalités sont associées les séries des effectifs (ou 



[PDF] Statistique Descriptive

19 août 2020 · C'est une variable dont les modalités prennent des valeurs numériques Exemple: le salaire mensuel d'un fonctionnaire On peut distinguer deux 



[PDF] STATISTIQUES - Pierre Lux

On détermine ainsi trois séries statistiques à une variable B ) VARIABLE OU CARACTERE Un caractère est quantitatif si les modalités sont des nombres



[PDF] SUPPORT DE FORMATION EN STATISTIQUE DESCRIPTIVE

La façon la plus simple de présenter de façon synthétique une série statistique est un tableau présentant en face de chaque modalité le nombre d'individus 



[PDF] 1 Mode - Classe modale 2 Médiane

Une série statistique peut avoir plusieurs modes ou classes modales Le mode ou la classe modale désigne l'endroit ùla répartilion est la plus dense et 

Séries statistiques simples. 2.1 Moyenne arithmétique. 2.2 Mode & Classe modale. 2.3 Effectifs & Fréquences cumulées. 2.4 Médianes.Questions associées
  • Quelles sont les modalités d'une série statistique ?

    Modalité : Les modalités d'une variable qualitative sont les différentes valeurs que peut prendre celle-ci. Par exemple les modalités de la variable "situation familiale" sont : célibataire, marié, veuf, divorcé. Les modalités de la variable "sexe" sont : féminin, masculin (pouvant être codées par exemple 0 et 1).
  • Comment déterminer la modalité en statistique ?

    Mode : La valeur la plus fréquente d'une série statistique — C'est la (ou les) valeur(s) du caractère dont l'effectif est le plus grand. Exemple : le mode de la série {4 , 2, 4, 3, 2, 2} est 2 car il apparaît trois fois.
  • Comment déterminer la modalité ?

    Le mode de la classe modale est donc donné par : Mod=48+(99+12)?, soit 49,3 au dixième près. Ce qui est assez près de la valeur centrale de la classe modale qui est 49,5.
  • Modalités d'un caractère
    est une modalité possible du caractère population, même si aucun élément de l'ensemble observé ne prend cette valeur. Les modalités d'un caractères doivent être à la fois : incompatibles : un élément ne doit pas correspondre à plus d'une seule modalité d'un caractère.
Statistiques en Scilab

Statistiques en Scilab

Table des matières

1 Vocabulaire des statistiques 2

2 Statistique descriptive univariée 2

2.1 Modalités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

2.2 Dénombrement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

2.2.1 Effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

2.2.2 Fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

2.3 Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2.4 Paramètres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.4.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.4.2 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.4.3 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

2.4.4 Quartile, décile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.4.5 Etendue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.4.6 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.4.7 Ecart type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

3 Statistique descriptive bivariée 11

3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

3.2 Covariance et corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

3.3 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

3.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

3.3.2 Problème des moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13 1

1 Vocabulaire des statistiques

Définition 1.1 :Population, individu, effectifL"ensemble des élémentsΩ ={ω1,ω2,...,ωN}dont on étudie les données s"appellepopulation, ses

éléments sont appelés individus. Le cardinalNdeΩest l"effectifde la population. Définition 1.2 :EchantillonUn échantillonest la portion de population servant à l"étude.

Exemple 1.

Une étude sur la population française en âge de travailler peut s"effectuer sur un échantillon de

100 000 français (exemple : enquête emploi INSEE).Définition 1.3 :VariableUne variable(ou caractère) est une applicationXdéfinie surΩ.

•SiXest à valeurs réelles,Xest une variable quantitative. •SinonXest une variable qualitative.

Exemple 2.On a :

La taille des habitants d"un pays donné ou les notes obtenues à une épreuve de concours par des

candidats sont des variables quantitatives. •La couleur des yeux des habitants d"un pays donné est une variable qualitative.

2 Statistique descriptive univariée

2.1 ModalitésDéfinition 2.1 :ModalitésLes valeurs prises par une variableXs"appellent les modalitésdeX.Définition 2.2 :Série statistiqueLa liste des valeurs prises (des modalités) parXest une série statistique:

[x1,x2,...,xN]avecxi=X(ωi).Remarque 2.3 :Série ordonnéeUne série ordonnéeest une série statistique telle que

Remarque 2.4 :Série dépouilléeSi certaines valeurs d"une série ordonnée sont égales, on peut grouper les valeurs égales, notons-les

série dépouillée. Exemple 3.Une série statistique "brute"modalitésxi7285251055747287

La même série ordonnée

modalitésxi2224555577778810

La même série dépouillée

modalitésyi2457810 effectifsni314421

2.2 Dénombrement

2.2.1 EffectifsDéfinition 2.5 :EffectifL"effectifde la modalitéxiest le nombrenid"individus de cette modalité.Calculer l"effectif d"une modalité : la fonction tabul

Méthode 2.6 :Comment calculer l"effectif d"une modalité?

On utilise la fonctiontabul(x)qui ordonne la sériexdans l"ordre décroissant et donne l"effectif de chaque

modalité de la série.Exemple 4.En reprenant le même exemple : --> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> m=tabul(x) m =

10. 1.

8. 2. 7. 4. 5. 4. 4. 1. 2. 3.

--> bar(m(:,1),m(:,2)) // on trace le diagramme en bâtons correspondant à la série dépouillée.

3

m(:,1)(la première colonne du vecteurm) donne les abscisses, ce sont les valeurs des modalités.

m(:,2)(la deuxième colonne du vecteurm) donne les ordonnées, ce sont les effectifs.Remarque 2.7 :Classer dans l"ordre croissantPar défaut le classement se fait dans l"ordre décroissant. On écrittabul(x,"i")pour classer la série dans

l"ordre croissant ("i"comme increasing). --> m=tabul(x,"i") m = 2. 3. 4. 1. 5. 4. 7. 4. 8. 2.

10. 1.Définition 2.8 :Effectif cumulé

L"effectif cumuléd"une modalité est la somme des effectifs des modalités qui lui sont inférieures ou égales.2.2.2 Fréquences

Définition 2.9 :FréquenceLa fréquencedexiest le réel f i=niN

SiXprendpvaleurs distinctes, alorsp?

i=1f i= 1.4

Définition 2.10 :Fréquence cumuléeLafréquence cumuléed"une modalité est la somme des fréquences des modalités qui lui sont inférieures

ou égales. Pour une série ordonnée, on peut écrire p i=?

j.Remarque 2.11 :Important : lien avec les probabilitésLes notions suivantes se correspondent en probabilités et en statistiques :

Xvariable aléatoireXvariable statistiqueprobabilitéP(X=xi)fréquencefifonction de répartitionFXfréquence cumuléepiMéthode 2.12 :Comment calculer l"effectif cumulé ou la fréquence cumulée?On utilise la fonctionsumetcumsum.Exemple 5.On reprend la série précédente.

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> m=tabul(x,"i") // on utilise la fonction tabul pour ordonner la série m = 2. 3. 4. 1. 5. 4. 7. 4. 8. 2.

10. 1.

--> effc=cumsum(m(:,2)) // on effectue la somme cumulée de la 2e colonne de m pour obtenir l"effectif cumulé effc = 3. 4. 8. 12. 14. 15. --> frec=effc/sum(m(:,2)) // on divise l"effectif cumulée par l"effectif de la population totale frec = 0.2

0.2666667

0.5333333

0.8

0.9333333

1.Remarque 2.13 :Rappel !m(:,2)renvoie la deuxième colonne dem.

m(:,1)renvoie la première colonne dem. m(1,:)renvoie la première ligne dem. m(5,:)renvoie la cinquième ligne dem.5 Remarque 2.13 :Rappel !m(:,2)renvoie la deuxième colonne dem. m(:,1)renvoie la première colonne dem. m(1,:)renvoie la première ligne dem. m(5,:)renvoie la cinquième ligne dem.2.3 Classes

Définition 2.14 :ClassesLorsque le nombre de valeurs prises parXest trop grand, on regroupe les modalités par intervalles,

appelés classesde la série. On dit alors que la série est groupée par classes.

Remarque 2.15

Scilab

permet de choisir les extrémités de chaque classe, ainsi que le nombre de classes. Par exemple, en

prenantc1,c2,...,cq,cq+1, on considèreqclasses [c1,c2],]c2,c3], ...]cq,cq+1]

La première est un intervalle fermé, les autres sont des intervalles ouverts à gauche et fermés à droite.Définition 2.16 :Amplitude d"une classeLe réelci+1-ciest l"amplitudede la classe]ci,ci+1].Exemple 6.On reprend l"exemple précédent. On groupe cette série statistique par classes.classes[2,4]]4,6]]6,8]]8,10]

effectifs4461

Grouper une série brute : la fonction dsearch

Méthode 2.17 :Comment grouper par classes une série brute? On utilise les fonctionslinspaceetdsearchpour grouper par classes une série brute. La fonction linspacepermet de déterminer l"amplitude commune de chaque classe etdsearchrenvoie le nombre de modalités présentes dans chacune de ces classes.Exemple 7.Reprenons le même exemple. --> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> c=linspace(2,10,5) // on découpe l"intervalle [2,10] en 4 intervalles c =

2. 4. 6. 8. 10.

--> histplot(c,x) // on trace l"histogramme correspondant. 6 --> [ind,occ]=dsearch(x,c) occ =

4. 4. 6. 1.

ind =

3. 1. 3. 2. 1. 2. 4. 2. 2. 3. 1. 3. 1. 3. 3.

occretourne le nombres d"éléments dans chaque classe.

indretourne le numéro de la classe dans laquelle se trouve chaque élément dex. Dans cet exemple, on affecte

la valeur1aux éléments dans l"intervalle[2,4], la valeur2aux éléments dans l"intervalle]4,6], la valeur3

aux éléments dans l"intervalle]6,8]....

2.4 Paramètres

2.4.1 ModeDéfinition 2.18 :Mode

On appellemoded"une série statistique toute valeur de la variable correspondant au plus grand effectif (il

peut donc y en avoir plusieurs).Exemple 8.Pour la série, [7285251055747287] 5

et7sont les modalités aux plus grands effectifs (4 fois chacun).5et7sont les modes de cette série

statistique.

2.4.2 MoyenneDéfinition 2.19 :MoyenneOn appelle

X=1N N i=1x i.7 X=1N p i=1n

iyi.Méthode 2.21 :Comment calculer la moyenne d"une série statistique?On utilise la fonctionmean.Exemple 9.La série de notre exemple a pour moyenne :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> m=mean(x) m = 5.6 cumulée est égale à12 .Remarque 2.23 La médiane partage la série en deux séries d"effectifs égaux.

Méthode 2.24 :Comment calculer la médiane d"une série statistique?On utilise la fonctionmedian.Exemple 10.La série de notre exemple a pour médiane :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> M=median(x) M = 5 8

2.4.4 Quartile, décile

Définition 2.25 :QuartileUnquartileest chacune des3valeurs qui divisent les données triées en4parts égales, de sorte que chaque

partie représente1/4de l"échantillon de population.

Lepremier quartile, notéq1, est la plus petite valeur telle qu"au moins25%des termes de la série

soient inférieurs ou égaux àq1. Le deuxième quartil eest la médiane de la série.

Letroisième quartile, notéq3, est la plus petite valeur telle qu"au moins75%des termes de la série

soient inférieurs ou égaux àq3.Méthode 2.26 :Comment calculer les quartiles d"une série statistique?On peut utiliser la fonctionquart, mais il faut faire attention car celui-ci peut donner un calcul erroné.Exemple 11.La série de notre exemple a pour quartiles :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> quart(x) ans =

4.25 // Scilab devrait renvoyer 4 mais donne ici un calcul suivant la

//définition internationale qui diffère de la définition francaise. 5.

7.Définition 2.27 :Ecart interquartile

Le nombreq3-q1est appeléécart interquartile(l"idée est de mettre en valeur l"écart entre les 2 quarts

de la population correspondant aux valeurs extrêmes de la série).Exemple 12.Pour notre série, l"écart interquartile est7-4=3.Définition 2.28 :Décile

On appellekèmedéciled"une série statistique, le réel correspondant à10k%des fréquences cumulées (le

5èmedécile est donc la médiane de la série).Exemple 13.Pour notre série, le neuvième décile est8.

2.4.5 EtendueDéfinition 2.29 :Etendue

On appelleétendued"une série statistique la différence entre la plus grande modalité et la plus petite

modalité.9

Méthode 2.30 :Comment calculer l"étendue d"une série statistique?On utilise les fonctionsmaxetmin.Exemple 14.La série de notre exemple a pour étendue :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> max(x)-min(x) ans = 8.

V(X) =1N

N i=1? x i-¯X?

2.Remarque 2.32

V(X) =1N

p i=1n i? y i-¯X?

2Méthode 2.33 :Comment calculer la variance d"une série statistique?On utilise la fonctionvariance.Exemple 15.La série de notre exemple a pour variance :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> V=variance(x) V =

5.8285714Attention, la variance calculée avec1N

N i=1? x i-¯X?

2donne5.44. Avec la fonctionvariance,Scilabcalcule

1N-1N i=1? x i-¯X?

2qui est la variance empirique, on verra plus tard que c"est un estimateur sans biais de

la variance de la population entière. 10

2.4.7 Ecart type

Définition 2.34 :Ecart typeOn appelleσXl"écart typed"une série statistique

X=?V(X).Méthode 2.35 :Comment calculer l"écart type d"une série statistique?On utilise la fonctionstdev.Exemple 16.La série de notre exemple a pour écart type :

--> x=[7 2 8 5 2 5 10 5 5 7 4 7 2 8 7]; --> ec=stdev(x) ec =

2.4142434Attention, de même que pour la variance, l"écart type calculée parScilabest la racine carrée devariance(x),

ce qui diffère de l"écart type de l"échantillon observé.

3 Statistique descriptive bivariée

3.1 DéfinitionDéfinition 3.1 :Série statistique double

Soient un échantillonΩ ={ω1,ω2,...,ωn}et deux séries statistiquesX= [x1,x2,...,xn]et

Y= [y1,y2,...,yn]. On appelle série statistique doublela donnée de la liste [(x1,y1),(x2,y2),...,(xn,yn)],

chaque couple(xi,yi)étant associé à un seul individuωide la population.Remarque 3.2 :Objectif

C"est le recueil simultané des modalités de deux variablesXetYchez les mêmes sujets. L"intérêt se porte

le plus souvent sur la relation entre les deux variables : la recherche de corrélation.Exemple 17.On mesure le poidsXet la tailleYde10individus.modalitésxi60646870727578859698

11

3.2 Covariance et corrélation

Définition 3.3 :Covariance empiriqueOn appelle covariance empiriquede la série statistique double(xi,yi)i?[[1,n]]le réel :

Cov(X,Y) =1n

n i=1? x i-¯X?? y i-¯Y?

.Définition 3.4 :Coefficient de corrélation empiriqueLe coefficient de corrélation empiriquede la série(xi,yi)i?[[1,n]]est le réel :

X,Y=Cov(X,Y)σ

XσY.

Le coefficient de corrélation empirique mesure la dépendance linéaire entre deux variables. •S"il est proche de1ou-1, alorsXetYsont fortement corrélés.

•S"il est proche de0, alorsXetYsont faiblement corrélés (voire ne le sont pas).Méthode 3.6 :Comment calculer la covariance empirique et le coefficient de corrélation empirique?On utilise la fonctioncorr(X,Y,1)pour calculer la covariance empirique deXetY. Afin de calculer le

coefficient de corrélation empirique, il suffit de diviser la covariance empirique deXetYpar l"écart-type

deXet celui deY.Exemple 18.On reprend la série précédente.modalitésxi60646870727578859698

--> x=[60 64 68 70 72 75 78 85 96 98]; --> y=[155 157 164 170 178 180 173 179 180 189]; --> corr(x,y,1) ans = 109.2
--> corr(x,y,1)/stdev(x)/stdev(y) ans =

0.7758334

12

3.3 Ajustement linéaire

3.3.1 DéfinitionDéfinition 3.7 :Nuage de pointsOn appellenuage de pointsd"une série statistique double, l"ensemble des pointsMide coordonnées

(xi,yi).Définition 3.8 :Point moyenOn appelle point moyen du nuage, le point de coordonnées ?¯X,¯Y? .Méthode 3.9 :Comment tracer un nuage de points? On construit les vecteursxetyde même taille, puis on utilise la commandeplot2d(x,y,style=Z)oùZ est une des valeurs suivantes :-6-5-4-3-2-1012345

M?×+·noirbleu foncévertbleu clairrouge

Exemple 19.Avec la série des exemples précédents, --> x=[60 64 68 70 72 75 78 85 96 98]; --> y=[155 157 164 170 178 180 173 179 180 189]; --> plot2d(x,y,style=-3) --> plot2d(mean(x),mean(y),style=-4) // point moyen du nuage3.3.2 Problème des moindres carrés

Si le nuage de points associé à une série statistique double possède une forme étirée, on peut avoir l"idée

de chercher quelle droite approcherait au mieux les points de ce nuage.

Le problème consiste donc à identifier une droitey=ax+bqui ajuste bien le nuage de points. L"erreur

que l"on commet en utilisant la droite de régression pour prédireyià partir dexiestyi-(axi+b).

13

Pour déterminer la valeur des coefficientsaetb, on utilise le principe des moindres carrés qui consiste à

chercher la droite qui minimise la somme des carrés de ces erreurs : n i=1(yi-axi-b)2.Proposition 3.10 :Droite de régression linéaireL"unique droite rendant minimale n? i=1(yi-axi-b)2est la droite d"équation

Cette droite est appeléedroite de régression linéairedeYenX. On dit queXest lavariable explicativeet

Yla variable expliquée.

Démonstration.

Le minimum de la fonctionF(a,b) =

n? i=1 (yi-axi-b)2correspond au point où les dérivées partielles s"annulent. D"après les formules de Huygens, commeCov(X,Y) =1n n i=1x iyi-¯X¯YetV(X) =1n n i=1x2i-¯X2, alors ∂F∂a (a,b) = 2n? i=1x i(yi-axi-b) = 2n? i=1x iyi-2an? i=1x2i-2bn? i=1x i = 2n??

Cov(X,Y) +¯X¯Y?

-a?

V(X) +¯X2?

-b¯X? ∂F∂b (a,b) =-2n? i=1(yi-axi-b) =-2n?¯Y-a¯X-b? 14 Ainsi le point(a?,b?)oùFatteint son minimum vérifie le système suivant ?0 =?

Cov(X,Y) +¯X¯Y?

-a??

V(X) +¯X2?

-b?¯X, 0 =

¯Y-a?¯X-b?.

?0 =?

Cov(X,Y) +¯X¯Y?

-a??

V(X) +¯X2?

-?¯Y-a?¯X?¯X, b ?=¯Y-a?¯X. ?0 =Cov(X,Y)-a?V(X), b ?=¯Y-a?¯X.?? ?a ?=Cov(X,Y)V(X), b ?=¯Y-a?¯X.

Ainsiy=Cov(X,Y)V(X)x+?

¯Y-Cov(X,Y)V(X)¯X?

=Cov(X,Y)V(X)? x-¯X?

+¯Y .Propriété 3.11 :Point moyen et droite de régression linéaireLes droites de régression linéaire passent par le point moyen.

Proposition 3.12 :Lien avec le coefficient de corrélation empiriquePlus|ρX,Y|est proche de1, plus les points sont proches de l"alignement et plus les prévisions données par

les droites de régression sont pertinentes.|ρX,Y|ne valant1que lorsque les points du nuage sont alignés.Démonstration.

En effet, on rappelle queF(a,b) =

n? i=1 (yi-axi-b)2permet de calculer la distance du nuage de points à la droite de régression pour une droitey=ax+bdonné,

F(a,b) =n?

i=1? y2i+ (axi)2+b2-2axiyi-2yib+ 2abxi?

On utilise le fait queCov(X,Y) =1n

n i=1x iyi-¯X¯YetV(X) =1n n i=1x2i-¯X2.

F(a?,b?) =n?

V(Y) +¯Y2+a?2(V(X) +¯X2) +b?2?

+ 2n? -a??

Cov(X,Y) +¯X¯Y?

-b?¯Y+a?b?¯X? =n??

V(Y) +¯Y2+a?2(V(X) +¯X2) +?¯Y-a?¯X?

2? + 2 -a??

Cov(X,Y) +¯X¯Y?

=n?V(Y) +¯Y2+a?2(V(X) +¯X2) +¯Y2+a?2¯X2-2¯Y a?¯X -2a?Cov(X,Y)-2a?¯X¯Y-2¯Y2+ 2a?¯X¯Y+ 2a?¯Y¯X-2a?2¯X2? =n?a?2V(X)-2a?Cov(X,Y) +V(Y)? =n?

V(Y)-Cov(X,Y)2V(X)?

cara?=Cov(X,Y)V(X) =nV(Y)?

1-ρ2X,Y?

Plus|ρX,Y|est proche de1, plusF(a?,b?)est petit et donc le nuage de points est proche de la droite de

régression.15

Remarque 3.13 :Sens de variation suivant le coefficient de corrélation empiriqueSiρX,Y>0(respectivementρX,Y<0), alors les droites sont de pente positive (resp. négative) :XetY

varient dans le même sens (resp. en sens opposé).Méthode 3.14 :Comment tracer la droite de régression linéaire?On trace une droite à l"aide de la fonctionplot2d.Exemple 20.Avec la série des exemples précédents,

--> x=[60 64 68 70 72 75 78 85 96 98]; --> y=[155 157 164 170 178 180 173 179 180 189]; --> plot2d(x,y,style=-3); // on trace le nuage de points --> plot2d(mean(x),mean(y),style=-4) // point moyen du nuage (pas nécessaire) --> a=corr(x,y,1)/variance(x); b=mean(y)-a*mean(x); // coefficients de la droite --> xx=60:0.01:98; // abscisses de la droite --> yy=a*xx+b; // ordonnées de la droite --> plot2d(xx,yy) // on trace la droite de régression linéaire16quotesdbs_dbs33.pdfusesText_39
[PDF] périmètre achat définition

[PDF] cadre de référence international des pratiques professionnelles de l'audit interne

[PDF] périmètre d'application définition

[PDF] ifaci

[PDF] situation de partage ce2 exercices

[PDF] problèmes multiplicatifs ce2

[PDF] problème multiplicatif ce1

[PDF] problèmes ce2 multiplication 2 chiffres

[PDF] problèmes division ce2

[PDF] stagiaire français ? l'étranger

[PDF] problèmes de partage ce2 cm1

[PDF] organisation cible définition

[PDF] comment définir une organisation cible

[PDF] le milieu physique ivoirien

[PDF] racine carré d'un nombre positif 3ème