[PDF] Statistique euclidienne I Individus et variables





Previous PDF Next PDF



STATISTIQUES

L'écart-type S est la racine carrée de la variance. 2. S. ( ). = = ?. ? n. 2 i. 1. 1. S. X X n i. 3.2.1. Ecart-type pondéré. Si aux valeurs.



Statistique euclidienne I Individus et variables

24 avr. 2006 L'écart-type pondéré de x est etp(x) = ?vp(x). La moyenne (resp. variance) ... Comparer la variance pondérée et la quantité.



Introduction `a la statistique multidimensionnelle

Simplification de la formule : la variance pondérée peut se calculer plus simplement par la Calculez l'écart-type de la série équi-pondérée précédente :.



courne normale couleur-ste-justine 2.jpg

COURBE NORMALE DIVISÉE EN FONCTION DES ÉCARTS-TYPES. -3. +3. -1 Moyenne (M) +1. 341% 34



Analyse spatiale : distribution statistique et distirbution spatiale

Le paramètre de dispersion associé est la distance-type pondérée ?DP qui est on note ?X



STATISTIQUES DESCRIPTIVES

http://www.maths-et-tiques.fr/telech/Notes.ods (feuille de calcul OOo). Partie 3 : Moyenne pondérée variance



Plan statistique quantitatif et évaluation des performances selon la

Et r = écart type robuste = s*. CV r = coefficient de variation robuste med = médiane. MAD = écart absolu médian. MADe = écart absolu médian pondéré.





Analyses & Synthèses n°42 - Comment les pondérations de risque

11 mars 2015 différences de risques pondérés ne peuvent pas provenir d'effets de ... Paramètres bâlois et taux de RWA par banque. Moyenne. Écart- type.



Cours Statistiques descriptives

29 sept. 2008 donnée et la moyenne pondérée. •. La variance V(x) et l'écart type ?(x) mesurent plus précisément l'écart moyen entre chaque valeur et la.



[PDF] STATISTIQUES - Département Informatique

P1 L'écart-type s'exprime avec les mêmes unités que la variable statistique (contrairement à la variance qui est un carré) P2 Si on transforme les données i



[PDF] Chapitre 4: Mesures de dispersion et mesure de forme

pondérée des carrés des écarts à la moyenne: ?2 = 1 N ni xi ? x ( ) 2 i=1 k ? = fi xi ? x ( ) 2 i=1 k ? L'écart-type: L'écart-type ? est la 



[PDF] STATISTIQUES DESCRIPTIVES - maths et tiques

Le tableau présente une série statistique : Calculer la moyenne pondérée la variance et l'écart-type de la série Correction L'effectif total est : 



[PDF] Traitement statistique des processus alpha-stable

Un organisme de défense des consommateurs prélève au hasard un échantillon de n = 100 piles et observe une durée de vie moyenne de 158 heures avec un écart-type 



[PDF] Statistiques descriptives et exercices

Calculer la variance et l'écart-type Solution 1 - La population est les 52 jours et la variable statistique étudiée est le nombre d'articles vendus par jour



[PDF] Statistique euclidienne I Individus et variables

24 avr 2006 · L'écart-type pondéré de x est etp(x) = ?vp(x) La moyenne (resp variance) naturelle est le cas particulier de la moyenne (resp variance) 



Écart type - Wikipédia

En mathématiques l'écart type (aussi orthographié écart-type) est une mesure de la dispersion des valeurs d'un échantillon statistique ou d'une 



[PDF] Introduction `a la statistique multidimensionnelle

L'écart-type ? d'une série est égal `a la racine carrée de la variance V : ? = rem : que la série soit équi-pondérée ou pas ? Comment interpréter la 



[PDF] STT-1920 Méthodes statistiques

Population 1 2 Taille de l'échantillon 12 15 Moyenne échantillonnale 23 37 20 55 Écart-type échantillonnal 4 83 2 21 135 Page 9 Obtenez un 



Paramètres statistiques : Moyenne Médiane Etendue Ecart-type

Nombre; Somme; Moyenne; mediane; Mode; Étendue; IQR; Variance; Ecartype; Estimateur ecart type; Estimateur ecart type calculé à partir de l'étendue 

  • Comment calculer un écart-type pondéré ?

    Pour estimer un param`etre de C (par exemple la moyenne µ ou l'écart-type ?), on choisit un échantillon particulier en (d'o`u l'appellation ”ponctuelle”), et on calcule la valeur de l'estimateur (Mn, ?n?1 ,) sur cet échantillon : mn = Mn(en), ?n?1 = ?n?1 (en).
  • Comment expliquer l'écart-type ?

    1Pour calculer l'écart-type, on proc? ainsi :21 - On calcule la moyenne arithmétique de la série.32 - On calcule le carré de l'écart à la moyenne de chacune des valeurs de la série.43 - On calcule la somme des valeurs obtenues.54 - On divise par l'effectif de la série.65 - On calcule la racine carrée du résultat.

Statistique euclidienne

I Individus et variables

D. Chessel & A.B. Dufour

24 avril 2006Introduction des principes euclidiens utilis´es en statistique descrip-

tive.

Table des mati`eres

1 Moyennes et variances 2

1.1 D´efinitions ´el´ementaires . . . . . . . . . . . . . . . . . . . . . . .2

1.2 Pond´erations . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.3 Produits scalaires . . . . . . . . . . . . . . . . . . . . . . . . . . .3

1.4 Longueur, angle et distance . . . . . . . . . . . . . . . . . . . . .4

1.5 D´efinitions euclidiennes . . . . . . . . . . . . . . . . . . . . . . .4

2 Covariance et corr´elation 6

2.1 Deux figures duales . . . . . . . . . . . . . . . . . . . . . . . . . .6

2.2 Les droites de r´egressions . . . . . . . . . . . . . . . . . . . . . .7

2.3 Exercice : Les jurys . . . . . . . . . . . . . . . . . . . . . . . . . .8

3 Variables qualitatives 10

3.1 Projections et syst`emes orthogonaux . . . . . . . . . . . . . . . .10

3.2 Sous-espace des indicatrices . . . . . . . . . . . . . . . . . . . . .12

3.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14

4 R´egression multiple 15

4.1 Position du probl`eme . . . . . . . . . . . . . . . . . . . . . . . . .15

4.2 Projection sur un sous-espace . . . . . . . . . . . . . . . . . . . .16

4.3 Variables sans redondance . . . . . . . . . . . . . . . . . . . . . .16

4.4 Proc´edure de la r´egression multiple . . . . . . . . . . . . . . . . .16

4.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

5 Repr´esentation d"objets `a trois dimensions 18

5.1 Rep`eres dansR3. . . . . . . . . . . . . . . . . . . . . . . . . . .18

5.2 Repr´esentation triangulaire . . . . . . . . . . . . . . . . . . . . .21

5.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22

1

D. Chessel & A.B. Dufour

1 Moyennes et variances

Ce cours suppose qu"on a une id´ee des objectifs et des m´ethodes ´el´ementaires de la statistique descriptive. L"analyse des donn´ees manipule des variables, c"est- `a-dire des s´eries de n observations d"une quantit´e donn´ee. On commence par les variables quantitatives, celles dont les valeurs appartiennent `aR. Une variable x= (x1,x2,...,xn) est donc un vecteur deRn.

1.1 D´efinitions ´el´ementaires

La moyenne naturelle dexestm= m(x) =1n

n i=1xi. On note souvent m(x) =x.

La variance naturelle dexestv= v(x) =1n

n i=1(xi-m(x))2. On peut utiliser la notation v(x) =s2x.

L"´ecart-type naturel dexest et(x) =?v(x).

Ces param`etres caract´erisent la position (moyenne) et la dispersion (va- riance) des mesures. La m´ediane, les quartiles sont d"autres param`etres de po- sition, l"intervalle interquartile est un autre param`etre de dispersion. Ces pa- ram`etres d´ecrivent la variable vue commenpoints deR. Calculer la moyenne et la variance de1n= (1,1,...,1). Calculer la moyenne et la variance dex= (1,2,...,n). Montrer que la moyenne minimise surRla quantit´e (inertie autour deh) : iner(x,h) =1n n i=1(xi-h)2.

Comparer la variance et la quantit´e

1n 2n? i=1n j=1(xi-xj)2.

1.2 Pond´erations

Une pond´eration desnindividus porteurs d"une mesure est un vecteur deRn dont toutes les composantes sont positives et dont la somme vaut 1. On notera une pond´eration :p= (p1,p2,...,pn) avecn? i=1p La moyenne pond´er´ee de x est :mp= mp(x) =n? i=1p ixi. La variance pond´er´ee de x est :vp= vp(x) =n? i=1p i(xi-mp(x))2. L"´ecart-type pond´er´e dexest etp(x) =?v p(x). La moyenne (resp. variance) naturelle est le cas particulier de la moyenne (resp. variance) pond´er´ee pour la pond´eration uniforme d´efinie par :p i=1n Quand aucune ambigu¨ıt´e n"est possible, on note simplement m p(x) = m(x), v p(x) = v(x) et etp(x) = et(x). Montrer que la moyenne pond´er´ee minimise surRla quantit´e :iner p(x,h) =n? i=1p i(xi-h)224 avril 2006 - Page 2/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

Comparer la variance pond´er´ee et la quantit´e n? i=1n j=1p ipj(xi-xj)2

1.3 Produits scalaires

Un vecteur duR-espace vectorielRsest uns-uple de nombres r´eels, soit

x= (x1,x2,...,xs).´Etant donn´esω1,ω2,...,ωssnombres strictement positifs on appelleω-

(x,y)de points deRsassocie le nombre r´eel :?x|y?ω=s? i=1ω ixiyi.

L"applicationω-produit scalaire v´erifie les propri´et´es :?PS1?x|y?ω=?y|x?ωpour tout x et y deRs,?PS2a?x|y+z?ω=?x|y?ω+?x|z?ωpour toutx,y,zdeRs,?PS2b?x|αy?ω=α?x|y?ωpour toutxetydeRset pour toutαdeR,?PS3?x|x?ω≥0 pour toutxdeRs,?PS4?x|x?ω= 0?x= 0 = (0,0,...,0)pour toutxdeRs.

Plus g´en´eralement, ´etant donn´ee une fonction deRs×RsdansRqui `a un couple

de points (x,y) associe un nombre r´eel not´e indiff´eremment(x|y)Φ,?x|y?Φou Φ(x,y)

on dit que c"est un produit scalaire si elle v´erifie les propri´et´es PS1, ..., PS4. Les produits scalaires diagonaux sont des produits scalaires. Les produits scalaires sont des fonctionsBSPND(Bilinaires,Sym´etriques,

Positives etNonD´eg´en´er´es).

Quand on manipule un seul produit scalaire, si aucune confusion n"est pos- sible, on note simplement (x|y)Φ=(x|y). Quand on en manipule plusieurs, on les rep`ere par une de leur matrice.

La matrice d"un produit scalaire dans une base donn´ee est le tableau :S= Mat(Φ,{v1,v2,...,vs}) = [Φ,{v}] =??vi|vj?Φ?

Dans cette base, la bilin´earit´e permet de faire les calculs avec :x=s? i=1ξ ivi=?[x,{v}]t= [ξ1,ξ2,...,ξs], y=s? k=1ψ kvk=?[y,{v}]t= [ψ1,ψ2,...,ψs], ?x|y?Φ=s? i=1s k=1ξ iψk?vi|vk?= [x,{v}]t[Φ,{v}][y,{v}]. Donner la matriceR= [Φ,{w}] en fonction deSet de la matrice de chan- gement de baseH= [Id,{v},{w}] o`u Id est l"identit´e deRsdansRs. Soit dansR3la fonctions h qui, aux vecteursv= (x1,x2,x3) etw= (y1,y2,y3) associe : h(v,w) = [x1,x2,x3]A? ?y 1 y 2 y 3?

A quelles conditions h est-

elle un produit scalaire?

Justifier l"appellation de produit scalaire diagonal.24 avril 2006 - Page 3/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

1.4 Longueur, angle et distance

Un produit scalaire permet de mesurer la longueur d"un vecteur et l"angle

de deux vecteurs. La Φ-norme associ´ee `a un produit scalaire est d´efinie par :?x?Φ=??x|x?Φ.

On a?αx?Φ=|α| ?x?Φ. Quand aucune confusion n"est possible, on note sim- plement?x?Φ=?x?. Deux vecteurs deRssont Φ-orthogonaux si et seulement si?x|y?Φ= 0. Th´eor`eme de Pythagore. Montrer que :?x|y?Φ= 0? ?x+y?2

Φ=?x?2

Φ+?y?2

Φ? ?x+y?=?x-y?

Projection sur un vecteurSixetysont deux vecteurs deRset sixest non nul, il existe un unique vecteurzdeRsproportionnel `axtel quey-zsoit orthogonal `ax. On dit quezest le projet´e Φ-orthogonal deysurx.

Il vaut :z=?x|y?Φ?x|x?Φx.

Le vecteurwdeRsproportionnel `axqui minimise?y-w?2estz. Donner les coordonn´ees du pied de la perpendiculaire abaiss´ee de A (1,3) sur la droitey=x/2 . points deRs, la Φ-mesure de l"angle dexetyest not´eeA

Φ(x,y) =a

La Φ-distance de deux vecteurs est d´efinie par :d

Φ(x,y) =?x-y?Φ=?y-x?Φ.

On sait donc mesurer les angles et les distances entre points deRsau sens d"un produit scalaire donn´e.

1.5 D´efinitions euclidiennes

DansRs, on notera{e}s={e1,e2,...,es}la base canonique. On utilisera :?le produit scalaire canonique?x|y?c=s?

i=1x iyi= (x|y)Iso`uIsest la matrice identit´e;?le produit scalaire uniforme?x|y?u=1s s i=1x iyi= (x|y)UsavecUs=1s Is;?le produit scalaire associ´e `a une pond´erationp= (p1,p2,...,ps)?x|y?p=s? i=1p

ixiyi= (x|y)DsavecDs=Diag(p1,p2,...,ps)24 avril 2006 - Page 4/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

Dans la plupart des cas, d`es qu"il s"agit de variables, on se contentera de no- ter (x|y)Dun produit scalaire associ´e `a une pond´eration, le contexte rendant implicite la dimension et la nature de cette pond´eration qui, par d´efaut, est uniforme. La moyenne naturelle devientm= m(x) =x=?x|1n?u. La moyenne pond´er´ee de x est :mp= mp(x) =x p=?x|1n?p. Dans la plupart des cas, d`es qu"il s"agit de variables, on se contentera de parler de moyenne et de noter m(x) la moyenne associ´ee `a une pond´eration, le contexte rendant implicite la dimension et la nature de cette pond´eration qui, par d´efaut, est uniforme. Le calcul de la moyenne est donc associ´e, dans tous

les cas, `a une projection euclidienne (figure 1).Fig.1 - Le centrage est une projection euclidienne.On utilisera toujours la notation Proj

ΦApour d´esigner la projection orthogo-

nale au sens duΦ-produit scalaire sur un sous-espaceA.

La variance est alors simplement :v= v(x) =?x-x1

n?2=?x0?2

Du th´eor`eme de Pythagore il vient :

v(x) =?x-x.1n?2=?x?2-x 2 La variance est la moyenne des carr´es moins le carr´e de la moyenne. On a l`a un exemple des plus cocasses du lien entre math´ematique et pratique. La formule est c´el`ebre. Elle servait, au temps des calculs manuels, `a calculer la variance `a l"aide d"une table de carr´es. Elle a souvent ´et´e donn´ee pour une d´efinition. Elle est devenue un ennui majeur dans le calcul num´erique,`a cause des erreurs d"arrondis. Elle reste la base th´eorique du syst`eme des carr´es des

´ecarts.

On notex0=x-x1

net on l"appelle la variable centr´ee associ´ee `ax. La d´ecomposition s"´ecrit :x=x0+ m(x)1n?? ??????x 1... x i... x n? ??????x

1-m(x)

x i-m(x) x n-m(x)? ??????m(x) m(x) m(x)? ??????24 avril 2006 - Page 5/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

C"est la plus simple des d´ecompositions aux moindres carr´es qui se retrouvera `a tout moment.

2 Covariance et corr´elation

Deux variables forment un tableau accompagn´e de la pond´eration commune des individus :X=?x y?=? ??????x

1y1......

x iyi...... x nyn? ??????p 1... p i... p n?

2.1 Deux figures duales

Le tableau centr´e contient les variables centr´ees :X

0=?x0y0?=?

??????x

1-m(x)y1-m(y)

x i-m(x)yi-m(y) x n-m(x)yn-m(y)? On a soitnpoints deR2, soit 2 points deRn. Dans le premier cas, le centrage est un changement de rep`ere; deux variables y sont vues commenpoints deR2 (figure 2, `a gauche). Dans le second, c"est une double projection; deux variables

y sont vues comme 2 points deRn(figure 2, `a droite).Fig.2 - Les deux points de vue de la statistique lin´eaire. A gauche, celui des

donn´ees permet de voir les mod`eles. A droite, celui de la th´eorie permet de

comprendre les calculs. Celui de droite s"´etend en dimension quelconque.24 avril 2006 - Page 6/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

2.2 Les droites de r´egressions

La r´egression est la recherche d"un pr´edicteur lin´eaire.Fig.3 - D´efinition des droites de r´egression.A gauche, la droite de pr´ediction

deyparx, `a gauche, droite de la pr´ediction dexpary. Dans les deux cas la

somme des carr´es des ´ecarts donn´ees-mod`eles est minimum.Il y a deux probl`emes. On cherche une droitey=ax+bqui minimise :

E(a,b) =n?

i=1p iMiP2i=n? i=1p i(yi-axi-b)2 La solution analytique (utiliser les d´eriv´ees partielles) est : b= m(y)-am(x) a=n i=1p i(xi-m(x))(yi-m(y))n i=1p i(xi-m(x))2 La solution alg´ebrique utilise une droite qui passe par le centre de gravit´e.

Chercher une droiteY=aXqui minimise :

E(a) =n?

i=1p iMiP2i=n? i=1p i(Yi-aXi) =?y0-ax0?2 p

On trouve :

a=(x0|y0)D?x0?2 D=n i=1p i(xi-m(x))(yi-m(y))n i=1p i(xi-m(x))2=covp(x,y)var p(x) On appelle covariance de deux variables le produit scalaire des variables centr´ees. La covariance naturelle est : cov(x,y) =1n n i? i=1i(xi-m(x))(yi-m(y))24 avril 2006 - Page 7/23 -http://pbil.univ-lyon1.fr/R/cours/ma1.pdf

D. Chessel & A.B. Dufour

La corr´elation est :

cor p(x,y) =covp(x,y)?var p(x)?var p(y)=covp(x,y)et(x)et(y)=(x0|y0)D?x0?D?y0?D= cos(A(x0,y0)) Fondamentalement, la variance de la variable pr´edite se d´ecompose en deux composantes additives (th´eor`eme de Pythagore), respectivement l"erreur de pr´ediction et la variance expliqu´ee. Le carr´e de corr´elation est dit pourcentage de variance

expliqu´ee.Fig.4 - D´ecomposition de la variance dans une r´egression lin´eaire simple2.3 Exercice : Les jurys

On consid`ere un jury de s´election form´e deLjuges s´electionnant chacun Rproduits parmiC. Le r´esultat de la s´election est consign´e dans un tableau X= [xij] o`uxijvaut 1 si le jugeis´electionne le produitjet 0 sinon. a) Soitaikle nombre des s´elections communes aux jugesietk. Donner le coefficient de corr´elation lin´eairerikentre les jugesietk, en fonction deaik,R etC. b) On peut d´efinir sur l"ensemble desCproduits une statistiqueSen po- santSj=?L i=1xij. Quelle signification donner `aSj? Calculer la moyenne des valeurs deSjen fonction deL,CetR. Exprimer la variancevdes valeursSj en fonction deL,C,Ret la somme pouri?=kdesaik.quotesdbs_dbs35.pdfusesText_40
[PDF] ecart type excel anglais

[PDF] formule de l'écart type

[PDF] écart type faible ou fort

[PDF] plus l'écart type est grand

[PDF] open office calc formule pourcentage

[PDF] ecart type libreoffice calc

[PDF] formules libreoffice calc

[PDF] calc fonction si plusieurs conditions

[PDF] fonction classeur open office

[PDF] open office calcul automatique

[PDF] calculer variance probabilité

[PDF] esperance et ecart type proba

[PDF] l'homme de flores un mystère

[PDF] transformée de fourier audacity

[PDF] analyse spectrale d'un son audacity