[PDF] Dépendance et codages de deux variables aléatoires





Previous PDF Next PDF



2.2 DISTRIBUTION À DEUX CARACTÈRES CORRÉLATION

Dans une étude statistique on donne le nom de variable statistique à tout caractère dont les données peuvent être différentes. CORRÉLATION. Étudier la 



Statistique Les distributions à deux caractères

L'ensemble des couples (XY) constitue une distribution à deux caractères



Statistiques descriptives et exercices

Donc di = ni × 360. N . 2.3.2 Distribution à caractère quantitatif discret. A partir de l'observation d'une variable quantitative discrète



Série statistique à deux variables A

Partie A Étude de la série statistique à une variable y On partage le nuage en deux sous-nuages de trois points (les 3 premiers et les 3 derniers).



Chapitre 2: Série statistique à deux variables

Combien il y'a de distributions conditionnelles? Comme x prend p valeurs différentes alors il existe p séries conditionnelles de y en x. Comme y prend q 



Chapitre 2 : Série statistique à deux variables

Une série statistique double peut être donnée comme l'énumération d'un Définition : on appelle distribution statistique à deux variables la donnée (. ).



Distributions de plusieurs variables

8 mai 2008 Variables aléatoires continues : deux variables aléatoires X ... Exemple : Distribution uniforme bivariée sur un carré un disque



Dépendance et codages de deux variables aléatoires

16 mars 2020 une distribution statistique à deux dimensions est connue sous la forme d'un tableau de contingence m x p où les distributions marginales ne ...



Chapitre 2 Comparaisons de deux distributions

PMP STA 21 Méthodes statistiques pour l'analyse des données en psychologie On étudie deux populations P1 et P2 et deux variables qui représentent le ...



Cours 4 Liaison entre deux variables conjointes

2 La liaison statistique se manifeste principalement sur les distributions conditionnelles ; supposons par exemple que nous étudions la liaison de Y à X ; pour 



[PDF] Série statistique à deux variables A

Série statistique à deux variables A Étude de deux exemples Énoncé Le tableau suivant donne la moyenne y des maxima de tension artérielle en fonction de 



[PDF] STATISTIQUES À DEUX VARIABLES - maths et tiques

L'objectif est à partir des valeurs d'une série statistique à deux variables d'obtenir des approximations pour des valeurs inconnues de cette série Exemples 



[PDF] SÉRIES STATISTIQUES À DEUX VARIABLES - Pierre Lux

A ) DÉFINITION Définition : On considère deux variables statistiques numériques x et y observées sur une même population de n individus



[PDF] Distributions à deux caractères - Mathématiques du Cnam

2 LES CARACTÉRISTIQUES DES SÉRIES À DEUX CARACTÈRES 1 Présentation générale Soit X une variable (caractère) statistique dont les modalités sont x1x2 



[PDF] Les distributions statistiques à deux caractères : étude de - UMMTO

Statistique 2/Chapitre 2: Les distributions statistiques à deux caractères : étude de la régression l'ajustement et la corrélation



[PDF] Chapitre 2: Série statistique à deux variables - E-monsite

Combien il y'a de distributions conditionnelles? Comme x prend p valeurs différentes alors il existe p séries conditionnelles de y en x Comme y prend q 



[PDF] Statistiques à deux variables MathsComp 1 Ajustement affine

On obtient alors une série statistique à deux variables quantitatives ou série statistique double qui peut être représentée par : • une liste de couples xi ; 



[PDF] Chapitre 3 Etude de la liaison entre deux variables Analyse

Etude simultanée de deux variables X et Y définies sur une même population P : mettre en évidence une éventuelle liaison (relation dépendance) entre les 



[PDF] STATISTIQUE DESCRIPTIVE BIVARIEE

1 1 Distributions statistiques W deux variables On considère une population de N individus mesurés simultaniment par les deux caractères



[PDF] Statistique Les distributions à deux caractères

L'ensemble des couples (XY) constitue une distribution à deux caractères ou distribution à deux variables Exemple : On considère la note en maths et en 

  • Comment calculer des statistiques à deux variables ?

    Graphiquement, elle correspond à une droite d'équation réduite y=ax+b qui donne une relation entre les deux variables quantitatives. Gr? à l'ajustement affine, on peut interpoler ou extrapoler, c'est-à-dire faire des prévisions.
  • Quel lien statistique entre 2 variables ?

    La corrélation est une mesure statistique qui exprime la notion de liaison linéaire entre deux variables (ce qui veut dire qu'elles évoluent ensemble à une vitesse constante). C'est un outil courant permettant de décrire des relations simples sans s'occuper de la cause et de l'effet.
  • C'est quoi la distribution d'une variable ?

    La distribution d'une variable est le profil des valeurs , c'est-à-dire l'ensemble formé de toutes les valeurs possibles et des fréquences associées à ces valeurs. Les distributions de fréquences sont représentées sous forme de tableaux ou de graphiques.
  • Le coefficient de Pearson permet de mesurer le niveau de corrélation entre les deux variables. Il renvoie une valeur entre -1 et 1. S'il est proche de 1 cela signifie que les variables sont corrélées, proche de 0 que les variables sont décorrélées et proche de -1 qu'elles sont corrélées négativement.
>G A/, ?H@yk8yddee ?iiTb,ff?HXb+B2M+2f?H@yk8yddee .ûT2M/M+2 2i +Q/;2b /2 /2mt p`B#H2b HûiQB`2b hQ +Bi2 i?Bb p2`bBQM,

REVUE DE STATISTIQUE APPLIQUÉEGILBERTSAPORTA

Revue de statistique appliquée, tome 23, no1 (1975), p. 43-63 © Société française de statistique, 1975, tous droits réservés. L"accès aux archives de la revue " Revue de statistique appliquée » (http://www. sfds.asso.fr/publicat/rsa.htm) implique l"accord avec les conditions générales d"uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d"une infraction pénale. Toute copie ou im-

pression de ce fichier doit contenir la présente mention de copyright.Article numérisé dans le cadre du programme

Numérisation de documents anciens mathématiques http://www.numdam.org/ 43

DÉPENDANCE ET CODAGES

DE DEUX VARIABLES ALÉATOIRES(1)

Gilbert SAPORTA

IUT

Informatique -

Université de Paris V

INTRODUCTION

Le point de départ de cette étude est la question classique suivante : une distribution statistique

à deux dimensions est connue sous la forme

d'un tableau de contingence m x p où les distributions marginales ne corres- pondent pas

à des valeurs

numériques mais à des modalités de caractère qua- litatif (par ex : opinion politique et statut social) : comment attribuer à ces diverses modalités des valeurs numériques qui ne soient pas purement conven- tionnelles mais aient une signification ? Il s'agit en somme de rendre quantitatives des variables qualitatives par le choix d'une paramétrisation adéquate des diverses modalités, ce qu'on appelle un codage [7] (en anglais "scores" [6]). Le codage cherché sera celui qui respecte au mieux la liaison entre les deux variables décrites par le tableau de contingence, ce qui implique le choix d'une mesure de liaison.

La résolution de ce

problème conduit d'une part

à étudier les diverses

mesures de liaison statistique et à approfondir la notion de corrélation, d'autre part à étudier les transformations de variables aléatoires et l'influence de ces transformations sur la mesure de liaison afin d'obtenir une liaison maximale ce qui fournit les codages souhaités. Nous porterons notre attention sur des transformations donnant des variables centrées réduites car les mesures de liaison étant insensibles aux transformations linéaires, les résultats sont définis

à un

changement d'origine et un coefficient d'échelle près. On constatera alors l'identité formelle entre cette démarche qui est celle de l'analyse canonique et l'analyse des correspondances.

La recherche de

codages de variables qualitatives peut se réveler particu- lièrement fructueuse là où l'introduction de données qualitatives s'accorde mal avec uné technique statistique essentiellement quantitative par ex : régres- sion, analyse discriminante.

On trouvera des

développements théoriques récents dans les travaux [9] de M.

Masson,

ainsi que dans un article de Pousse et Dauxois [8] dont nous avons eu connaissance ultérieurement. (1) Article remis le

6/2/74 ;

révisé le

20/5/74.

Revue de Statistique Appliquée, 1975 vol. XXIII N°1 44
1

DEPENDANCE ENTRE DEUX VARIABLES

ALEATOIRES,

VARIABLES

CANONIQUES

Nous supposerons dans cette partie que les variables X,

Y étudiées sont

continues, de densités marginales f (x) et g (y), la densité du couple

étant

notée h (x , y).

X et Y seront de

plus supposées centrées réduites afin d'alléger les notations. 1/

Les indicateurs de liaison

Parmi tous les indicateurs

possibles nous étudierons les deux plus impor- tants : le coefficient de corrélation linéaire et le rapport de corrélation qui dépendent des valeurs des deux variables et le ~2 de Karl Pearson qui constitue une mesure intrinsèque de la dépendance. Les rapports entre ces trois mesures seront établis au cours de cette étude. a) L'indicateur de liaison linéaire p (ou p2)

Le coefficient de corrélation linéaire

p égal à xy h (x , y) dx dy est la mesure de liaison la plus employée.

On sait

que p2 ==

1 entraîne

que

X et Y

sont en relation linéaire (ici X

Y car les variables sont centrées réduites)

et que p2 =

0 n'est

pas un critère d'indépendance mais de non dépendance linéaire.

D'une manière

générale p2 mesure la qualité de l'approximation de Y (resp X) par une fonction linéaire X (resp de

Y) : pour

des variables centrées réduites la meilleure approximation linéaire de Y au sens des moindres carrés est fournie par Y* pX et si on pose Y pX + E on a E (e) 0 V(e) 1 p2 et V(Y*) = p2 . p est un indicateur symétrique en X et Y mais est sensible aux changements de variable autres que linéaires comme le montre sa définition : b) Les indicateurs de la dépendance en moyenne : Les rapports de corrélation ~2Y/X et ~2X/Y.

Si on recherche la meilleure

approximation fonctionnelle et non plus linéaire de Y par

X c'est-à-dire minimiser

E [(Y - f(X))2],

La solution est donné

par f (X) E (Y/X). On pose alors et on a en général ~2Y/X ~2X/Y.

Si on écrit comme

pour l'approximation linéaire Y

E (Y/X)

+ e on trouve E(e) 0 et V(e) (1 - ~2Y/X) V(Y) ce qui prouve que : Revue de Statistique Appliquée, 1975 vol XXIII N°1 45
carquotesdbs_dbs42.pdfusesText_42
[PDF] distribution conditionnelle statistique exercice corrigé

[PDF] redoublement scolaire pour ou contre

[PDF] tableau de contingence exercice corrigé

[PDF] fréquence cumulée croissante calcul

[PDF] commission d appel passage en seconde

[PDF] redoublement terminale refusé

[PDF] recours affectation lycée

[PDF] formule effectif cumulé croissant

[PDF] regulateur de pression d'eau reglage

[PDF] réducteur de pression eau

[PDF] comment installer un reducteur de pression d'eau

[PDF] le diagramme ci contre représente certains niveaux d'énergie

[PDF] la couleur de la nébuleuse d'orion

[PDF] la nébuleuse d'orion se trouve ? 1 70

[PDF] réduction des endomorphismes mp