[PDF] Principes et Méthodes Statistiques





Previous PDF Next PDF



Méthodes statistiques appliquées au management

La démarche statistique appliquée au management. 2012 Pearson France – Méthodes statistiques appliquées au management – Corinne Hahn Sandrine Macé ...



Méthodes statistiques appliquées au management

Ensuite nous présentons les différentes étapes de l'analyse statistique : la troisième section est consacrée à la statistique descriptive dont les méthodes 



Méthodes Statistiques Appliquées à la Qualité et à la Gestion des

Méthodes Statistiques Appliquées à la. Qualité et à la Gestion des Risques Management indicateurs ... Maîtrise statistique des processus.



Principes et Méthodes Statistiques

données les méthodes statistiques se répartissent en deux classes : Les probabilités appliquées proposent des modèles probabilistes du déroulement.



Glossaire.pdf

Méthodes statistiques appliquées au management. Coefficient du khi-deux. Le coefficient du khi-deux mesure l'intensité du lien entre.



Statistiques appliquées à la gestion Cours danalyse de donnés

On considère dans la pratique quatre tableaux de données sur lesquels s'appliquent des méthodes d'analyses factorielles différentes. - le tableau de variables ( 



Le Directeur

Méthodes Statistiques Appliquées aux Politiques publiques Management Digital et Innovation Technologique (MMDI). Marketing Digital et E-Business (MMDE).



Méthodes Statistiques Appliquées à la Qualité et à la Gestion des

Qu'est-ce qu'une carte de contrôle? Contrôle Statistique. Carte de Contrôle. Estimation. Propriétés. 2.1 Fluctuation d'échantillonnage.



Introduction et motivation du cours - Statistiques appliquées à la

Statistiques appliquées à la gestion. Ana Karina Fermin Utiliser une méthode statistique pour proposer une réponse. (régression anova...).



Présentation des méthodes de collecte et danalyse de données

d'analyse – la méthode pour analyser le « sens » des données en recherchant des Il existe d'autres sources de données notamment : les statistiques ...



Méthodes Statistiques Appliquées Au Management 2e édition

Méthodes Statistiques Appliquées Au Management 2e édition Livre Etext Plateforme E Learning Mymathlab Version Française By Corinne Hahn Sandrine Macé Méthodes Statistiques Appliquées Au Management 2e édition Livre Etext Plateforme E Learning Mymathlab Version Française By Corinne Hahn Sandrine Macé

Comment utiliser les méthodes statistiques ?

- Expliquer en validant statistiquement les résultats et en les généralisant à la population participante, en clarifiant les relations entre les variables. b. Que choisir ? Le choix de la ou les méthodes appropriées dépend donc de bien des facteurs tels que le type de variables et leur codage, va dépendre de l’objectif.

Quel est l’objet de la méthode statistique?

« L’objet de la méthode statistique est la réduction des données. Une masse de données doit être remplacée par un petit nombre de quantités représentant correctement cette masse, et contenant autant que possible la totalité de l’information pertinente contenue dans les données d’origine.

Qu'est-ce que la statistique appliquée ?

la fois une branche des mathématiques appliquées, une méthode et un ensemble de techniques. ... La statistique appliquée est utilisée dans presque tous les Passer au document

Qu'est-ce que le master statistiques appliquées et analyse de données ?

Le Master vise à former des spécialistes en statistiques appliquées et analyse de données disposant d'un solide bagage en informatique. À l'issue de la formation, les étudiants auront acquis de solides compétences dans les domaines suivants : Informatique décisionnelle.

Ensimag -1èreannéel

l l l l l l l l l l l l l l lll l l l ll l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l ll l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l

01234567

0 5 10 15 x yPrincipes et Méthodes Statistiques

Notes de cours

Olivier Gaudoin

2

Table des matières

1 Introduction 7

1.1 Définition et domaines d"application de la statistique . . . . . . . . . . . 7

1.2 La démarche statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3 Objectifs et plan du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Statistique descriptive 13

2.1 Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.1 Variables discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.1.1. Variables qualitatives . . . . . . . . . . . . . . . . . . . . . 14

2.2.1.2. Variables quantitatives . . . . . . . . . . . . . . . . . . . . . 16

2.2.2 Variables continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.2.1. Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2.2.2. Fonction de répartition empirique . . . . . . . . . . . . . . 21

2.2.2.3. Les graphes de probabilités . . . . . . . . . . . . . . . . . . 21

2.3 Indicateurs statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.1 Indicateurs de localisation ou de tendance centrale . . . . . . . . 25

2.3.1.1. La moyenne empirique . . . . . . . . . . . . . . . . . . . . 26

2.3.1.2. Les valeurs extrêmes . . . . . . . . . . . . . . . . . . . . . . 26

2.3.1.3. La médiane empirique . . . . . . . . . . . . . . . . . . . . . 26

2.3.1.4. Caractérisation des indicateurs de localisation . . . . . . . 27

2.3.2 Indicateurs de dispersion ou de variabilité . . . . . . . . . . . . . 28

2.3.2.1. Variance et écart-type empiriques . . . . . . . . . . . . . . 28

2.3.2.2. Les quantiles empiriques . . . . . . . . . . . . . . . . . . . 29

3 Estimation ponctuelle 33

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Méthodes d"estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2.1 Définition d"un estimateur . . . . . . . . . . . . . . . . . . . . . . 34

3.2.2 La méthode des moments . . . . . . . . . . . . . . . . . . . . . . . 34

3.2.2.1. L"estimateur des moments (EMM) . . . . . . . . . . . . . . 34

3.2.2.2. Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2.3 La méthode du maximum de vraisemblance . . . . . . . . . . . . 36

3.2.3.1. La fonction de vraisemblance . . . . . . . . . . . . . . . . . 36

3.2.3.2. Exemple introductif . . . . . . . . . . . . . . . . . . . . . . 36

4 TABLE DES MATIÈRES

3.2.3.3. L"estimateur de maximum de vraisemblance (EMV) . . . . 37

3.2.3.4. Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.3 Qualité d"un estimateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.3.1 Estimateur sans biais et de variance minimale (ESBVM) . . . . . 40

3.3.2 Convergences, théorème central-limite, loi des grands nombres . 42

3.3.3 Quantité d"information, efficacité d"un estimateur . . . . . . . . . 43

3.4 Propriétés des EMM et des EMV . . . . . . . . . . . . . . . . . . . . . . . 45

3.4.1 Propriétés des estimateurs des moments . . . . . . . . . . . . . . 45

3.4.2 Propriétés des estimateurs de maximum de vraisemblance . . . . 47

3.4.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4 Intervalles de confiance 49

4.1 Problématique et définition . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2 Intervalles de confiance pour les paramètres de la loi normale . . . . . . 50

4.2.1 Intervalle de confiance pour la moyenne . . . . . . . . . . . . . . 51

4.2.2 Intervalle de confiance pour la variance . . . . . . . . . . . . . . . 53

4.3 Intervalle de confiance pour une proportion . . . . . . . . . . . . . . . . . 55

5 Tests d"hypothèses 59

5.1 Introduction : le problème de décision . . . . . . . . . . . . . . . . . . . . 59

5.2 Formalisation du problème de test paramétrique sur un échantillon . . . 62

5.2.1 Tests d"hypothèses simples . . . . . . . . . . . . . . . . . . . . . . 62

5.2.2 Tests d"hypothèses composites . . . . . . . . . . . . . . . . . . . . 62

5.3 Tests sur la moyenne d"une loi normale . . . . . . . . . . . . . . . . . . . 63

5.3.1 Exemple introductif : essais thérapeutiques . . . . . . . . . . . . . 63

5.3.2 Première idée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.3.3 Deuxième idée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.3.4 Troisième idée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.3.5 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.3.6 La p-valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.3.7 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.3.8 Les tests de Student . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.4 Lien entre tests d"hypothèses et intervalles de confiance . . . . . . . . . . 69

5.5 Procédure pour construire un test d"hypothèses . . . . . . . . . . . . . . 70

5.6 Tests sur la variance d"une loi normale . . . . . . . . . . . . . . . . . . . . 71

5.7 Tests sur une proportion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.8 Le test duχ2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6 La régression linéaire 77

6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.2 Le modèle de régression linéaire simple . . . . . . . . . . . . . . . . . . . 78

6.3 Estimation par la méthode des moindres carrés . . . . . . . . . . . . . . . 79

6.4 Le modèle linéaire simple gaussien . . . . . . . . . . . . . . . . . . . . . . 85

6.4.1 Définition du modèle et estimation des paramètres . . . . . . . . 85

TABLE DES MATIÈRES 5

6.4.2 Maximum de vraisemblance . . . . . . . . . . . . . . . . . . . . . 86

6.4.3 Intervalles de confiance et tests d"hypothèses . . . . . . . . . . . . 87

6.5 Etude complète de l"exemple enR. . . . . . . . . . . . . . . . . . . . . . 91

7 Annexe A : Bases de probabilités pour la statistique 95

7.1 Variables aléatoires réelles . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7.1.1 Loi de probabilité d"une variable aléatoire . . . . . . . . . . . . . 95

7.1.2 Variables aléatoires discrètes et continues . . . . . . . . . . . . . . 96

7.1.3 Moments et quantiles d"une variable aléatoire réelle . . . . . . . . 97

7.2 Vecteurs aléatoires réels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

7.2.1 Loi de probabilité d"un vecteur aléatoire . . . . . . . . . . . . . . 98

7.2.2 Espérance et matrice de covariance d"un vecteur aléatoire . . . . 99

7.3 Lois de probabilité usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.3.1 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.3.2 Loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.3.3 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.3.4 Loi exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.3.5 Loi gamma et loi du chi-2 . . . . . . . . . . . . . . . . . . . . . . . 101

7.3.6 Loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.3.7 Lois de Student et de Fisher-Snedecor . . . . . . . . . . . . . . . . 102

8 Annexe B : Lois de probabilité usuelles 103

8.1 Caractéristiques des lois usuelles . . . . . . . . . . . . . . . . . . . . . . . 103

8.1.1 Variables aléatoires réelles discrètes . . . . . . . . . . . . . . . . . 103

8.1.2 Variables aléatoires réelles continues . . . . . . . . . . . . . . . . . 104

8.1.3 Vecteurs aléatoires dans IN

det dans IRd. . . . . . . . . . . . . . . 105

8.2 Tables de lois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.2.1 Table 1 de la loi normale centrée réduite . . . . . . . . . . . . . . . 106

8.2.2 Table 2 de la loi normale centrée réduite . . . . . . . . . . . . . . . 107

8.2.3 Table de la loi duχ2. . . . . . . . . . . . . . . . . . . . . . . . . . 108

8.2.4 Table de la loi de Student . . . . . . . . . . . . . . . . . . . . . . . 109

8.2.5 Tables de la loi de Fisher-Snedecor . . . . . . . . . . . . . . . . . . 110

8.3 Exemples de représentations de probabilités et de densités . . . . . . . . 112

8.3.1 Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.3.2 Lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

9 Annexe C : Introduction àR121

9.1 Les bases deR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

9.2 Commandes pour les deux premiers TD enR. . . . . . . . . . . . . . . . 122

9.3 Quelques commandes utiles deR. . . . . . . . . . . . . . . . . . . . . . . 123

9.4 Lois de probabilité usuelles enR. . . . . . . . . . . . . . . . . . . . . . . 124

9.5 Principaux tests d"hypothèses enR. . . . . . . . . . . . . . . . . . . . . . 126

9.6 Graphiques dans R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

9.6.1 Graphique simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

6 TABLE DES MATIÈRES

9.6.2 Autres fonctions graphiques . . . . . . . . . . . . . . . . . . . . . 127

9.6.3 Paramétrage de la commande plot . . . . . . . . . . . . . . . . . . 128

Bibliographie 129

Chapitre 1

Introduction

1.1 Définition et domaines d"application de la statistique

Lastatistiqueest la science dont l"objet est de recueillir, de traiter et d"analyser des donnéesissues de l"observation de phénomènesaléatoires, c"est-à-dire dans lesquels le hasard intervient. L"analyse des données est utilisée pourdécrireles phénomènes étudiés,faire des prévisionsetprendre des décisionsà leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l"économie à la biologie en passant par la psychologie, et bien sûr les sciences de l"ingénieur. Donnons quelques exemples d"utilisation de la statistique dans divers domaines. •médecine, biologie: diagnostic médical, imagerie médicale, essais thérapeutiques, épidémiologie, dynamique des populations, analyse du génôme, détection des maladies génétiques, impact des OGM ou des perturbateurs endocriniens, ... •sciences de la terre, environnement: prévisions météorologiques, analyse du ré- chauffement climatique, prévision de l"intensité et de la trajectoire des cyclones tropicaux, prévision des pics de pollution, exploration pétrolière, ... •économie, assurance, finance: prévisions économétriques, analyse de la consom- mation des ménages, fixation des primes d"assurance et franchises, études quan- titatives de marchés, gestion de portefeuille, évaluation d"actifs financiers, ... •sciences humaines: enquêtes d"opinion, sondages, démographie, études de popu- lations, ...

•sciences de l"ingénieur: voiture autonome, maîtrise des risques industriels, sûreté

de fonctionnement (fiabilité, disponibilité, sécurité, maintenance,...), contrôle de qualité, maîtrise statistique des procédés (méthode "six-sigma"), évaluation des performances des systèmes complexes, ... •sciences de l"information et de la communication: traitement des images et des si- gnaux, reconnaissance faciale, traitement automatique du langage naturel, ana- lyse des grandes masses de données (big data), publicité ciblée sur le web, sys-

8 Chapitre 1 - Introduction

tèmes de recommandation, analyse des réseaux de communication,... •physique: mécanique statistique, théorie cinétique des gaz, astrophysique,... •etc... Le point fondamental est que les données sont entâchées d"incertitudeset pré- sentent desvariationspour plusieurs raisons : •le déroulement des phénomènes observés n"est pas prévisible à l"avance avec ou les pannes des voitures) •toute mesure est entâchée d"erreur •seuls quelques individus sont observés et on doit extrapoler les conclusions de l"étude à toute une population (contexte des sondages) •etc... Il y a donc intervention duhasardet desprobabilités. L"objectif essentiel de la sta- tistique est de maîtriser au mieux cette incertitude pour extraire des informations utiles des données, par l"intermédiaire de l"analyse des variations dans les observations. Nous ne nous intéresserons pas à la collecte des données, qui est une tâche impor- tante et difficile, mais qui ne relève pas des mathématiques. Si on omet la collecte des données, les méthodes statistiques se répartissent en deux classes : •Lastatistique descriptive,statistique exploratoireouanalyse des données, a pour but derésumer l"informationcontenue dans les données de façon synthéti- que et efficace. Elle utilise pour cela desreprésentations de donnéessous forme nes). Elle permet de dégager les caractéristiques essentielles du phénomène étu- dié et de suggérer des hypothèses pour une étude ultérieure plus sophistiquée. Les probabilités n"ont ici qu"un rôle mineur. •Lastatistique inférentielleva au delà de la simple description des données. Elle a pour but defaire des prévisionset deprendre des décisionsau vu des ob- servations. En général, il faut pour cela proposer desmodèles probabilistesdu

phénomène aléatoire étudié et savoir gérer les risques d"erreurs. Les probabilités

jouent ici un rôle fondamental. Pour le grand public, les statistiques désignent les résumés de données fournis par la statistique descriptive. Par exemple, on parle des "statistiques du chômage" ou des "statistiques de l"économie américaine". Mais on oublie en général les aspects les plus

importants liés aux prévisions et à l"aide à la décision apportés par la statistique infé-

rentielle. L"informatique et la statistique sont deux éléments dutraitement de l"information: l"informatique acquiert et traite l"information tandis que la statistique l"analyse. Les deux disciplines sont donc étroitement liées. En particulier, l"augmentation considé- rable de la puissance des ordinateurs et la facilité de transmission des données par internet ont rendu possible l"analyse de très grandes masses de données (big data). Lascience des donnéesoudata sciencedésigne l"ensemble des méthodes permettant d"extraire des informations utiles de ces grandes masses de données et de les traiter.

1.2 La démarche statistique 9

Cela nécessite des compétences en informatique (bases de données, calcul parallèle, vi- sualisation,...) et en statistique (fouille de données, apprentissage statistique,...) Enfin, l"informatique décisionnelleoubusiness intelligenceregroupe les outils d"aide à la décisiondevenus essentiels dans la gestion des entreprises. Ces outils nécessitent un recours important aux méthodes statistiques. Plus généralement, tout ingénieur est amené à prendre des décisions au vu de cer- taines informations, dans des contextes où de nombreuses incertitudes demeurent. Il importe donc qu"un ingénieur soit formé aux techniques de gestion du risque et de traitement de données expérimentales.

1.2 La démarche statistique

La statistique et les probabilités sont les deux aspects complémentaires de l"étude des phénomènes aléatoires. Ils sont cependant de natures bien différentes. Lesprobabilitéspeuvent être envisagées comme une branche des mathématiques pures, basée sur la théorie de la mesure, abstraite et complètement déconnectée de la réalité. Lesprobabilités appliquéesproposent desmodèles probabilistesdu déroulement de phénomènes aléatoires concrets. On peut alors,préalablement à toute expérience, faire des prévisions sur ce qui va se produire. Par exemple, il est usuel de modéliser la durée de bon fonctionnement ou durée de vie d"un système, mettons une ampoule électrique, par une variable aléatoireXde loi exponentielle de paramètreλ. Ayant adopté ce modèle probabiliste, on peut effectuer tous les calculs que l"on veut. Par exemple : •La probabilité que l"ampoule ne soit pas encore tombée en panne à la datetest

P(X > t) =e-λt.

•La durée de vie moyenne estE[X] = 1/λ. les fonctionnent indépendamment les unes des autres, le nombreNtd"ampoules qui tomberont en panne avant un instanttest une variable aléatoire de loi bino- E[Nt] =n?1-e-λt?ampoules tombent en panne entre 0 ett. Dans la pratique, l"utilisateur de ces ampoules est très intéressé par ces résultats. Il souhaite évidemment avoir une évaluation de leur durée de vie, de la probabilité qu"elles fonctionnent correctement pendant plus d"un mois, un an, etc... Mais si l"on

veut utiliser les résultats théoriques énoncés plus haut, il faut d"une part pouvoir s"as-

surer qu"on a choisi un bon modèle, c"est-à-dire que la durée de vie de ces ampoules est bien une variable aléatoire de loi exponentielle, et, d"autre part, pouvoir calculer d"une manière ou d"une autre la valeur du paramètreλ. C"est la statistique qui va permettre de résoudre ces problèmes. Pour cela, il faut faire une expérimentation, recueillir desquotesdbs_dbs44.pdfusesText_44
[PDF] influence de la température sur le rendement d'une cellule photovoltaïque

[PDF] influence de l'éclairement sur la cellule photovoltaique

[PDF] la dianétique la puissance de la pensée sur le corps pdf

[PDF] coefficient de température panneau photovoltaique

[PDF] participation protestataire définition

[PDF] etude de l effet de la température sur les paramétres d une cellule solaire organique

[PDF] influence de la température sur la cellule photovoltaique

[PDF] temperature cellule photovoltaique

[PDF] participation conventionnelle définition

[PDF] repertoire d'action collective

[PDF] participation non conventionnelle définition

[PDF] la protestation politique

[PDF] comment les répertoires d'action politique ont-ils évolué corrigé

[PDF] participation conventionnelle

[PDF] de quoi est composé la grande bretagne