[PDF] Statistique Numérique et Analyse des Données - Séance 1





Previous PDF Next PDF



Statistique Numérique et Analyse des Données - Séance 1

Quelques infos. Motivations. Stat. : qu'est-ce que c'est ? Statistique Descriptive. Série numérique. Histogramme. Fn de répartition. Statistiques d'une série.



Statistique Numérique et Analyse des Données

qu'il n'est pas utile d'appliquer la méthodologie statistique aux données recueillies Afin que l'analyse statistique d'une série numérique ait un sens ...



La modélisation et lanalyse statistique des données expérimentales

[10]. La modélisation numérique de la formation du copeau a été développée pour mettre en évidence et évaluer des grandeurs inaccessibles par les analyses 



La modélisation et lanalyse statistique des données expérimentales

[10]. La modélisation numérique de la formation du copeau a été développée pour mettre en évidence et évaluer des grandeurs inaccessibles par les analyses 



Pratique de lanalyse des données numériques et textuelles avec

L'ouvrage de base qui accompagne les méthodes mises en oeuvre dans ce volet du logiciel Dtm-Vic a pour titre: "Statistique. Exploratoire Multidimensionnelle"1.



Statis-TIC : comprendre les statistiques avec le numérique _

statistique. Il peut s'avérer difficile de développer des compétences relatives à l'analyse statistique si les données fictives proposées ne permettent pas.



Statistiques descriptives et exercices

représentation graphique et le calcul de résumés numériques. La statistique est l'étude de la collecte de données leur analyse



Analyser les textes a lere des humanites numeriques

Cet article développe ces questions en interrogeant les soubassements théoriques de l'analyse statistique des données textuelles. Ce faisant il plaide en 



Master Mathématiques Appliquées Statistique de Rennes

Analyse de données. • Apprentissage (non) supervisé. • Modèles linéaires (scoring). • Séries temporelles. Spécialisation. Outils numériques.



Les apports dune analyse statistique des données textuelles pour

1 janv. 2018 L'arrivée depuis des dizaines d'années des outils numériques : documents numériques échanges par courriels

Arnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

1Statistique Numérique et Analyse des Données

Séance 1: Statistique Descriptive

Arnak DALALYAN

Ecole des Ponts ParisTechArnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

2Quelques Informations

Qui suis je?

Arnak Dalalyan, chercheur en Statistique

E-mail :dalalyan@imagine.enpc.frPage web du module : certis.enpc.fr/~dalalyan/StatNum.htmlOrganisation du cours

8 séances de 2h de cours/exercices.

4 séances de 2h sur machine (TP), en utilisant le logiciel R.

1 examen final (2h).

Evaluation :la note finale (NF) est calculée par la formule :

NF= (9CR+9EF+2NP)=20.CR: note moyenne des comptes-rendus des TP.EF: note de l"examen final.NP: note de participation (devoir maison, participation aux TP,...).

Arnak Dalalyan

Intro

Quelques infosMotivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

3Statistique : Motivations

Les statistiques sont utilisées dans des domaines très variés comme :en géophysique, pour les prévisions météorologiques, la climatologie, la pollution, etc;en démographie : le recensement permet de faire une photographie à un instant donné d"une population et permettra par la suite des

sondages dans des échantillons représentatifs;en sciences économiques et sociales, et en économétrie : l"étude du

comportement d"un groupe de population ou d"un secteur

économique s"appuie sur des statistiques;en marketing : le sondage d"opinion devient un outil pour la décision

ou l"investissement;en métrologie, pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes;en écologie (étude des communautés végétales et des écosystèmes)Au jour d"aujourd"hui, les connaissances statistiques sont indispensables pour un ingénieur, indépendamment de la spécialisation choisie!Arnak Dalalyan Intro

Quelques infos

MotivationsStat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

4Statistique : qu"est-ce que c"est?

La Statistique est une science qui comprend la collecte,

l"analyse, l"interprétation de données ainsi que la présentation deces ressources afin de les rendre compréhensibles de tous.collecte de données plan d"expérience;interprétation et présentation des données Statistique

Descriptive;analyse des données et aide à la décision Statistique Inférentielle;L"objectif de la Statistique en tant que discipline mathématique est

d"explorer les "propriétés fréquentielles» d"un jeu de données."propriétés fréquentielles» : les propriétés qui restent invariantes

par toute transformation des données (par exemple, la permutation)

qui ne modifie pas la fréquence des résultats.La Statistique est une science s"appuyant sur les probabilités!

Pour ceux qui ont des lacunes en probabilités, un cours de remise à

niveau a été proposé, dont les slides sont disponibles en ligne.Vous pouvez également consulter les chapitres 1-6 du polycopié de

la 1

èreannée

Arnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?Statistique Descriptive

Série numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

5Statistique DescriptiveArnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique DescriptiveSérie numérique

Histogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

6Série Numérique

On a à notre dispositionnvaleurs réelles - notéesx1;:::;xn-

constituant les résultats d"une certaine expérience répétéenfois.source : sondages, expérience scientifiques, enregistrements

historiques;problème : données volumineuses difficile à interpréter; objectif : résumer et trouver des outils de visualisation. On dit quex1;:::;xnsont les valeurs d"une variable (statistique) observées surnindividus.Une variable statistique est dite discrète si le nombre de valeurs prises par cette variable est petit devantn.Exemple : on lance 100 fois un dé à 6 faces. nombre d"observations : 100; nombre de valeurs prises : 6. La

variable est donc discrète.Une variable qui n"est pas discrète est ditecontinue.Exemple : Dans le but d"étudier les taux de contamination des sols

par la substance toxique PCB (biphenil polychlorinaté), 26 échantillons de sols ont été prélevés. Le taux de PCB contenus dans ces échantillons (mesurés en 10

4g par kg de sol) sont :3,5 1 1,6 12 8,1 5,3 23 8,2 1,8 9,8 1,5 9,7

9 15 24 11 107 18 29 49 94 12 16 22

Arnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numériqueHistogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

7Histogramme d"une série numérique

Variable discrète

La façon la plus répendue de représenter la répartition d"une série

statistique est basée sur la notion de l"histogramme.Pour une variablediscrète, on définit l"histogramme comme la

fonctionh:R!Nqui à chaquex2Rassocie le nombre d"éléments dans la sériex1;:::;xnégaux àx.Exemple : on lance 100 fois un dé à

6 faces.On obtient l"histogramme :Histogram of x

x

Frequency

123456

0 5 10 15

20Deux définitions coexistent :

h(x) =8 >>>:n X i=11l(xi=x);effectifs 1n n X i=11l(xi=x);fréquencesSur les appareils photo numériques, on voit souvent affiché l"histogramme des couleurs.Arnak Dalalyan Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numériqueHistogramme

Fn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

8Histogramme d"une série numérique

Variable continuePour une variablecontinue, on on commence par choisir une

partition deRen un nombre fini d"intervalles :I0;I1;:::;Ik.On dénombre ensuite le nombre d"observations dans chacun des

intervalles :nj=nX i=11l(xi2Ij).On définit l"histogrammeh(x)comme une fonction constante par morceaux donnée par : h(x) =njnjIjj;8x2Ij:Exemple :Dans le but d"étudier les taux de contamination des sols par la substance toxique PCB (biphenil po- lychlorinaté), 26 échantillons de sols ont été prélevés. Le taux de PCB contenus dans ces échantillons (me- surés en 10

4g par kg de sol) sont :

3,5 1:::1.5 9,7

9 15:::16 22

Histogram of a

a

Density

020406080100

0.00 0.01 0.02 0.03 0.04 0.05

Histogram of a

a

Density

020406080100120

0.00 0.01 0.02 0.03 0.04 0.05

Arnak Dalalyan

Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

HistogrammeFn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

9Fonction de répartition empirique

Une représentation alternative des fréquences des valeurs contenues dans une série numérique est la fonction de

répartition, appelée également histogramme cumulé.Pour unx2R, la valeur enxde la fonction de répartition d"une

série numériquex1;:::;xnest la proportion des éléments de la série inférieurs ou égaux àx:^Fn(x) =1n n X i=11l(xix)L"avantage de la fonction de répartition, comparé à l"histogramme, est que sa définition est identique dans le cas

d"une variable discrète et dans le cas d"une variable continue.Dans les deux exemples précédents :01234567

0.0 0.2 0.4 0.6 0.8 1.0 fonction de réparition empirique Fn(x) l l l l l l

020406080100120

0.0 0.2 0.4 0.6 0.8 1.0 fonction de réparition empirique Fn(x) l l l l l l l l l l l l l l l l l l l l l l lArnak Dalalyan Intro

Quelques infos

Motivations

Stat. : qu"est-ce que c"est?

Statistique Descriptive

Série numérique

HistogrammeFn de répartition

Statistiques d"une série

Tendance centrale

Dispersion

Stats d"ordre

Boxplots

Exercice

Deux séries

Covariance

Nuage des points

Droite de régression

QQ-plot

Exemple de Galton1

10Meilleure vue des FdR

01234567

0.0 0.2 0.4 0.6 0.8 1.0 fn de réparition empirique Fn(x) l l l l l l

020406080100120

0.0 0.2 0.4 0.6 0.8 1.0 fn de réparition empirique Fn(x) l l l l l l l l l l l l l l l l lquotesdbs_dbs23.pdfusesText_29
[PDF] Anglais Economique et Financier - Ecole Normale Supérieure de

[PDF] cours d anglais medical tous niveaux - ESE

[PDF] Livret d 'accompagnement du programme d 'arts appliqués et cultures

[PDF] ASSISTANT DE DIRECTION COmpéTENCES DE bASE

[PDF] Chapitre 5 Présentation des états financiers - Procomptablecom

[PDF] ce2 histoire-géographie - Académie en ligne

[PDF] Présentation diffusée lors de la rencontre d 'information le - mddelcc

[PDF] pae informatique (classe de 6eme) - Epi asso

[PDF] INFO-F-302, Cours d 'Informatique Fondamentale Logique - ULB

[PDF] Module M1 Elément 2 : Informatique 1 (I1)

[PDF] Extranet Ecole du Louvre

[PDF] 1- Cours de science politique - Faculté des Sciences Juridiques

[PDF] 1 GRAMMAIRE ORTHOGRAPHE VOCABULAIRE

[PDF] cours acoustique musicale 301 - Fabrice Sincère - Pagesperso

[PDF] Cours d approvisionnement en eau potable - Programme Solidarité