Statistique Numérique et Analyse des Données - Séance 1
Quelques infos. Motivations. Stat. : qu'est-ce que c'est ? Statistique Descriptive. Série numérique. Histogramme. Fn de répartition. Statistiques d'une série.
Statistique Numérique et Analyse des Données
qu'il n'est pas utile d'appliquer la méthodologie statistique aux données recueillies Afin que l'analyse statistique d'une série numérique ait un sens ...
La modélisation et lanalyse statistique des données expérimentales
[10]. La modélisation numérique de la formation du copeau a été développée pour mettre en évidence et évaluer des grandeurs inaccessibles par les analyses
La modélisation et lanalyse statistique des données expérimentales
[10]. La modélisation numérique de la formation du copeau a été développée pour mettre en évidence et évaluer des grandeurs inaccessibles par les analyses
Pratique de lanalyse des données numériques et textuelles avec
L'ouvrage de base qui accompagne les méthodes mises en oeuvre dans ce volet du logiciel Dtm-Vic a pour titre: "Statistique. Exploratoire Multidimensionnelle"1.
Statis-TIC : comprendre les statistiques avec le numérique _
statistique. Il peut s'avérer difficile de développer des compétences relatives à l'analyse statistique si les données fictives proposées ne permettent pas.
Statistiques descriptives et exercices
représentation graphique et le calcul de résumés numériques. La statistique est l'étude de la collecte de données leur analyse
Analyser les textes a lere des humanites numeriques
Cet article développe ces questions en interrogeant les soubassements théoriques de l'analyse statistique des données textuelles. Ce faisant il plaide en
Master Mathématiques Appliquées Statistique de Rennes
Analyse de données. • Apprentissage (non) supervisé. • Modèles linéaires (scoring). • Séries temporelles. Spécialisation. Outils numériques.
Les apports dune analyse statistique des données textuelles pour
1 janv. 2018 L'arrivée depuis des dizaines d'années des outils numériques : documents numériques échanges par courriels
Arnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
1Statistique Numérique et Analyse des Données
Séance 1: Statistique Descriptive
Arnak DALALYAN
Ecole des Ponts ParisTechArnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
2Quelques Informations
Qui suis je?
Arnak Dalalyan, chercheur en Statistique
E-mail :dalalyan@imagine.enpc.frPage web du module : certis.enpc.fr/~dalalyan/StatNum.htmlOrganisation du cours8 séances de 2h de cours/exercices.
4 séances de 2h sur machine (TP), en utilisant le logiciel R.
1 examen final (2h).
Evaluation :la note finale (NF) est calculée par la formule :NF= (9CR+9EF+2NP)=20.CR: note moyenne des comptes-rendus des TP.EF: note de l"examen final.NP: note de participation (devoir maison, participation aux TP,...).
Arnak Dalalyan
IntroQuelques infosMotivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
3Statistique : Motivations
Les statistiques sont utilisées dans des domaines très variés comme :en géophysique, pour les prévisions météorologiques, la climatologie, la pollution, etc;en démographie : le recensement permet de faire une photographie à un instant donné d"une population et permettra par la suite dessondages dans des échantillons représentatifs;en sciences économiques et sociales, et en économétrie : l"étude du
comportement d"un groupe de population ou d"un secteuréconomique s"appuie sur des statistiques;en marketing : le sondage d"opinion devient un outil pour la décision
ou l"investissement;en métrologie, pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes;en écologie (étude des communautés végétales et des écosystèmes)Au jour d"aujourd"hui, les connaissances statistiques sont indispensables pour un ingénieur, indépendamment de la spécialisation choisie!Arnak Dalalyan IntroQuelques infos
MotivationsStat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
4Statistique : qu"est-ce que c"est?
La Statistique est une science qui comprend la collecte,l"analyse, l"interprétation de données ainsi que la présentation deces ressources afin de les rendre compréhensibles de tous.collecte de données plan d"expérience;interprétation et présentation des données Statistique
Descriptive;analyse des données et aide à la décision Statistique Inférentielle;L"objectif de la Statistique en tant que discipline mathématique estd"explorer les "propriétés fréquentielles» d"un jeu de données."propriétés fréquentielles» : les propriétés qui restent invariantes
par toute transformation des données (par exemple, la permutation)qui ne modifie pas la fréquence des résultats.La Statistique est une science s"appuyant sur les probabilités!
Pour ceux qui ont des lacunes en probabilités, un cours de remise àniveau a été proposé, dont les slides sont disponibles en ligne.Vous pouvez également consulter les chapitres 1-6 du polycopié de
la 1èreannée
Arnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?Statistique DescriptiveSérie numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
5Statistique DescriptiveArnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique DescriptiveSérie numérique
Histogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
6Série Numérique
On a à notre dispositionnvaleurs réelles - notéesx1;:::;xn-constituant les résultats d"une certaine expérience répétéenfois.source : sondages, expérience scientifiques, enregistrements
historiques;problème : données volumineuses difficile à interpréter; objectif : résumer et trouver des outils de visualisation. On dit quex1;:::;xnsont les valeurs d"une variable (statistique) observées surnindividus.Une variable statistique est dite discrète si le nombre de valeurs prises par cette variable est petit devantn.Exemple : on lance 100 fois un dé à 6 faces. nombre d"observations : 100; nombre de valeurs prises : 6. Lavariable est donc discrète.Une variable qui n"est pas discrète est ditecontinue.Exemple : Dans le but d"étudier les taux de contamination des sols
par la substance toxique PCB (biphenil polychlorinaté), 26 échantillons de sols ont été prélevés. Le taux de PCB contenus dans ces échantillons (mesurés en 104g par kg de sol) sont :3,5 1 1,6 12 8,1 5,3 23 8,2 1,8 9,8 1,5 9,7
9 15 24 11 107 18 29 49 94 12 16 22
Arnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numériqueHistogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
7Histogramme d"une série numérique
Variable discrète
La façon la plus répendue de représenter la répartition d"une sériestatistique est basée sur la notion de l"histogramme.Pour une variablediscrète, on définit l"histogramme comme la
fonctionh:R!Nqui à chaquex2Rassocie le nombre d"éléments dans la sériex1;:::;xnégaux àx.Exemple : on lance 100 fois un dé à6 faces.On obtient l"histogramme :Histogram of x
xFrequency
123456
0 5 10 1520Deux définitions coexistent :
h(x) =8 >>>:n X i=11l(xi=x);effectifs 1n n X i=11l(xi=x);fréquencesSur les appareils photo numériques, on voit souvent affiché l"histogramme des couleurs.Arnak Dalalyan IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numériqueHistogramme
Fn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
8Histogramme d"une série numérique
Variable continuePour une variablecontinue, on on commence par choisir unepartition deRen un nombre fini d"intervalles :I0;I1;:::;Ik.On dénombre ensuite le nombre d"observations dans chacun des
intervalles :nj=nX i=11l(xi2Ij).On définit l"histogrammeh(x)comme une fonction constante par morceaux donnée par : h(x) =njnjIjj;8x2Ij:Exemple :Dans le but d"étudier les taux de contamination des sols par la substance toxique PCB (biphenil po- lychlorinaté), 26 échantillons de sols ont été prélevés. Le taux de PCB contenus dans ces échantillons (me- surés en 104g par kg de sol) sont :
3,5 1:::1.5 9,7
9 15:::16 22
Histogram of a
aDensity
020406080100
0.00 0.01 0.02 0.03 0.04 0.05Histogram of a
aDensity
020406080100120
0.00 0.01 0.02 0.03 0.04 0.05Arnak Dalalyan
IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
HistogrammeFn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
9Fonction de répartition empirique
Une représentation alternative des fréquences des valeurs contenues dans une série numérique est la fonction derépartition, appelée également histogramme cumulé.Pour unx2R, la valeur enxde la fonction de répartition d"une
série numériquex1;:::;xnest la proportion des éléments de la série inférieurs ou égaux àx:^Fn(x) =1n n X i=11l(xix)L"avantage de la fonction de répartition, comparé à l"histogramme, est que sa définition est identique dans le casd"une variable discrète et dans le cas d"une variable continue.Dans les deux exemples précédents :01234567
0.0 0.2 0.4 0.6 0.8 1.0 fonction de réparition empirique Fn(x) l l l l l l020406080100120
0.0 0.2 0.4 0.6 0.8 1.0 fonction de réparition empirique Fn(x) l l l l l l l l l l l l l l l l l l l l l l lArnak Dalalyan IntroQuelques infos
Motivations
Stat. : qu"est-ce que c"est?
Statistique Descriptive
Série numérique
HistogrammeFn de répartition
Statistiques d"une série
Tendance centrale
Dispersion
Stats d"ordre
Boxplots
Exercice
Deux séries
Covariance
Nuage des points
Droite de régression
QQ-plot
Exemple de Galton1
10Meilleure vue des FdR
01234567
0.0 0.2 0.4 0.6 0.8 1.0 fn de réparition empirique Fn(x) l l l l l l020406080100120
0.0 0.2 0.4 0.6 0.8 1.0 fn de réparition empirique Fn(x) l l l l l l l l l l l l l l l l lquotesdbs_dbs23.pdfusesText_29[PDF] cours d anglais medical tous niveaux - ESE
[PDF] Livret d 'accompagnement du programme d 'arts appliqués et cultures
[PDF] ASSISTANT DE DIRECTION COmpéTENCES DE bASE
[PDF] Chapitre 5 Présentation des états financiers - Procomptablecom
[PDF] ce2 histoire-géographie - Académie en ligne
[PDF] Présentation diffusée lors de la rencontre d 'information le - mddelcc
[PDF] pae informatique (classe de 6eme) - Epi asso
[PDF] INFO-F-302, Cours d 'Informatique Fondamentale Logique - ULB
[PDF] Module M1 Elément 2 : Informatique 1 (I1)
[PDF] Extranet Ecole du Louvre
[PDF] 1- Cours de science politique - Faculté des Sciences Juridiques
[PDF] 1 GRAMMAIRE ORTHOGRAPHE VOCABULAIRE
[PDF] cours acoustique musicale 301 - Fabrice Sincère - Pagesperso
[PDF] Cours d approvisionnement en eau potable - Programme Solidarité