[PDF] Statistiques pour statophobes entendu je devais utiliser les





Previous PDF Next PDF



Statistiques pour statophobes

entendu je devais utiliser les méthodes d'analyse statistique pour les besoins de honnêtement qu'il est différent de beaucoup d'autres livres de stats.



Livre de poche des statistiques mondiales édition 2020

30 jui. 2020 Pour les statistiques et publications statistiques ... ~0.0 Non nul mais inférieur à la moitié de l'unité employée.



Cours de Statistiques niveau L1-L2

7 mai 2018 Des livres. Gilbert Saporta Probabilités



Statistiques descriptives et exercices

La somme pour i variant de 1 à n. V.S. La variable statistique. Me. La médiane. Me+. Me par valeur supérieure. Me?.



Cours de Statistiques inférentielles

x est un entier positif ou nul est remplacé par P(X ? x + 0 5). Définition 8 On appelle statistique sur un n-échantillon une fonction de (X1



Résumé du Cours de Statistique Descriptive

15 déc. 2010 plitude) pour une série statistique de n observations. ... Si le coefficient de corrélation est nul ou proche de zéro il n'y a pas de.



Livre de poche des statistiques mondiales édition 2021

Pour les statistiques et publications statistiques http://unstats.un.org/unsd/ (En anglais ~0.0 Non nul mais inférieur à la moitié de l'unité employée.



Les API pour les Nuls® Édition limitée IBM

EN OUTRE LE LECTEUR. EST INFORMÉ QUE LES SITES WEB CITÉS DANS CET OUVRAGE PEUVENT AVOIR ÉVOLUÉ OU DIS-. PARU ENTRE LE MOMENT OÙ CE LIVRE A ÉTÉ ÉCRIT ET CELUI 



Introduction a la statistique.

C'est avant tout un livre d f initiation qui vise a 1'acquisition de techniques de base partie de la population statistique sur laquelle porte l f en-.



Statistique Descriptive Multidimensionnelle (pour les nuls)

Ce document est consacré aux trois méthodes les plus courantes de la statitique descriptive multidimensionnelle : l'Analyse en Composantes Principales 

Statistiques

pour statophobes

Une introduction au monde des tests statistiques

à l'intention des étudiants qui n'y entravent que pouic et qui détestent les maths par dessus le marché

Denis Poinsot

2004

La libre reproduction et la diffusion de ce document sont non seulement autorisées mais les bienvenues du

moment qu"elles sont réalisées dans un but pédagogique et non lucratif.

Pour citer ce document :

D. Poinsot, 2004. Statistiques pour statophobes. [en ligne : http://perso.univ-rennes1.fr/denis.poinsot]

Ce petit livre est dédié avec reconnaissance à René Merckhoffer, mon extraordinaire prof de maths de classe de seconde au lycée des sept mares d"Elancourt en 1982, pour son humour pince sans rire, mais surtout pour avoir réussi à m"arracher - même très momentanément - du fond de l"abîme mathématique dans lequel j"avais sombré sans espoir de revoir la lumière du jour. S"il n"avait pas été là au bon moment je n"aurais tout simplement pas pu faire d"études scientifiques. Je suis biologiste, et non statisticien. Circonstance aggravante, j"ai collectionné les mauvaises notes en mathématiques sans interruption à partir de la classe de 5ème, litanie interrompue seulement par l"obtention d"une thèse de doctorat en biologie évolutive

1. Je pense donc être

idéalement qualifié pour expliquer les bases des méthodes statistiques aux étudiants en

biologie réfractaires aux maths. Si vous voulez bien mettre de côté une incrédulité très

naturelle à ce stade de votre lecture, vous réaliserez que cela n"est peut être pas si idiot que ça

en a l"air. Bien sûr, les manuels d"introduction aux statistiques pullulent, rédigés par de

véritables bio-mathématiciens et statisticiens infiniment plus doués que moi dans leur

discipline. Et c"est justement là le problème. Malgré toute leur science, mes chers collègues

(dont j"envie sincèrement les compétences) ne pourront jamais se mettre complètement à la

place d"un étudiant ne comprenant rien aux maths, parce que, anciens étudiants "matheux", ils n"ont jamais connu cette humiliante expérience eux-mêmes. Moi, si. J"y suis même

régulièrement confronté chaque fois que je me heurte durement aux étroites limites de mon

savoir dans cette discipline. Je sais tout de la frustration, voire de la rage que l"on peut

ressentir face à l""explication" d"une méthode dont on a besoin pour analyser ses résultats,

mais que le manuel décrit uniquement dans un langage mathématique pur et dur. Soyons

clairs, je ne blâme évidemment pas les mathématiciens pour l"utilisation d"un langage

symbolique précis et rigoureux, il est indispensable à leur discipline. Je souhaiterais

cependant qu"ils essayent davantage de comprendre que le pékin moyen ne lit pas cette langue couramment.

Lorsque j"ai eu à enseigner pour la première fois sans bénéficier de la présence rassurante

d"un collègue expérimenté, j"étais un étudiant en fin de thèse très heureux de faire de la

biologie, ma passion depuis aussi longtemps que je me souvienne d"avoir été à l"école. Bien

entendu, je devais utiliser les méthodes d"analyse statistique pour les besoins de ma recherche, mais mon directeur de thèse, chercheur au CNRS, m"apportait alors tout son soutien et sa

vaste expérience. J"utilisais en fait à l"époque les techniques statistiques avec la foi enfantine

d"un homme des cavernes regardant dans un microscope. Je savais en gros que lorsque mon

test révélait que " P < 0,05 » il y avait un effet significatif dont je pouvais discuter, et que

sinon je devais tristement m"abstenir de conclure. Or donc, j"eus la chance d"obtenir un contrat d"enseignement de un an pour finir ma thèse. C"est alors qu"on m"annonça que j"allais y

assurer des travaux dirigés de... probabilités et statistiques, à des étudiants de première année.

Je me souviens encore de la sensation que tout mon sang venait de se congeler dans mes

1 Une fois que vous êtes docteur, plus personne n"ose mettre en doute vos compétences en mathématiques en

vous obligeant à passer des examens écrits. C"est un des multiples avantages de notre beau métier.

veines. Cependant, les prouesses dont l"être humain est capable lorsqu"il ne peut fuir et que le

combat est la seule issue sont véritablement étonnantes. Je parvint en effet à assurer les

séances prévues, en les préparant évidemment frénétiquement, physiquement malade de

terreur avant chaque TD, et totalement épuisé à la fin. Et à ma grande surprise, je me mis à

comprendre des choses qui m"étaient pourtant passées des kilomètres au dessus de la tête lorsque j"étais étudiant..

Un an plus tard (c"était vers la fin du XXème siècle), recruté à l"université de Rennes comme

maître de conférences (en biologie et non en stats, est il besoin de le préciser ?), j"ai eu a

nouveau l"opportunité d"enseigner les biostatistiques de base, cette fois à des étudiants de

maîtrise de biologie devant les utiliser pour analyser des données de terrain. J"ai alors pris une

folle décision : écrire pour ces étudiants le manuel de stats que j"aurais aimé avoir lorsque

j"étais moi même traumatisé par cette matière maudite. Le résultat est entre vos mains.

J"espère que ce petit ouvrage vous sera utile et même qu"il vous plaira, parce que je pense honnêtement qu"il est différent de beaucoup d"autres livres de stats. J"en ai tant bavé

2 pour

comprendre le peu que je sais dans cette discipline, que j"ai soigneusement évité les

"explications" telles que : " soit ( W, F, p) un espace probabilisé modélisant une espérance

finie » qui m"ont toujours donné envie de posséder un lance flammes. Ce livre est donc écrit

en français normal. Il contient même nombre de remarques plus ou moins saugrenues, parce

que je suis viscéralement incapable de résister à l"envie de dire (et d"écrire) des bêtises, juste

pour rire. Depuis sa première version, imprimée sous forme de polycopié en octobre 1998, et

profondément remaniée cet été, cet ouvrage a été testé par environ 900 étudiants de maîtrise,

qui l"ont utilisé pour analyser leurs données de terrain. Quelques uns ont eu la gentillesse de

m"en dire du bien. Quasiment tous m"ont fait remarquer que je parlais trop. Ils ont évidemment raison (au moins sur le second point). Je vous invite donc à tourner la page.

Denis Poinsot,

Rennes le 11 octobre 2004

2 et je suis poli.

1. Pourquoi des stats en biologie?

toute l"Eurasie.

¾ Rigoureusement exact.

¾ Pourriez vous nous dire quel est le poids total de votre dernier modèle décapotable 450 C ?

¾ Le poids total de notre modèle 450 C, réservoirs vides, est de 1251 kg exactement. ¾ Et comment cela se compare t-il avec les caractéristiques de sa principale rivale ? ¾ Je présume que vous faites référence à la WMB 3.0i?

¾ Bien entendu.

¾ Et bien notre voiture pèse précisément 47kg de moins que sa concurrente, qui atteint en

effet 1298kg dans les mêmes conditions. ¾ Peut on en conclure que la Bercedès-Mens 450 C est plus légère que la WBM 3.0i ?

¾ C"est l"évidence même.

¾ Tout le plaisir a été pour moi.

Que de précision, que de rigueur... " Ah ces Allemands tout de même ! » direz vous d"un air

admiratif. Peut être, cependant tout constructeur automobile n"aurait eu aucune peine à faire le

même genre de réponse ferme et définitive. Avant d"analyser pourquoi, voyons d"abord un

dialogue identique au précédent dans sa structure, mais en fait fondamentalement différent...

¾ Robert Lebouvier vous êtes l"expert mondial incontesté de la race bovine charolaise.

¾ C"est ce qu"on dit.

¾ Pourriez vous nous dire combien pèse un taureau Charolais de trois ans ?

¾ Eh bien, disons... entre 800 kg et 1,2 tonnes à peu près, mais certains arrivent même à être

encore plus gros. Ils sont plus légers bien sûr si la pâture n"a pas été bonne, et puis il faut

savoir qui étaient le père et la mère hein, parce que la génétique... ¾ Heu... oui... bien..., et comment ces résultats peuvent ils se comparer avec ceux de la race

Holstein ?

¾ Les taureaux Holstein font plutôt 700kg à 1 tonne mais là encore ça dépend du type

d"élevage et de l"alimentation qui... ¾ Certes, mais alors peut on dire que les taureaux Holstein sont plus légers que les taureaux

Charolais ?

¾ Ben... en général peut être... quoique si par exemple vous prenez " Lulu le Tarbais », qui

a été primé au dernier salon de... ¾ Je vois. Le temps qui nous était imparti touche hélas à son terme, merci beaucoup pour cette intervention, et maintenant une page de publicité.

Robert Lebouvier est il vraiment l"expert qu"il prétend être, lui qui est visiblement incapable

de donner une réponse claire et nette sur un sujet qu"il connaît soi-disant à fond ? Doit on

l"accabler ? Non, évidemment. Contrairement aux voitures, les taureaux ne sont pas construits

dans des conditions contrôlées et à partir de pièces qui sont automatiquement rejetées si elles

ne satisfont pas le cahier des charges. Résultat : un produit non calibré. Il est impossible

d"échapper à cette marge d"incertitude, intrinsèque à tout phénomène vivant. Chaque

caractéristique d"un organisme (qu"il s"agisse de sa masse ou de son comportement à un

moment précis) résulte de l"interaction entre son génome (plusieurs milliers de gènes, donc

une infinité de combinaisons possibles) et l"environnement, lui même fort variable. Le résultat

final est ce que vous en connaissez : une myriade d"individus tous différents, même s"ils

appartiennent à la même espèce, même s"ils ont le même père et la même mère. Toute

expérience visant à estimer la différence (éventuelle) entre deux groupes d"individus pour un

caractère donné (le poids moyen dans notre exemple, ou le temps de réaction après un

stimulus) ne peut donc pas s"appuyer sur un seul exemplaire de chaque groupe pris au hasard.

Cette approche était pourtant valable pour comparer deux modèles manufacturés (c"est le

principe du magazine " Que Choisir »). En biologie, la grande variabilité des individus oblige à se baser sur des échantillons de plusieurs individus (et tant mieux s"ils sont nombreux).

Le problème qu"il faut bien avoir à l"esprit est que la variabilité du résultat n"en disparaît pas

pour autant. Puisque tous les individus biologiques sont différents, il n"y aura jamais deux

échantillons semblables !

Mais assez d"exemples théoriques, passons à de véritables données scientifiques et voyons

si une personne raisonnable et compétente a vraiment besoin de tout un attirail mathématique pour les interpréter. La figure 1.2 montre le résultat d"une expérience d"écotoxicologie A B Figure 1.1 Les méfaits des fluctuations d "échantillonnage. A: Deux échantillons, même fort différents, ne proviennent pas nécessairement de deux populations différentes. B : Deux échantillons, même fort semblables, ne proviennent pas nécessairement de deux populations semblables.

(Ishimata & Takahiro, 1967) dont le but était d"établir l"impact potentiel de la cyano-

cobalamine

3 (un puissant polluant cyanuré issu de l"industrie minière à ciel ouvert, fréquente à

l"époque) sur le rendement du riz.

Figure 1.2

. Effect of cyano-cobalamine on rice yield in dry farming conditions. Means of three replicates per treatment (kg per plot). D"après Ishimata & Takahiro, 1967, J. Tropical Rice Res.

12:459-463.

Cette figure montre la moyenne du rendement obtenu en comparant deux modalités (sol non

pollué vs sol pollué par la cyanocobalamine), avec trois répétitions (=trois parcelles

expérimentales) par modalité. Ces résultats montrent de manière indiscutable que le

rendement moyen obtenu dans les trois parcelles polluées est inférieur au rendement moyen

obtenu dans les trois parcelles témoin (non polluées). Ressentez vous le besoin irrésistible de

calculer quelques intégrales ou autres logarithmes avant d"interpréter ces résultats ? Non, bien

entendu. Il est clair que ce polluant a un impact négatif sur le rendement du riz, et il n"y a franchement rien d"étonnant là dedans. Figure 1.3. Effect of pentacycline (20mg/kg) on survival rate (%) 24 hours post treatment in mice inoculated with Salmonella sp.(intra peritoneal route). N=30 per treatment. (D"après Wilkins &

Fretwell 1998. J. Rodent Med. Assoc. 53:289-292).

La figure 1.3 montre le résultat d"un essai antibiotique préliminaire (Wilkins & Fretwell,

1998) dans lequel soixante souris ont été inoculées (par injection dans la cavité péritonéale)

avec une souche potentiellement mortelle de Salmonella sp., bactérie tristement célèbre pour

les nombreux cas d"intoxication alimentaire qu"elle provoque chaque année. Après cette

injection, 30 souris tirées au hasard (lot témoin) sont laissées tranquille, tandis que les 30

autres (lot traité) reçoivent une dose de Pentacycline (un antibiotique à large spectre dont on

espère qu"il est actif in vivo sur cette souche de Salmonelle). On examine les sujets 24heures

3 DIMETHYL-5,6 BENZIMIDAZOLYL)-ALPHA CO-CYANO COBAMIDE

354045505560

Control Cyano-cobalamine

010203040506070

Control Pentacycline

après. Comme vous pouvez le voir sur la figure 1.3, seules 37% des souris du lot témoin ont survécu, alors que cette proportion est de 60% dans le lot traité avec l"antibiotique. Il est manifeste que l"antibiotique a eu un effet positif - même s"il est améliorable, il faudrait probablement augmenter la dose - sur le traitement de l"infection. Encore une fois, avez

vous ressenti une envie pressante de faire des mathématiques compliquées avant d"interpréter

des résultats aussi limpides ? Bien sûr que non ! Et vous avez eu tort. Précisons tout d"abord que les deux expériences décrites ci-dessus

n"ont jamais eu lieu, que la cyanocobalamine n"est pas un puissant polluant cyanuré de

l"industrie minière (il s"agit en fait de la vitamine B12, anti-anémique), que les noms des

chercheurs cités sont imaginaires, que la pentacycline n"existe pas (la tétracycline oui, et c"est

bien un antibiotique), que le Journal de l"Association Médicale des Rongeurs (J. Rodent Med. Assoc.) n"existe pas non plus, et précisons enfin qu"aucune adorable petite souris n"a subi de

mauvais traitements pour les besoins de la rédaction de cet ouvrage. Donc, j"aurais inventé ces

résultats ? Pas exactement. Ils ont été générés aléatoirement (tirés au hasard) par ordinateur.

Le prétendu "rendement moyen" de la pseudo expérience sur le riz a été obtenu en prenant la

moyenne de 30 nombres tirés au hasard entre 0 et 100. La figure 1.2 montre donc en fait les moyennes obtenues lors de deux séries de 30 tirages aléatoires chacune. La différence entre

ces deux moyennes (cette différence est réelle, et on la voit très bien sur la figure) est

évidemment un pur hasard. J"ai également utilisé une astuce bien connue des professionnels

du marketing : l"échelle des ordonnées ne part pas de zéro, ce qui permet de rendre la

différence de hauteur entre les barres de l"histogramme plus impressionnante que dans la

réalité. Si jamais vous voyez une échelle Y qui ne part pas de zéro, méfiez-vous, on essaie de

vous vendre quelque chose (par exemple que les chiffres du chômage ont baissé de manière spectaculaire).

De même, le "taux de survie à 24h" de mes deux lots de 30 souris virtuelles a été obtenu en

réalisant à chaque fois 30 tirages aléatoires avec comme résultat possible 0 (souris morte) ou 1

(souris vivante), chacun ayant la même probabilité (une chance sur deux), soit l"équivalent de

tirer 30 fois à pile ou face. Le "taux de survie" est simplement le nombre de 1 obtenus, divisé

par 30 et multiplié par 100 pour permettre d"afficher un pourcentage. Là encore, la différence

observée entre les deux pourcentages obtenus (cette différence est réelle, on la voit bien sur la

figure) est due entièrement au hasard. Et alors ? A quoi rime ce canular de gamin ? Il démontre mine de rien une chose importante, qui est que le hasard peut très facilement provoquer des différences notablesquotesdbs_dbs21.pdfusesText_27
[PDF] les stratégies industrielles

[PDF] les structures algébriques exercices corrigés pdf

[PDF] les structures de l'entreprise schéma

[PDF] les structures et mécanismes de défense de lacacia caffra

[PDF] les structures organisationnelles de l'entreprise

[PDF] les structures organisationnelles pdf

[PDF] les suffragettes correction

[PDF] les suites numériques exercices corrigés pdf mpsi

[PDF] les sujet de 2eme année moyenne anglais

[PDF] les sujets du droit international public pdf

[PDF] les supports didactiques

[PDF] les synonymes exercices pdf

[PDF] les systèmes de distribution

[PDF] les systèmes éducatifs européens étude comparée

[PDF] les taches d'un chef comptable