Principe des tests statistiques 1 Principe des tests statistiques
1 6 Liens entre p-value et statistique de test dans quelques cas simples Soit H 0 une hypoth ese privil egi ee On d esire tester cette hypoth ese vis a vis d’une hy-poth ese alternative Soit Tla statistique de test ( a valeurs r eelles) utilis ee pour e ectuer le test de H 0, c’est- a-dire v eri er si H 0 est vraie On d esigne par P
Tests d’hypothèse - WordPresscom
Un test statistique ou une statistique est une fonction des variables aléatoires représentant l’échantillon dont la valeur numérique obtenue pour l’échantillon considéré permet de distinguer entre H0 vraie et H0 fausse Dans la mesure où la loi de probabilité suivie par le paramètre p0 au niveau de la population
Exercices et problèmes de statistique et probabilités
Exercices et problèmes de statistique et probabilités Thérèse Phan Jean-Pierre Rowenczyk 2e édition “doc” (Col : Science Sup 19 3x250) — 2012/4/27 — 14:21 — page i — #1
Fiche 19 – Statistiques : Comparaison de séries
La médiane d'une série statistique est la valeur pour laquelle il y a autant d'individus « avant » que d'individus « après » Pour la classe1, la médiane est la 11ème valeur (en effet, l'effectif total est de 21, à la 11ème valeur il y aura 10 élèves avants et 10 après : 21 = 10 + 1 + 10) : c'est donc 3
Schémas Winograd en français: une étude statistique et
établit que nos schémas sont résistants à un test statistique basé sur l’information mutuelle; la seconde est une étude comportementale qui permet de montrer que les humains n’ont pas de difficulté pour traiter correctement les items de notre collection Notre test statistique simple ne parvient pas à
Procédures de test de la racine unitaire
la statistiquet usuelle du test de l’hypothèse nulle ρ=1, mais aussi un test de l’hypothèse nulle jointe b p = 0 et ρ=1 Les tests sont effectués à l’aide de statistiques transformées suivant la méthodologie de Phillips et Perron, leurs valeurs critiques sont obtenues par des méthodes de simulation pour p=2,3,4 et 5 (OPP,1989, p
exercices corrigés Mathématiques appliquées à la gestion
complØmentaires : l’observation statistique s’effectue à des dates discrŁtes, tandis que l’analyse thØorique repose plus volontiers sur la thØorie des fonctions, plus performante à cet Øgard
Traitement et analyse des données qualitatives
o la seconde étape a pour but de repérer les mots-clés en recherchant ceux qui sont équivalents ou synonymes L’unité d’analyse sémantique Dans ce cas l'étude peut se limiter aux passages qui ont une signification « les idées clés » au lieu de découper le texte dans son intégralité, comme dans l’analyse syntaxique (Andreani,
Les méthodes d’échantillonnage
Un chiffre tiré au hasard dans la table ne peut être retenu une seconde fois s’il ressort Par ailleurs, si le chiffre de la table ne fait pas partie des numéros attribués à votre base de sondage il ne doit pas être pris en compte Exemple On veut choisir par échantillonnage aléatoire simple, sans remise, 8 étudiants; parmi un groupe
[PDF] le système d'information contribue-t-il ? l'efficacité de la prise de décision
[PDF] controle stratégique management
[PDF] maths 1ere es suites exercices corrigés
[PDF] une personne loue une maison ? partir du 1er janvier 1991
[PDF] controle sur les suites numériques 1ere s
[PDF] ds suite arithmétique 1s
[PDF] ds suite arithmétique et géométrique
[PDF] ds recurrence
[PDF] devoir raisonnement par recurrence
[PDF] controle recurrence ts
[PDF] dm de maths terminale s recurrence
[PDF] calculer u1 et u2 la suite un est elle arithmétique géométrique
[PDF] ds suites arithmétiques et géométriques 1ere s
[PDF] controle sur les suites terminale s
Principe des tests statistiques
Jean Vaillant, Octobre 2020
1 Principe des tests statistiques
1.1 Introduction
Un test de signication est une procedure permettant de choisir parmi deux hypotheses celles la plus probable au vu des observations eectuees a partir d'un echantillon ou un dis- positif experimental. Ces deux hypotheses sont disjointes c'est-a-dire s'excluent mutuelle- ment. Les hypotheses auxquelles on s'interesse portent generalement sur un ou plusieurs parametres de la population statistique etudiee : ainsi, si l'on s'interesse a un caractere par- ticulier, on pourra par exemple tester l'egalite de l'esperance du caractere avec une valeur de reference. Par exemple, on peut desirer tester l'egalite d'une contenance attendue de bouteilles commercialisees, avec une valeur de reference en l'occurrence la contenance in- diquee sur l'etiquette commerciale. Un inspecteur de la direction de la consommation peut choisir un certain nombre de bouteilles dans la production de l'usine concernee. Sachant qu'il y a un alea d'echantillonnage et une variabilite dans le systeme de remplissage des bouteilles, comment tranchera t-il entre l'hypothesela contenance attendue est egale a la contenance annonceeet l'alternative contraire? Un autre exemple est celui de l'epidemio-surveillance d'une maladie concernant les bananiers dans une zone de plantation. Des bananiers sont choisis selon une procedure d'echantillonnage et sont examines an de distinguer ceux qui sont sains de ceux qui sont malades. On desire savoir si la prevalence de la maladie depasse un seuil sanitaire au dela duquel un traitement par pesticide sera applique dans la zone concernee.1.2 Erreurs decisionnelles et risques
Le principe de base d'un test de signication est de considerer une hypothese privilegiee H0et une alternativeH1, puis de b^atir une regle permettant de decider de rejeter ou
pasH0. Le tableau 1 resume les 4 situations possibles. L'erreur de premiere espece est de rejeter l'hypothese privilegieeH0alors qu'elle est vraie. L'erreur de seconde espece est de ne pas rejeterH0alors qu'elle est fausse.est la probabilite de rejeter a tort l'hypothese H0;est aussi appele risque de premiere espece, ou niveau du test.est la probabilite
de ne pas rejeterH0alors que l'hypothese alternativeH1est vraie;est appele risque de seconde espece. La valeur 1est la puissance du test, et traduit la faculte de rejeter H0quand l'alternativeH1est vraie.
Dans la pratique,est xe par l'experimentateur (les valeurs les plus courantes sont0,05 ou 0,01. On dit qu'on contr^ole le risque de premiere espece. Par contre,peut ^etre
dicile a calculer. Heureusement, ce calcul n'est pas necessaire sauf si l'on veut comparer plusieurs procedure de tests.1 Dans la litterature,H0est aussi appeleehypothese nulleou encorehypothese principale. Elle joue un r^ole predominant par rapport a l'hypotheseH1qui est souvent l'hypothese alternative contraire. On cherche a contr^oler le risquede rejeter a tortH0en lui imposant une valeur relativement faible (au plus 0,05). Le fait d'imposer une valeur faible aconduit a n'abandonner l'hypotheseH0que dans des cas quisemblent sortir nettement de l'ordinairesiH0etait vraie.Etat de la natureH
0H1DecisionRejet deH01Non rejet deH01
Table 1: Risques decisionnels conditionnels a l'etat (inconnu) de la nature1.3 Probabilite critique (oup-value ou niveau de signication observe)
Notons bien que plusest choisi petit, plus la regle de decision est stricte (ou conservative) dans la mesure ou elle aboutit a rejeterH0que dans des cas rarissimes et donc a conserver cette hypothese quelque fois a tort. Une vision moderne, liee a l'explosion de la puisssance des ordinateurs et de processus numeriques d'approximation rapides et precis, est d'acher lap-value ou probabilite critiquepc. Par denition,lap-value est la plus petite des valeurs de risque de premiere espece pour lesquelles la decision serait de rejeterH0. Une autre denition proposee par Saporta (2011,[1]) est :lap-value est la probabilite de depassement de la valeur observee par la variable de decision sousH0. La valeurpcest calculee a partir des observations et de leurs proprietes distributionnelles sousH0. Commepcest le plus petit niveau de signication auquel on rejette l'hypotheseH0, il est aussi appeleniveau de signication observe. L'amelioration fulgurante des capacites de calcul permet maintenant de baser les regles de decision sur les probabilites critiques sans forcement comparer la statistique de test avec une valeur seuil, comme cela se faisait classiquement. La denition formelle de lap-value donnee ci-dessus est dicile a ingurgiter et peut conduire a une mauvaise utilisation et/ou une mauvaise interpretation de l'inference statis- tique (Wasserstein et Lazar, 2016, [3]). Une denition litterale et plus parlante aux non inities peut ^etre la suivante :lap-value est une mesure de la compatibilite des donnees avec l'hypothese privilegiee. Plus cettep-value est proche de zero, plus la compatibilite est faible et donc conduit a rejeter cette hypothese. La proximite a zero depend de la severite que l'on s'impose a travers le risque. 21.4 Critere de test, Region critique, Regle de decision
Tout test d'une hypotheseH0est base sur un critereCqui est calcule a partir des obser- vations eectuees.Cest appele critere de test (ou statistique de test ou variable de decision).Cest une quantite dependant des donnees observees ou recueillies lors de l'experimentation ou l'enqu^ete. C'est donc une variable aleatoire dont la valeur observee nous permettra de determiner quelle hypothese est la plus plausible, en se referant a la distribution de probabilite de cette variable aleatoire sousH0. La prise de decision se fera selon une regle dont la forme est generalement : 8 :Rejet deH0siC2Rc() (Regle de decision de forme 1)Non Rejet deH0siC =2Rc()
ouRc() est donc l'ensemble des valeurs pour lesquelles la statistique de test conduit au rejet de l'hypotheseH0au niveau de signication.Cet ensembleRc()est donc appele region critique (ou zone de rejet) du test au niveau. Le complementaire deRc() est l'ensemble des valeurs pour lesquelles la statistique de test conduit au non rejet de l'hypotheseH0. On l'appelle region (ou zone) d'acceptation du test au niveau. La region critique ou zone de rejet correspond donc aux valeurs deCqui seraient trop extraordinaires sous l'hypotheseH0pour ^etre considerees comme le fruit du hasard d'echantillonnage. Notons que les logiciels statistiques modernes calculent lap-valuepcet fournissent la regle de decision de niveausous la forme : 8< :Rejet deH0sipc< (Regle de decision de forme 2)Non Rejet deH0sipc
1.5 Test unilateral, test bilateral
Rappelons que la region de rejetRc() d'un test de niveaubase sur la statistiqueCest l'ensemble des valeurs possibles deCpour lesquelles la regle de decision nous conduit a rejeterH0au niveau. Un test est dit unilateral si cette region de rejetRc() est entierement situee a une des extremites de la distribution d'echantillonnage deC. 3 Un test est dit bilateral si cette region est situee aux deux extremites de la distribution d'echantillonnage deC. La gure 1 indique des regions critiques de niveau 5% basees sur un critere de test suivant la loi normale centree reduite sousH0.-4-2024 -4-2024 -4-2024Figure 1:Regions critiques (en rouge) pour un critere de loiN(0;1) et= 0;05.1.6 Liens entrep-value et statistique de test dans quelques cas simples
SoitH0une hypothese privilegiee. On desire tester cette hypothese vis a vis d'une hy- pothese alternative. Notons maintenant, sans perte de generalite,Tla statistique de test (a valeurs reelles) utilisee pour eectuer le test deH0, c'est-a-dire verier siH0est vraie.On designe parP0la loi de probabilite deTsousH0.
A partir des donnees recueillies, on a une valeur observeetpour la statistique de test. Le principe general des tests d'hypothese est de rejeter l'hypotheseH0quandtest en extremite de distribution deP0et correspond donc a une valeur fort peu probable sous H0. Pour quantier "les chances d'occurrence" d'une telle valeurtsousH0, on calcule la
probabilite critiquepcdont la denition suit : On a vu que la probabilite critiquepc(oup-value) d'un test d'hypothese pour des 4 observations donnees est le plus petit des niveaux de signication pour lesquels la decision est de rejeterH0. Autrement dit,pcest la plus petite probabilite, au vu des observations, de rejeter a tort l'hypothese privilegieeH0. Le lien avec la loi de la statistique de testTet la statistique observee est le suivant : lap-value est la probabilite qu'une realisation de la statistique de testTsoit plusextraordinaire(c'est-a-dire plus en extremite de distribution) que la valeur observeetsous l'hypotheseH0. Ainsi, de tres faibles valeurs pourpcindiquent que l'hypothese privilegieeH0est peu probable. Pluspcest faible, plus les donnees temoignent que le phenomene observe a tres peu de chances de se produire sousH0. Elles nous conduisent alors a rejeterH0.La suite de ce paragraphe 1.6 concerne plut^ot les matheux !?Pour denir de facon rigoureuse le lien entre probabilite critiquepcet statistique de
test, il est necessaire, et c'est le cas pour toute experience aleatoire, d'introduire l'espace probabilise ( ;A;P0) ou est l'ensemble des resultats possibles de, ouAest la tribu d' evenements associes a , etP0la loi de probabilite sousH0. Le resultat observe de l'experienceest note!et on a donct=T(!). On a indique precedemment qu'un test base sur la statistiqueTest dit unilateral si, pour tout niveau, sa region de rejet est entierement situee a une des extremites de la distribution de probabilite deT. Il est dit bilateral si cette region de rejet est situee aux deux extremites de la distribution de probabilite deT..