Quelques fonctions avec SPSS et leurs résultats 12 Tableau avec la corrélation entre les variables sélectionnées R Coefficient de régression multiple
Previous PDF | Next PDF |
[PDF] 243 Le coefficient de corrélation multiple (ou coefficient de
Formule générale Cas avec p=1 Coefficients de la régression : b=(X'X)-1X'Y 2 1 1 0 x xy s s b XbY b = − = Coefficient de corrélation multiple : 2 m R = Y Y
[PDF] Pratique de la Régression Linéaire Multiple - Université Lumière
Borcard, D , Régression Multiple - Corrélation multiple et partielle, 2001-2007 La valeur α = 10 est proposée par défaut dans la logiciel SPSS par exemple
[PDF] Régression multiple : principes et exemples dapplication
Figure A8 : Les deux droites de régression et le coefficient de corrélation 1 2 Régression linéaire multiple L'exemple développé à partir de deux variables
[PDF] Lanalyse multivariée avec SPSS
Le fonctionnement du logiciel SPSS 36 3 La corrélation bivariée simple (corrélation de La régression multiple avec SPSS 170
[PDF] Cours 12 : Corrélation et régression
Test sur le coefficient de corrélation de Pearson Corrélation multiple L' indice de corrélation multiple (pour plus de deux variables) est représenté par un R
[PDF] Lanalyse multivariée avec SPSS - Cours, tutoriaux et travaux
Corrélation de Pearson – Régression simple et multiple Rapport Tous Tous Il est important de combiner les échelles avec les opérations statis- tiques qui
[PDF] MODELES LINEAIRES
variables, par un modèle de régression linéaire multiple Définition : On appelle coefficient de corrélation multiple de y avec x1, ,xp, et on note r(y,(x1, , xp))
[PDF] Démarrer avec SPSS
Quelques fonctions avec SPSS et leurs résultats 12 Tableau avec la corrélation entre les variables sélectionnées R Coefficient de régression multiple
Multiple Regression: Statistical Methods Using IBM SPSS
Part and partial correlations, which produces the partial and semipartial correlations and conveys important information when multiple predictors are used
[PDF] definition fonction de cout total
[PDF] corrélation entre plusieurs variables excel
[PDF] corrélation multiple excel
[PDF] fonction de cout marginal
[PDF] régression multiple excel
[PDF] cours microeconomie
[PDF] microéconomie cours 1ere année pdf
[PDF] introduction ? la microéconomie varian pdf
[PDF] introduction ? la microéconomie varian pdf gratuit
[PDF] les multiples de 7
[PDF] les multiples de 8
[PDF] comment reconnaitre un multiple de 4
[PDF] numero diviseur de 4
[PDF] les multiples de 2
Démarrer avec SPSS
2 3Contenu
Préparation du fichier de données 5
Présentation des données 5 Passage d'un fichier de Excel SPSS 5Utilisation de quelques fonctions sur
SPSS 6Mettre des étiquettes (labels) à une variable et à ses modalités 7 Recoder une variable 8 Calculer une nouvelle variable sur la base de données 9 Séparer un fichier en plusieurs parties 10 Sélectionner une partie des sujets pour certaines analyses 10 Copie des résultats dans
Word ou Excel 11Quelques fonctions avec
SPSS ... et leurs résultats ...2 Fonctions descriptives 12 Chi carré 13 Test du t de Student 15Variables indépendantes 15 Variables apparillées 18 ANOVA (plusieurs VD et 1 VI) 19 ANOVA (1 VD et plusieurs VI) 22 Corrélation 25 Régression linéaire 26 Conclusion 29
4 5Préparation du fichier de données
Présentation des données
Une ligne par sujet Une colonne par variable Tous les résultats en chiffres (pas de lettres !) Nom de la variable : maximum 8 caractères (commencer par une lettre) Pour les données manquantes, le plus simple est de laisser la case vide.
Exemple :
Sexe Se ction Score1 Score2 etc
1 1 10 8 1 1 8 5 2 2 5 4 1 2 7 3 1 3 2 3 2 3 5 3
etc. 1 garçon 1 pratique 2 fille 2 générale 3 prégymnasialeA éviter (en gras) :
Scores
SexeSection de l'élève 1 2
g1 10 8
g 1 8 5 f 2 5 4 g 2 7 3 g 3 2 3 f 3 5 3 6Passage d'un fichier de
Excel SPSS Il est conseillé d'entrer les données sur une feuille Excel , puis de les transférer dans SPSS . Pour ce faire :1. Préparez la feuille qui ne contiendra que les données brutes (pas de graphiques,
de moyennes par colonne, ...)2. N'utilisez qu'une seule feuill e pour toutes vos donnée s, même si certai ns
traitements statistiques ne se feront que sur une partie des données.3. Toutes les données à trait er doivent se trouver sur la même feuille (ne pas
séparer par exemple en créant une feuille pour les filles et une pour les garçons).4. Fermez l a feuille (sinon, vous ne pourrez pas l'ouvrir dans
SPSS5. Dans
SPSS , ouvrez vos données.Chemin : File
Open Data (ou cliquez sur l'icône correspondante)Dans la fenêtre,
sélectionnez le type "Ex cel (*.xls)" et sélectionnez votre fichier.6. Dans la fenêtre de dialogue suivante, cochez la case "Read variable names" si la
première ligne de votre feuille Excel contient les noms des variables (cf. exemple p. 5).7. Dans la feuille de sortie qui d'affiche, le logiciel vous indique si il a reconnu les
variables, leur type et leur f ormat par déf aut, ainsi que les év entuelles modifications qu'il a pu faire (p.ex. si le nom des variables est trop long).
Utilisation de quelques fonctions sur
SPSSLe logiciel
SPSS travaille sur plusieurs feuilles, dont les deux principales : une feuille de données (data) : cette feuille contient les données sur lesquellesvous effectuez des traitements statistiques (on n e peut en avoir qu'une seule ouverte à la fois)
une(des) feuille(s) de sortie (output) : contient le résultat des tests effectués.D'autres feuilles (syntaxe, graphique, ...) peuvent être créées. A ce sujet, nous vous recommandons d'utiliser le logiciel
Excel pour réaliser vos graphiques car il permet de faire des modifications pour une mise en page pertinente dans WordVous pouvez basculer d'une feuille à l'autre par le biais de la fonction "Window" (sur la barre supérieure des fonctions) ou en cliquant sur l'icône correspondante sur la barre du fond de page (pour autant qu'elle ne soit pas masquée). La fenêtre de données peut être présentée à l'écran de deux manières : soit les données telles que vous les avez rentrées (Data View), soit les caractéristiques des variables (Variable View). Pour passer de l'une à l'autre, il vous suffit de cliquer sur l'onglet correspondant (en bas à gauche).
7N'oubliez pas de sauvegarder de temps en temps vos documents. Attention : les feuilles (data et output) s'enregistrent séparément. Vous pouvez aussi en tout temps modifier votre feuille de résultat en y effaça nt certaines informations inut iles ou certains traitements effectués par erreur.
Fonction : Mettre des étiquettes (labels) à une variable et à ses modalités Dans la fenêtre "Variable View", vous pouvez donner à votre variable le nom complet de vos variables (qui peut contenir des espaces), en remplissant la colonne "Label". C"est ce nom qui apparaîtra ensuite dans le fichier des résultats. En ce qui conce rne les moda lités, dans la colonne "Val ues", clique z sur la case correspondant à votre variable (exemple : sexe), puis sur les trois petits points afin de définir les étiquettes :
Value : Entrez la modalité de
la variable (exemple : 1)Value Label : Entrez le nom de la modalité (exemple : garçon) Cliquez sur Add et répé tez les deux derni ères c ommand es pour chaque modalité, puis cliquez sur OK. Si vous devez mettre les mêmes étiquettes à plusieurs variables (p.ex. des items de réponse oui/non), il vous suffit d'utiliser les fonctions copier et coller.
En cliquant à présent (dans la fenêtre "Data View") sur l'avant-dernière icône à droit e (représ entant une petite étiquett e), vous pouvez visualiser soit la valeur, soit le nom associé à cette valeur. Quelle que soit la configuration sur l'écran, dans les feuilles de résultats, vous verrez ces noms, forts utiles pour se repérer dans l'amas de chiffres ! Dans la fenêtre "Variable View" vous pouvez aussi définir les autres caractéristiques de chaque variable comme l a taille, le nombre de d écimale après la virg ule, les données manquantes, le positionnement dans la colonne, ...
8Fonction : Recoder une variable Exemple : on veut passer d'un score allant de 1 à 10 à un score de 1 à 3 suivant le tableau suivant : Anciennes modalités 1 2 3 4 5 6 7 8 9 10 Nouvelles modalités 1 2 3 Chemin : Transform
Recode
Into Different
Variables...
(vous pouvez aussi utiliser le "Recode Into SameVariables", mais vous perdez votre
variable de base !). Input Variable : sélectionnez la variable à recoder et faites passer la variable dans la boîte "Input variable" à l'aide de la flèche noire Output Variable : insérer le nom (8 caractères max) et le label complet (pas obligatoire) puis cliquez sur ChangeOld and New Values...
Entrez l'ancienne valeur (partie de gauche) Entrez la nouvelle valeur (case de droite) Cliquez sur Add
et répétez les deux dernières commandes (y comprisle "Add") pour toutes les modalités (y compris celles qui ne changent pas) Cliquez sur Continue, puis sur OK. ou Utilisez la fonction "Range" :
de 1 à 31; de 4 à 7
2 ; et de 8 à 10
3 9 Fonction : Calculer une nouvelle variable sur la base de données Chemin : TransformCompute...
Target Variable : entrez le nom de la nouvelle variable que vous calculez Numeric Expression : vous pouvez ici combiner les variables exis tantes avec
différents opérateurs mathématiques (functions) Cliquez ensuite sur OK : le logiciel vous crée la nouvelle variable (et vous la place dans la dernière colonne de la feuille Data).Pour passer d 'une variable codée négativement à une variable " retournée » (positive). Exemple de question évaluant l"impulsivité (item à retourner) :
Je suis capable de maîtriser mes émotions.
Pas du tout
d"accord0 1 2 3 4 5 6
Tout à fait d"accord
Le sujet qui répond 6 n"est pas du tout impulsif ; c"est pour cela qu"il faut retourner l"item afin qu"un score élevé corresponde à une impulsivité élevée, et un score faible, à une impulsivité faible. Ainsi :
Codage effectué par le sujet 0 1 2 3 4 5 6 Score "réel" 6 5 4 3 2 1 0 Somme 6 6 6 6 6 6 6Target Variable Numeri c Expression
Score6 - coda
g e La flèche permet de faire "passer" les variables dans la case de droite. Ici, on a choisi de faire la moyenne (" MEAN ») de 4 variables. 10Fonction : Séparer un fichier en plusieurs parties On utilise cette fonction pour effectuer par exemple des tests avec les garçons et les filles séparément. Chemin : Data
Split File...
Cliquez sur "Organize output by groups" Sélectionnez la variable (par exemple "Sexe") et faites-la passer à droite à l'aide de la flèche noire Cliquez sur OK.
A partir de ce moment, tous les tests effectués se feront à double (pour cet exemple), soit une fois pou r les g arçons et un e fois pour les filles.
Attention de l'enlever
lorsque vous voulez à nouveau travailler sur toutes les données ! Pour retourner à une analyse sur l'ensemble des données : Chemin : DataSplit File...
Cliquez sur "Analyze all cases, do not create groups" Cliquez sur OK.Fonction : Sélectionner une partie des sujets pour certaines analyses On utilise cette fonction pour effectuer par exemple des tests avec les sujets qui ont plus de 15 ans. Chemin :
DataSelect Cases...
Cochez "If condition is satisfied" Cliquez sur If..." Entrez la fonction (p.ex. age>15) Cliquez sur Continue puis sur OK.
Suite à cette opération, le numéro des sujets " exclus » de l"analyse est clairement barré dans le fichier des données.
11Copier des résultats dans
Word ou Excel Pour éviter d' imprimer de nombr euses pages à partir de SPSS , vous pouvez sélectionner les résultats, puis les copier dans le presse-papier. Chemin : Edit CopyAllez dans
Word ou Excel pour coller ce qui a été copié dans SPSSLes tableaux sont utilisables directement dans ces deux logiciels et vous pouvez faire toutes les modifications nécessaires (p.ex. changer la police, diminuer le nombre de chiffres après la virgule, utiliser les données pour faire un graphique dans
Excel etc.). Si vous souhaitez conserver la mise en page SPSS dans Word, il faut alors coller le tableau en format image : Chemin (dans Word) :Edition
Collage spécial
Image...
Cliquez sur OK.
12Quelques analyses avec
SPSS ... et leurs résultatsFonctions descriptives Chemin : Analyze
Descriptive Statistics
Descriptives...
Sélectionner dans la fenêtre de gauche les variables, puis les passer à droite en utilisant la flèche (entre les deux fenêtres).
On peut cocher ici les statistiques descriptives qui nous intéressent ... Mean : moyenne Sum : somme (en colonne) Std. deviation : écart-type Range : rang Minimum : valeur minimum Maximum : valeur maximum S.E. mean : erreur-type ... les indices de distribution des résultats (Kurtosis et Skewness) ... ... et l'ordre de présentation des résultats (ici, on garde l'ordre des variables selon l"ordre dans lequel elle apparaissent dans le fichier).
Voir fenêtre suivante
13Résultats
Si l'on souhaite avoir les scores pour les garçons et les filles séparément, il suffit d'utiliser la fonction "Split File" (voir p. 8). Chi carré (
2Comparer une distribution observée à une distribution théorique. Le principe général consiste à analyser l'écart existant entre la distribution théorique postulée et la distribution em piriq ue obtenue. Les de ux variables étudiées sont nominales. Comme exemple, nous testons l'hypothèse suivante :
La répartition des garçons et des filles dans les trois sections diffère d'une distribution théorique.
Chemin : Analyze
Descriptive Statistics
Crosstabs...
On sélectionne les variables à mettre en ligne et en colonne (pour le Chi2, une seule variable en ligne et une seule en colonne). Il faut encore sélectionner le test du Chi2 :
Voir fenêtre suivante
Les indices d"asymétrie et de voussure sont donnés en valeurs centrées et réduites. 14On coche dans la case correspondante (en haut à droite) pour obtenir dans la feuille de résultats la valeur du Chi carré de Pearson
1Résultats
Tableau concernant les cases sur lesquelles l'analyse est faite. Tableau croisé proprement dit (avec la répartition des sujets). 1On différencie le Chi carré de Pearson (Karl Pearson, 1900) d'autres tests donnant eux aussi une
statistique 15Tableau des résultats.
La valeur du
2 est de 0.485 (arrondi), le degré de liberté est de 2, et la probabilité associée à ce test est de 0.79 donc non significatif (en prenant un seuil de 5%). Notation 2 (2) = 0.49 ; non significatifCondition d'utilisation du test
Minimum Expected Count : lorsque ce chiffre est inférieur à 5 (valeurcorrespondant à la plus peti te fréquence absol ue trouvée dans le tableau de la distribution théorique), le test n'est pas valide (quelle que soit la probabilité). On vous indique ici le nombre de cases qui ne satisfont pas à cette assomption.
Test du
t de Student (comparaison des moyennes deux groupes) La variable dépendante est quantitative. Si les groupes sont indépendantsExemple : Comparaison entre garçons et filles pour les variables Score1 et Score2. Hypothèse : Les garçons auront pou r les deux v ariables des scores
significativement supérieurs à ceux des filles. 2 2De manière formelle, on devrait mentionner po
ur cet exemple deux hypothèses (une pour chaque variable séparément). L"hypothèse est ici orientée (ou unilatérale) car on postule un sens (quel groupe aura le score le plus élevé). Si on postulai t une différence entre fille et garçon sans indiquer le sens de cette différence, on aurait alors une hypothèse non orientée (ou bilatérale).Valeur du
2Probabilité associée au
2Degré de liberté
Condition d'utilisation du test
16Chemin : Analyze
Compare Means
Independent-Samples T Test...
Test Variable(s) : variable(s) dépendante(s) (on peut en mettre plusieurs et un calcul sera effectué pour chaque variable séparément). Grouping Variable : variable indépendante (définir les deux modalités).Lorsque l'on veut comparer les sc ores de trois groupes ( par exemple les trois sections), il est possible de répéter l'opération trois fois en comparant tout d'abord les sections 1 et 2, puis 1 et 3, et finalement 2 et 3. Cependant, d"autres analyses (p.ex. ANOVA) sont plus appropriées lorsque plus de deux groupes sont concernés par l"analyse de différence. Résultats
Tableau descriptif (moyenne, écart-type, erreur-type)Définir les deux moda lités de la variable indépendante sur l esquelles la variable dépendante sera compa- rée (ici "1" po ur garçon et "2" po ur filles).
Voir fenêtre suivante
Mo y ennes 17La comparaison des moyennes nous permet déjà de constater si notre hypothèse va dans le sens postulé (puisqu"il s"agit d"une hypothèse orientée). Dans les deux cas (pour le Sc ore1 et pour le Score2, les garçons on t effect ivement une m oyenne supérieure à celle des filles, nous p ouvons donc prendre connaissance des statistiques inférentielles (voir ci-dessous). Dans le cas contraire (si les garçons avait une moyenne inférieur à celui des filles), l"hypothèse serait d"ores et déjà rejetée (et l"analyse inférentielle serait inutile). Dans nos résultats, les garçons obtiennent 3.37, alors que les filles n'ont que 3.09 (arrondi). La différence entre ces deux moyennes (donnée dans le 2
ème
tableau) et est de .28 (pour le Score1).Tableau du test inférentiel
Le test d'homogénéité des variances permet de sélectionner dans le tableau quelle ligne choisir. Lorsque les variances sont considérées homogènes - comme c'est le cas ici pour les deux tests, vu que la probabilité du "Levene's Test for Equality of Variances" est supérieure à 0.05 (p = .443 et p = .547), on choisit alors la première ligne (Equal variances assumed). Dans le cas contraire (test significatif), on devrait prendre la deuxième ligne. Pour le Score1, la valeur du
t de Student est de 2.72, le degré de liberté est de 248et la probabilité est de 0.07 (ou 0.7%). Vu que nous avons posé une hypothèse dite "orientée", c'est-à-dire que nous avons spécifié le sens de la diff érence (les élèves de pra tiques ont une moyenne supérieure), nous pouvons diviser cette probabilité par deux. On trouve alors une probabilité de 0.35% donc inférieure à notre seuil de 5%. L'hyp othèse es t donc confirmée (l"hypothèse nulle est écartée). Notation
t (248) = 2.72 ; p<1%Pour le Score2, la probabilité (divisée par deux car l"hypothèse est orientée) est de 8.1% (soit supérieur au seuil de 5%) ; l"hypothèse est donc rejetée. Notation
t (248) = 1.40 ; non significatifTest d'homogénéité des variances
Valeur du
tStudent
Degrés de libertés
Probabilité associée au test
18Si la variable dépendante est ordinale (ou que sa distribution n"est pas suffisamment proche de la normal e), on tr ouve le t est non-paramétrique corresponda nt (
U deMann-Whitney) : Chemin : Analyze
Nonparametric Tests
2 Independent Samples...
Si les groupes sont apparillées (pairées)
Exemple : Comparaison entre le Score3 (par exemple un pré-test) et le Score4 (lepost-test correspondant). Ce sont donc bien les mêmes individus à qui on attribue une valeur au Score3 et une valeur au Score4 (variables pairées).
Hypothèse : Il y a une amélioratio n signifi cative entre le pré-test et le post-test, autrement dit, le Score4 sera supérieur au Score3 (hypothèse orientée ou unilatérale).Chemin : Analyze
Compare Means
Paired-Samples T Test...
Sélectionnez deux variables dans la case de gauche et faites-les passer à droite en utilisant la flèche centrale (entre les deux cases). On peut faire exécuter à la suite plusieurs comparaisons deux à deux en sélection-nant dans cette fenêtre-ci les autres comparaisons à effectuer. Résultats
Tableau descriptif
La moyenne permet déjà de s"assurer d"une amélioration entre le pré-test (Score3) et le post-test (Score4).
Mo y ennes 19 Tableau avec la corrélation entre les variables sélectionnéesTableau du test inférentiel
La différence de moyenne
entre le Score3 (M = 2.02) et le Score4 (M = 2.69) est de -0.67. Elle est significative car la probabilité est inférieure à 1% (ici, p0.000??).
Notation
t (249) = -6.89 ; p<1%Attention : on ne mentionnera pas p=0.000 car la probabilité n"est pas nulle, même si on ne trouve pas de valeurs sur les trois premières décimales. Si les variables sont ordinales (ou que leur distribution n"est pas suffisamment proche de la normale), on trouve le test non-paramétrique correspondant (
T de Wilcoxon) :Chemin : Analyze
Nonparametric Tests
2 Related Samples...
ANOVA (plusieurs VD et ... VI)
(analyse de variance)Comparer les moyennes de plu sieurs grou pes indépendan ts de sujets sur une variable quantitative. De manière (très) simplifiée, on regarde si la variation entre les groupes (variance intergroupe) est importante par rapp ort à la var iation à l'intérieur des groupes (variance intragroupe). Si le rapport (ratio) est élevé (autrement dit un e forte dispersion entre les groupes et une faible dispersions entre les sujets d"un même groupe), l'analyse de variance (ANOVA) risque d'être significative. Exemple : Comparaison entre les trois sections (exigences de base, g énérale et
prégymnasiale) pour le Score6. Hypothèse : Il y a une différence significative entre deux des trois groupes sur la variable Score6.Valeur du
tDegrés de liberté
Probabilité
20Chemin : Analyze
Compare Means
One-Way ANOVA...
De manière similaire au
t de Student, on insère la(les) variable(s) dépendante(s) (icile Score6) ainsi que le facteur (variable indépendante). L'analyse de variance diffère du test de Student par le fait qu'elle peut prendre en compte plusieurs groupes, et aussi tester les différences deux à deux, ce qui évite de répéter le test de St
udent plusieurs fois.Le choix des
post hoc est délicat. Dans les publications, on trouve souvent les résultats du LSD (Least Significant Difference) qui est relativement équivalent au test t de Student. Le test de Bonferroni est relativement peu conservateur(se révèle significatif, même si les différences ne sont pas très fortes). Il est cependant intéressant lorsque le nombre de comparaisons est faible. Le test de Scheffé est par contre très (voire trop) rigoureux alors celui de Tuckey se situe entre les deux (et reste pertinent lorsque le nombre de comparaison est grand). Si vo tre test est significat if avec une méth ode de calcul conservatrice, ceci indique que les diffé rences sont bien pré sentes. Si, au contraire, le test est significatif avec une méthode peu conservatrice (Bonferroni), mais ne l"est pas avec une méthode très conservatrice (Scheffé), il faut alors se questionner sur la pertinence - dans le cas concret - de l"utilisation de telle ou telle méthode.
Les post hoc permettent des compa raisons deux à deux si (et uniquement si) l'analyse de variance est significative.Voir fenêtre suivante
21Résultats
Tableau de l'ANOVA
Sur la bas e de ce t ableau, on peu t en dédui re qu"il existe des différences significatives entre les trois groupes (l"hypothèse est confirmée). Notation
: F(2,247) = 9.85 ; p<1%Attention : on ne mentionnera pas p=0.000 car la probabilité n"est pas nulle, même si on ne trouve pas de valeurs sur les trois premières décimales.
Tableau des
post hocPuisque l"ANOVA est significative, on peut regarder les post-hoc qui nous donnent les différences significatives deux à deux. Ainsi, on observe que le groupe exigences de base a ne moyenne significativement différente des deux autres sections, mais que la s ection g énérale ne se différencie p as significativement de la section prégymnasiale (p=.25). Les résultats sont ide ntiques (au niveau du seuil de significativité) avec la méthode Scheffé et LSD.
Degrés de liberté
F de FisherProbabilité associée au
F de Fisher 22ANOVA (... VD et plusieurs VI)
(analyse de variance) Exemple : Différence entre les trois sections (exigences de base, générale et prégymnasiale) et le genre pour le Score4.L"hypothèse peut porter sur les effets simples (différ ence selon la sectio n ou différence selon le genre) ou s ur l"effet d"in teraction (interactions entre les deux variables indépendantes). Chemin : Analyze
General Linear Model
Univariate...
On peut insérer dans ce modèle plusieurs facteurs (ou variables indépendantes) afin de calculer les effets simples et les effets d'interaction.