Salut à tous.
J’ai des problèmes de stats à résoudre, et je me galère un peu, vu que mes connaissances se rapprochent du néant à mesure que l’âge m’éloigne des mes années de lycée.
Je dois donc comparer l’homogénéité des âges de deux populations. J’utilise excel pour les moyennes et les écarts-types, et http://www.openepi.com/Menu/OpenEpiMenu.htm , section « t test » pour le test de Student (si j’ai bien suivi ce que m’a dit mon gourou en stats, qui n’est malheureusement pas dispo actuellement).
J’ai monté un tableau de test pour voir si je ne me trompais pas:
[code]12____ 42____ 136
23____ 35____ 172
37____ 18____ 151
18____ 13____ 101
5_____ 23____ 132
42____ 61____ 128
37____ 9_____ 192
56____ 12____ 145
17,1____18,1____27,9 (écart-type)
28,75___26,625__144,625 (moyenne)[/code]
Donc les 3 colonnes ce sont les 3 populations, en bas les moyennes et l’écart-type tels que filés par Excel (sachant qu’Excel propose deux formules de l’écart-type, ECARTYPE et ECARTYPEP. J’ai pris la première; la deuxième donne des valeurs un peu inférieures. Première question: je suis censé utiliser laquelle?
Ensuite, dans Epi je compare la population 1 à la population 2 (dont je suppute qu’elles sont globalement identiques) et la population 1 à la population 3 (dont je suppute qu’elles sont significativement différentes).
Voici les résultats qu’il me donne:
Pop 1 vs 2:
[code]Résultat_________Statistiques t__df____valeur-p____Différence moyenne__Limite inférieure__Limite supérieure
Variance égale___0.24138_________14____0.8128______2.125_______________-16.7567___________21.0067
Variance inégale_0.24138_________14____0.8128______2.125_______________-16.7567___________21.0067
______________________________Statistiques F____df(numérateur,dénominateur)___valeur-p
Test d’égalité de variance____1.12038___________7,7___________________________0.8847[/code]
Donc là, partout où il affiche un p, il est largement supérieur à 5%; je suis content, c’est ce que je voulais.
Pop 1 vs 3:
[code]Résultat_______________Statistiques t__df_____valeur-p____Différence moyenne__Limite inférieure__Limite supérieure
Variance égale_________-10.0156________14_____<0.0000001____-115.875_____________-140.689___________-91.0611
Variance inégale_______-10.0156________12_____0.000000352___-115.875_____________-141.082___________-90.6675
______________________________Statistiques F____df(numérateur,dénominateur)___valeur-p
Test d’égalité de variance____2.66205___________7,7___________________________0.2198[/code]
Là, ça ne va plus, alors que les populations semblent bien différentes, il affiche de multiples p, dont un à 21,98%, et deux très bas. Deuxième question: est-ce bien le p de la ligne « variance égale » que je dois considérer comme ma valeur p, celle qui doit être inférieure à 5% pour que je sois significatif et heureux?
Question subsidiaire: pourquoi il y a une variance égale et une variance inégale? Ca veut dire quoi? Si au cours de mes tests j’ai des valeurs de p discordantes entre les lignes variance égale et variance inégale, je dois prendre laquelle en compte?
Question subsidiaire 2: Excel a une fonction test de Student. Mais il me demande des infos que je ne connais pas: le type de distribution (unilatérale ou bilatérale) et le type de test t (par paire; 2 exemples variante égale homoscédastique; et variance inégale à 2 exemples). Je pourrais choisir quoi?
Edit: en jouant avec Excel, j’arrive à supposer (parce que ça recoupe les p d’Epi) que la distribution est bilatérale et le test à 2 exemples variante égale. J’ai bon?
Merci d’avance