[probas/stats] pour initiés, petite question sur un test tout simple
pour initiés, petite question sur un test tout simple [probas/stats] - Sciences - Discussions
MarshPosté le 03-06-2004 à 18:18:15
voilà ça fait un bail que j'ai plus fait de calculs en stats/probas, et je me pose une question toute bête pour la comparaison de deux proportions où tout est connu (après observation):
j'ai une liste de diagnostics à des examens, et je voudrais savoir si pour chaque diagnostic, la proportion de femmes et celle des hommes sont significativement différentes (au sens stat bien sûr). Stadire que si j'ai p femmes pour 1 diag et q hommes pour le même diag, je veux comparer p à q.
la statistique de test doit avoir la même tête pour chaque diagnostic.
Tout d'abord, je me souviens plus trop des conditions pour comparer 2 taux bruts (nb minimal d'observation ? même dénominateur ?), puis-je le faire dans ce cas ? ce qui me fait hésiter c'est que les femmes et les hommes n'ont pas le même dénominateur, mais je pense que ça n'a pas d'importance, les deux proportions devraient suivre asymptotiquement la même loi...
quelques notations:
j'appelle donc: cf=nombre de femmes pour ce diag ch=nb absolu d'hommes pour ce diag pf=proportion observée de femmes pour 1 diagnostic (nb femmes ayant ce diag, soit cf /nb total de femmes ramené en pourcentage) ph=celle des hommes (nb hommes ayant ce diag soit ch/nb total d'hommes ramené en pourcentage)
zf=pf*cf zh=ph*ch t=cf+ch (nb total d'observations pour ce diag) d=pf-ph (différence des proportions, exprimés en %) p=(zf+zh)/tot q=p*(100-p)/ch + p*(100-p)/cf
la stat de test (selon ma mémoire et vérification) doit avoit cette tronche:
T=d/racine(q)
Selon la théorie, elle suit asymptotiquement une loi de Fischer/Snedecor(1,1) (Normale sur Khi²)...Pour conclure, on doit comparer la valeur de T au fractile déterminé par le risque alpha que l'on veut avoir (pour moi, 95% comme d'hab), soit 1.645 ici...
MON AUTRE PROBLEME: quelqu'un se souvient-il si la comparaison de deux proportions concerne des POURCENTAGES (0 a 100) ou des TAUX(variant entre 0 et 1) ? la différence est grande: ma stat de test est-elle pourrave ? je pense qu'il y a un facteur racine(100)=10 qui se ballade mais où ?
en pratique: tous mes tests de proportions déconnent (tous NS) alors qu'à l'oeil nu, on VOIT la différence (10 % versus 60%, c'est flagrant quand même) donc je subodore une erreur, mais je demande au cas où...
j'espère avoir été assez clair et si une bonne âme qui fait des stats cette année peut m'éclairer, j'ai plus mes bouquins de stats avec moi et internet ne m'est pas d'une grande aide sur ce coup
Marsh Posté le 03-06-2004 à 18:18:15
voilà ça fait un bail que j'ai plus fait de calculs en stats/probas, et je me pose une question toute bête pour la comparaison de deux proportions où tout est connu (après observation):
j'ai une liste de diagnostics à des examens, et je voudrais savoir si pour chaque diagnostic, la proportion de femmes et celle des hommes sont significativement différentes (au sens stat bien sûr). Stadire que si j'ai p femmes pour 1 diag et q hommes pour le même diag, je veux comparer p à q.
la statistique de test doit avoir la même tête pour chaque diagnostic.
Tout d'abord, je me souviens plus trop des conditions pour comparer 2 taux bruts (nb minimal d'observation ? même dénominateur ?), puis-je le faire dans ce cas ? ce qui me fait hésiter c'est que les femmes et les hommes n'ont pas le même dénominateur, mais je pense que ça n'a pas d'importance, les deux proportions devraient suivre asymptotiquement la même loi...
quelques notations:
j'appelle donc:
cf=nombre de femmes pour ce diag
ch=nb absolu d'hommes pour ce diag
pf=proportion observée de femmes pour 1 diagnostic (nb femmes ayant ce diag, soit cf /nb total de femmes ramené en pourcentage)
ph=celle des hommes (nb hommes ayant ce diag soit ch/nb total d'hommes ramené en pourcentage)
zf=pf*cf
zh=ph*ch
t=cf+ch (nb total d'observations pour ce diag)
d=pf-ph (différence des proportions, exprimés en %)
p=(zf+zh)/tot
q=p*(100-p)/ch + p*(100-p)/cf
la stat de test (selon ma mémoire et vérification) doit avoit cette tronche:
T=d/racine(q)
Selon la théorie, elle suit asymptotiquement une loi de Fischer/Snedecor(1,1) (Normale sur Khi²)...Pour conclure, on doit comparer la valeur de T au fractile déterminé par le risque alpha que l'on veut avoir (pour moi, 95% comme d'hab), soit 1.645 ici...
MON AUTRE PROBLEME: quelqu'un se souvient-il si la comparaison de deux proportions concerne des POURCENTAGES (0 a 100) ou des TAUX(variant entre 0 et 1) ? la différence est grande: ma stat de test est-elle pourrave ? je pense qu'il y a un facteur racine(100)=10 qui se ballade mais où ?
en pratique: tous mes tests de proportions déconnent (tous NS) alors qu'à l'oeil nu, on VOIT la différence (10 % versus 60%, c'est flagrant quand même) donc je subodore une erreur, mais je demande au cas où...
j'espère avoir été assez clair et si une bonne âme qui fait des stats cette année peut m'éclairer, j'ai plus mes bouquins de stats avec moi et internet ne m'est pas d'une grande aide sur ce coup
merci d'avance !