Statistiques - Déterminer la loi d'un échantillon de données

Statistiques - Déterminer la loi d'un échantillon de données - Aide aux devoirs - Emploi & Etudes

Marsh Posté le 04-04-2008 à 11:21:51    

Hello,
 
J'essaie de créer un indicateur de qualité pour mon taf, mais pour cela j'ai besoin des statistiques et ça fait bien 3-4 ans que je n'y ai pas touché. Je suis donc un peu rouillé  :D.
 
Le problème est le suivant : j'ai pas mal de données concernant des temps mis pour réaliser une action. J'ai deux variables : le temps total (du début de l'action jusqu'à son achèvement total) et un "temps pondéré" qui est la base d'un calcul que je fais en pondérant les temps mis pour atteindre des sous-évènements.
 
Un exemple : si je considérais le temps mis par un abonné au mobile à atteindre ses 100 minutes par mois, et que je sais qu'il utilise 50 minutes au bout de 10 jours et 100 minutes au bout de 25 jours, j'ai un temps total de 25 jours et un temps pondéré de 20 jours par exemple (je simplifie à l'extrême).
 
Mais maintenant si j'ai une donnée qui me dit que ce client a déjà consommé 50 minutes en 10 jours, mais pas encore le reste : ce que je cherche à déterminer ce sont les temps totaux et pondérés les plus probables, à partir des comportements observés auparavant.
 
J'ai déjà pas mal cherché sur Internet, mes cours de stats n'étant pas avec moi en ce moment. Le problème c'est que si je peux très bien comprendre la partie mathématique, je ne me souviens pas du vocabulaire utilisé et je n'arrive donc pas à définir précisément ce dont j'ai besoin (et tous les cours que je trouve passent trop vite sur ce point).
 
3 questions donc :
1) Comment déterminer quelle loi stat suit mon échantillon ?
2) Comment déterminer quelle valeur mes temps prendront quand l'action n'est pas encore terminée et donc qu'ils peuvent théoriquement être entre 0 et l'infini ? (je prendrais bien la moyenne des temps des échantillons ayant les mêmes caractéristiques de "temps de passage" )
3) J'ai besoin de segmenter tout ça (dans mon exemple ce serait par exemple de dire que je ne prendrai en compte QUE les données concernant les échantillons ayant eu les mêmes "temps intermédiaires" : seulement ceux ayant consommé 50min en 10 jours donc). Y a-t-il des limitations dus aux petits nombres dans ce cas ?
 
Tout ce dont j'ai besoin c'est de la bonne orientation à suivre :) Merci d'avance !

Reply

Marsh Posté le 04-04-2008 à 11:21:51   

Reply

Marsh Posté le 06-04-2008 à 01:16:58    

up  :)

Reply

Marsh Posté le 09-04-2008 à 16:37:49    

Salut, j'utilise pas les stats dans le même domaine que toi, mais d'après ce que je comprends de ton problème, le recours aux chaînes de Markov ne me semble pas totalement inadapté...
 
Une réf. que j'avais lu y a quelques années : le bouquin de Berchtold.
 

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed