Récupération données .html dans un fichier .txt - Perl - Programmation
Marsh Posté le 06-03-2008 à 15:51:46
Merci, mais pourrais tu me donner plus d'informations...
Je n'arrête pas d'effectuer des recherches, mais c'est assez mal expliquées et souvent compliquées..
++
Marsh Posté le 06-03-2008 à 16:33:28
Documentation sur les modules : http://perldoc.perl.org/perlmod.html
HTML Parser : http://search.cpan.org/~gaas/HTML- [...] /Parser.pm
Et de manière plus générale :
Documentation complète sur PERL : http://perldoc.perl.org
CPAN (catalogue de modules PERL) : http://search.cpan.org
Marsh Posté le 06-03-2008 à 17:07:28
Merci beaucoup pour toutes ces informations !!!
Avant de me lancer dans un gros truc, j'essaie tout d'abord de prendre des informations d'un simple texte, pour les renvoyé sur un autre texte...
Par exemple:
Test1.txt :
/////
voila un fichier exemple dont il faut extraire des choses,
gene:LDLR,
drug:atrovastatine,
disease: hypecholesterolemia
/////
Et grâce à un programme Perl, je pourrai ressortir sur un autre fichier texte seulement :
Test2.txt :
/////
LDLR
astrovastatine
hypecholesterolemia
/////
Cependant je ne manipule pas encore assez bien Perl, pourrai vous m'aider à commencer ce programme
Merci
Marsh Posté le 06-03-2008 à 17:26:45
Code :
|
Marsh Posté le 06-03-2008 à 18:11:52
oui voila
Dit autrement, montre ce que tu as déjà fait pour qu'on t'aide et non qu'on te fasse...
Marsh Posté le 06-03-2008 à 15:46:43
Bonjour à tous,
Je souhaiterai créer un programme Perl, pour :
-prendre en entrée (Input) un fichier .html. Et grâce à ce programme .pl
-créer un fichier texte en sortie (Output), pour récupérer des informations précises dans la page .html.
Je m'explique dans un exemple :
C'est une page .html qui concerne la liaison entre gênes, maladies et médicaments.
Et je voudrais grâce au programme parcourir et ressortir dans un fichier texte que 3 informations : les noms du gêne, du médicament et de la maladie.
Je suis débubante dans ce langage, donc si vous pouvez me donner quelques pistes...On m'a parlée de "parsage d'un fichier", "expressions régulières"...
Je vous remercie