Lecture de données structurées (HTML ici) ?

Lecture de données structurées (HTML ici) ? - Programmation

Marsh Posté le 05-02-2002 à 12:10:18    

Je voudrais pouvoir lire une page html sequentiellement afin d'en faire un fichier texte classique sans certaines balises, de l'analyser et de faire des modifs dessus, puis de regenerer un troisième fichier html replacant les anciennes balises.
 
Voila, c'est en gros ce dont j'ai besoin, et je voudrais surtout savoir comment m'y prendre pour lire ce type de données structurées..
 
:jap:

Reply

Marsh Posté le 05-02-2002 à 12:10:18   

Reply

Marsh Posté le 05-02-2002 à 12:17:35    

en Java tu as un parseur HTML built-in mais je ne sais pas quelle norme il respecte.
 
De manière générale, dirige toi vers un parseur HTML dans le language que tu utilises. Ensuite définis le pour qu'il fasse du processing sur ton document HTML. Une fois les infos extraites, c'est assez trivial de reconstruire un autre fichier.
 
Ta question, c'est quelle techno choisir ou comment faire?


---------------
Kisses to the RainMaster ;  
Reply

Marsh Posté le 05-02-2002 à 12:18:30    

callista a écrit a écrit :

en Java tu as un parseur HTML built-in mais je ne sais pas quelle norme il respecte.
 
De manière générale, dirige toi vers un parseur HTML dans le language que tu utilises. Ensuite définis le pour qu'il fasse du processing sur ton document HTML. Une fois les infos extraites, c'est assez trivial de reconstruire un autre fichier.
 
Ta question, c'est quelle techno choisir ou comment faire?  




 
grrr ma copine s'est encore inscrite sur ma session  
 
 :gun:  :gun:  :gun:  
 
:D


---------------
What is popular is not always right, what is right is not always popular :D
Reply

Marsh Posté le 05-02-2002 à 15:27:51    

callista a écrit a écrit :

Ta question, c'est quelle techno choisir ou comment faire?  



Vi en fait ma question c'est un peu ca... (sachant que je dois le faire en C#)
 
Car j'ai trouvé quelques pdf qui parlait de la lecture de données structurées, mais jamais de l'html en particulier... Et en plus ca fait souvent des centaines de pages plutôt archi technique et difficiles à comprendre... :(

Reply

Marsh Posté le 05-02-2002 à 15:59:56    

bin si c'est en C# tu l'as ta techno. Regarde comment c'est gére dans ce language là. Je peux pas t'aider plus.


---------------
What is popular is not always right, what is right is not always popular :D
Reply

Marsh Posté le 05-02-2002 à 17:06:56    

:sweat: Mais qu'est-ce qu'il a ce msdn qui veut plus marcher ! :(
 
En plus c'est la merde car j'ai po les privilèges pour le réinstaller... :/

Reply

Marsh Posté le 06-02-2002 à 09:15:36    

Jesus Army a écrit a écrit :

Je voudrais pouvoir lire une page html sequentiellement afin d'en faire un fichier texte classique sans certaines balises, de l'analyser et de faire des modifs dessus, puis de regenerer un troisième fichier html replacant les anciennes balises.
 
Voila, c'est en gros ce dont j'ai besoin, et je voudrais surtout savoir comment m'y prendre pour lire ce type de données structurées..
 
:jap:  




 
vas sur mon site, j'ai fait un parser de html : c'est un composant pour delphi 4 :)
http://perso.libertysurf.fr/chris.jav

Reply

Marsh Posté le 06-02-2002 à 09:58:03    

Je regarde ca, merci :jap:

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed