récupérer l'objet DOM de gecko sans lancer de browser

Marsh Posté le 16-10-2006 à 16:14:53

Bonjour à tous.
Ceci se situe à cheval entre la programmation et la création web. Mais comme cela relève plus du C++, j'ai choisi cette section.

Je cherche à récupérer l'objet DOM que forme Gecko après avoir analysé une page web avec son parser.

Sous Mozilla, il existe le DOM inspector. C'est une extension qui fournit l'arbre DOM d'une page. Cela me conviendrait s'il était possible d'obtenir simplement l'objet DOM sans lancer de browser et ainsi pouvoir mettre sur pieds une solution qui ne nécessite pas d'interface graphique. L'objectif serait de fournir, par exemple, un millier d'url et de récupérer une millier de DOM object via le parser html (ou xml, ou tous les parseurs nécessaires) de gecko.

Je ne sais pas s'il faut s'attarder sur la programmation XPCOM ou s'il faut attaquer direct le C++, donc à un niveau plus bas que xpcom. Je ne sais pas s'il faut recompiler tout mozilla (ou tout firefox) pour obtenir ce que je désire.
Avez-vous des pistes.

Tout élément de réponse (orienté windows ou linux) est susceptible de m'intéresser.
Merci
PS: peut être connaissez vous des endroits meilleur pour poser cette question. Je l'ai en tous cas posée sur le newsgroup mozilla.dev.tech.dom et je n'ai pas eu de réponse.

Marsh Posté le 16-10-2006 à 16:14:53

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed

Name *

Email *

URL

Message *