Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree
Obtenir TOUT le texte entre 2 balises via xml.etree.ElementTree - Python - Programmation
MarshPosté le 19-07-2011 à 10:31:22
Bonjour,
Je ne parviens pas à récupérer le contenu texte d'une balise <span> en python après navigation DOM et obtention d'un 'Element'. La méthode .text ne renvoit pas tout le contenu, elle semble perturbée par une syntaxe douteuse. http://www.python.org/doc/current/ [...] ement.text
dans la chaine final, je ne trouve que [<td]. Les contenus [="] et [">] sont passés à la trape.
Il y aurait un mode RAW qui laisserait passer tous les sous éléments ?
Sinon, pas besoin de faire la remarque, ceux qui ont écrit la page que je retraite ne savent visiblement pas faire de HTML... c'est le site de l'assemblée nationnale.
Je ne parviens pas à récupérer le contenu texte d'une balise <span> en python après navigation DOM et obtention d'un 'Element'. La méthode .text ne renvoit pas tout le contenu, elle semble perturbée par une syntaxe douteuse. http://www.python.org/doc/current/ [...] ement.text
dans la chaine final, je ne trouve que [<td]. Les contenus [="] et [">] sont passés à la trape.
Il y aurait un mode RAW qui laisserait passer tous les sous éléments ?
Sinon, pas besoin de faire la remarque, ceux qui ont écrit la page que je retraite ne savent visiblement pas faire de HTML... c'est le site de l'assemblée nationnale.
C'est pas du XML, elementtree peut pas parser un truc pareil, il est pas fait pour ça
--------------- Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody
Marsh Posté le 19-07-2011 à 10:31:22
Bonjour,
Je ne parviens pas à récupérer le contenu texte d'une balise <span> en python après navigation DOM et obtention d'un 'Element'. La méthode .text ne renvoit pas tout le contenu, elle semble perturbée par une syntaxe douteuse.
http://www.python.org/doc/current/ [...] ement.text
Texte traité :
dans la chaine final, je ne trouve que [<td]. Les contenus [="] et [">] sont passés à la trape.
Il y aurait un mode RAW qui laisserait passer tous les sous éléments ?
Sinon, pas besoin de faire la remarque, ceux qui ont écrit la page que je retraite ne savent visiblement pas faire de HTML... c'est le site de l'assemblée nationnale.