RegEx. c'est quoi pour trouver l'inverse ? - C#/.NET managed - Programmation
Marsh Posté le 14-05-2004 à 21:05:47
Je veux obtenir tout le texte d'une source html.
J'aimerais donc avoir l'inverse de ce qui est des tags HTML.
Mais je n'y arrive pas.
Marsh Posté le 14-05-2004 à 21:52:25
exemple si je veux les lettres
je peux faire [a-zA-Z]
et pour l'inverse [^a-zA-Z] (c'est pour l'exemple que je prends pas \w et \W.
Maintenant je veux que avoir toutes les occurences qui ne sont pas des tags HTML dans un texte.
Comme HTML c'est "<[^>]*>" je voulais essayer d'avoir ce qui ne correspond pas à ça.. du genre "^[<[^>]*>]". Mais cela ne fonctionne pas il prend le ^ pour le caractère de début de phrase.
Marsh Posté le 14-05-2004 à 22:14:59
ReplyMarsh Posté le 14-05-2004 à 22:16:27
ouais mais je veux formater le texte d'une certaine manière..
donc je veux pas toucher aux tags
Marsh Posté le 14-05-2004 à 22:18:34
En fait tu veux coder un parser HTML en 1 ligne ?
Marsh Posté le 14-05-2004 à 22:20:23
en fait ce que je veux faire .. c'est encoder en html le texte et ne pas toucher les tags html.
Marsh Posté le 14-05-2004 à 22:22:59
J'arrive pas à te suivre...
Encoder le texte en HTML : donc tu l'as le texte, dépourvu de tags HTML puisque tu veux l'"encoder" en HTML...
Marsh Posté le 14-05-2004 à 22:34:48
Taz, as tu lu ce que j'ai écrit en haut...
HelloWorld. Je ne veux pas enlever l'html, seulement encoder.
Exemple :
Ma chaine est : <font color='black'>L'été va être super</font>. Si j'encode directement je vais avoir
Code :
|
Mais je veux avoir
< font color='black' > L'& # 233; t & # 233; va être super< / font>
Marsh Posté le 14-05-2004 à 22:35:22
Bon j'ai du mettre des espaces pour eviter que le systeme encode mon html .. c'est ca l'idée
Marsh Posté le 14-05-2004 à 23:04:22
Citation : donne un exemple de ce que tu veux obtenir. |
Enfin on comprend.
J'en reviens à mon idée d'ignorer les balises... tu identifies les balises que tu n'encode pas...
C'est un programme pour toi ou un boulot ? Je crois que tidy sait le faire ça...
Marsh Posté le 17-05-2004 à 11:26:06
JTidy fait ça très bien.
Tu lis le HTML et tu réécris en XHTML
Marsh Posté le 26-05-2004 à 14:42:08
Code :
|
J'ai pas testé et je suis pas sur que Regex.Replace(sourcehtmlnonparse,@"(<\w*> )(.*)(<\/$1> )","$2" ); recupere bien ce qu'il y a entre les balises de la source html
Marsh Posté le 14-05-2004 à 20:38:18
existe-t-il un moyen de récuper avec les regular expressions l'inverse d'une expression ?