[XML] parser un formulaire en .doc ??

parser un formulaire en .doc ?? [XML] - XML/XSL - Programmation

Marsh Posté le 02-12-2004 à 17:18:05    

Tout le probleme est dans le sujet!!  :)  
 
J'ai un ensemble de formulaire contenus dans un .doc en rien modifiable!!! Est il possible de parser toutes ces bestioles pour mettre le contenu du formulaire dans un joli XML tout beau tout neuf?
 
Merci


---------------
-Alex-
Reply

Marsh Posté le 02-12-2004 à 17:18:05   

Reply

Marsh Posté le 02-12-2004 à 17:21:37    

en quel langage tu veux faire ce parseur? tu as une idee ou pas du tout?


---------------
IVG en france
Reply

Marsh Posté le 02-12-2004 à 17:23:24    

En C# si possible, mais je suis ouvert à d'autres possibilités!


---------------
-Alex-
Reply

Marsh Posté le 02-12-2004 à 17:27:20    

ici: http://www.dotnet247.com/247refere [...] 02704.aspx
 
un mec a transforme son .doc en HTML. Malheuresement, je peux pas t'aider plus, j'y connais rien en C#, tu devrais peut etre deplacer ton topic en C# pour avoir plus d'aide ;)


---------------
IVG en france
Reply

Marsh Posté le 02-12-2004 à 17:31:39    

Sinon en asp.net si il y a des propositions! :)


---------------
-Alex-
Reply

Marsh Posté le 03-12-2004 à 13:40:35    

j'ai entendu parler de la possibilité assez simplement de programmer un outil qui exporte les .doc en XML?
Quelqu'un aurait il une idée là dessus?
 

Reply

Marsh Posté le 03-12-2004 à 13:43:09    

c'est en java: http://www.davisor.com/offisor/index.html mais je crois pas que ce soit gratuit :/
 
va faire un tour sur xml.com :jap:


---------------
IVG en france
Reply

Marsh Posté le 03-12-2004 à 13:57:05    

si c'est a faire qu'une fois et ensuite c'est reglé, convertir les .doc en .sxw avec openoffice, les sxw sont des fichiers xml zippés en gros ;)


---------------
Me: Django Localization, Yogo Puzzle, Chrome Grapher, C++ Signals, Brainf*ck.
Reply

Marsh Posté le 03-12-2004 à 16:15:15    

Citation :

Sinon en asp.net si il y a des propositions! :)


 
Je vois pas trop la différence avec du c# voir pas du tout !
Pour info l'asp.net c du c# (ou du VB.net ce qui reviens presque au meme vu que le framework est utilisé dans les deux cas)

Reply

Marsh Posté le 06-12-2004 à 14:37:43    

ALors pour l'info, En le transformant mon .doc en .xml, et en faisant un mapping XML sous excel de ce fichier (qui est un vrai fourbi!!), j'arrive à extraire les valeurs sauf que je n'arrive pas à les différencier les unes des autres. Les données du formulaire sont dans une seule et même variable après le mapping si bien que si un champ est laissé vide, il fait se décaler tout les autres...donc impossible de dire que la case A12 du tableau excel représentera toujours le nom.  
je sais pas si vous me suivez mais...ca en est là....
 

Citation :

si c'est a faire qu'une fois et ensuite c'est reglé, convertir les .doc en .sxw avec openoffice, les sxw sont des fichiers xml zippés en gros ;)


 
Je vais voir avec un .sxw, merci


---------------
-Alex-
Reply

Marsh Posté le 06-12-2004 à 14:37:43   

Reply

Marsh Posté le 06-12-2004 à 15:21:27    

Word (Office en fait) 2003 sait enregistrer les fichiers .doc en XML (voir wordml).


---------------
FAQ fclc++ - FAQ C++ - C++ FAQ Lite
Reply

Marsh Posté le 07-12-2004 à 11:02:42    

Ouaip mais le gros problème c'est que mes fichiers word sont des formulaires dont les champs se trouvent dans des cases de tableaux.
En wordML ces champs sont traduits <w:t></w:t>. Jusque là tout pourrait aller bien... Vous allez me dire..tu n'as qu'a faire un mapping de toutes ces balises.... sauf que (forcement y'a un sauf que!)... quand je fais un mapping dans Excel du fichier XML généré à partir de ce .doc, J'ai toute les données de mon formulaire reconnues comme une seule et même balise <w:t> ... La question serit comment mettre un Id à ces cases et que cet id soit récupéré dans le fichier XML .
 
J'ai essayé de prendre le xml généré, de mettre des <w:t id=nom></w:t> à la place des <w:t></w:t> et de réeporter le tout en .doc (en esperant que les id seraient gardés)..et bien sur en reexportant encore en XML... pouf...plus d'id.. :( :( :(  
 
suis pas sûr que ce soit super clair mon truc!!!! C'etait pour vous faire partager ma déchéance!!!


---------------
-Alex-
Reply

Marsh Posté le 07-12-2004 à 11:04:00    

Non en effet. Je comprends pas ce que Excel vient faire là dedans.


---------------
FAQ fclc++ - FAQ C++ - C++ FAQ Lite
Reply

Marsh Posté le 07-12-2004 à 11:19:29    

:) :)
 
En essayant d'etre plus clair :
 
Le but :Recuperer les données d'un formulaire Word dans Excel  
La techniquePasser par le traitement du fichier word exporté en XML et en fair le mapping dans Excel et de récupérer les balises qui m'interessent.
Le problème : je n'arrive pas dans le formulaire word à spécifier des balises spécifiques pour chaque donnée : à l'exportation en XML je me retrouve uniquement avec des balises wordML de cases de tableau: <w:t></w:t>
 
La solution : bah...je la cherche encore :)
 
 
On m'a parlé de smart tag, mais à ma connaissance les smarts tags ne font que parser du texte entré dans un outil office et si ce texte correspond à un template donné, une action est executée... c'est ca j'ai bon?


Message édité par alex@MS le 07-12-2004 à 11:22:03

---------------
-Alex-
Reply

Marsh Posté le 07-12-2004 à 11:24:21    

Alors là j'en sais rien.


---------------
FAQ fclc++ - FAQ C++ - C++ FAQ Lite
Reply

Marsh Posté le 07-12-2004 à 16:45:08    

HOURRRAAAAAAAAAAA
 
  http://www.microsoft.com/downloads [...] laylang=en
 
C'est l'url d'un petit tool qui se met dans Word qui permet d'ajouter des balises dans un formulaire word sans aucun problème...donc apres facile avec un mapping de récupérer ces données...
 
VOILAAAAAA Le post se finit là !! :)


---------------
-Alex-
Reply

Marsh Posté le 07-12-2004 à 16:59:24    

Sinon tu as la solution suivante:
.doc -> .rtf (word)
.rtf -> .xml (rtf2xml http://rtf2xml.sourceforge.net )
A+,


---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed