[PHP] - récupérer le texte d'un fichier doc

- récupérer le texte d'un fichier doc [PHP] - PHP - Programmation

Marsh Posté le 19-06-2007 à 14:22:04    

Bonjour,
 
Je reçoit beaucoup de fichier Word (.doc) à mettre en place sur un site, et pour l'instant j'ai fait un truc sympas mais relativement long :
explication :  
- je prend copie/colle le texte du fichier doc dans un nouveau mail, je garde donc la "mauvaise" mise en page du document,
- J'envoi le mail à un destinataire précis (le site en question)
je vais dans la partie admin du site je réceptionne les mail, un système automatique les remet en forme par rapport au css du site et me l'intégre dans une table temporaire, en attendant l'étape suivant,
- Le mail se détruit automatiquement si l'intégration c'est passé sans problème
- je vérifie chaque document manuellement,
- enfin je les valide, ce qui les affiche sur le site
 
je recherche un procédure qui me permettent de récupérer directement le fichier doc pour l'intégrer dans ma table
 
je ne c'est pas si je suis claire, mais voila ce que je faire,
n'hésitez pas à me questionner pour en savoir plus !!
 
Merci d'avance pour votre aide :jap:


---------------
Tout à commencé par un rêve...
Reply

Marsh Posté le 19-06-2007 à 14:22:04   

Reply

Marsh Posté le 19-06-2007 à 14:40:05    

vba.....

Reply

Marsh Posté le 19-06-2007 à 15:20:46    

c'est pour un site web !
en vba je veux bien, as-tu une piste ?

Reply

Marsh Posté le 19-06-2007 à 15:27:00    

si tu utilises php sur ton site tu as plusieurs machins qui te permettent de faire des conversions de doc vers txt ou html, genre celui-là ( que j'ai pas testé et non je n'assure pas non plus le support). Une recherche sur google te donnera une liste plus exhaustive.

Reply

Marsh Posté le 19-06-2007 à 15:38:14    

merci je regarde, j'avais cherché il y a quelques temps, mais j'ai du passer à autre chose

Reply

Marsh Posté le 19-06-2007 à 21:49:58    

en faite ce que je voudrais c'est pouvoir récupérer chaque paragraphe du document word et le traiter ensuite.
 
j'ai explorer pas mal de site, mais rien sur ça.
 
je refait appel à vous, car le je sèche ! :pt1cable:


---------------
Tout à commencé par un rêve...
Reply

Marsh Posté le 20-06-2007 à 14:26:43    

j'ai trouvé ça en VBA, mais je ne serais le traduire en PHP si quelqu'un serait faire, je suis preneur :
 

Code :
  1. Sub boucleParagraphesWord()
  2. '
  3. 'Nécessite d'activer la référence Microsoft Word xx.x Object Library
  4. '
  5. Dim appWrd As Word.Application
  6. Dim docWord As Word.Document
  7. Dim Paragraphe As Paragraph
  8. Dim i As Integer
  9. Set appWrd = CreateObject("Word.Application" )
  10. appWrd.Visible = True
  11. Set docWord = appWrd.Documents.Open("C:\monDocument.doc" )
  12. For Each Paragraphe In docWord.Paragraphs
  13. If Paragraphe.Range.ListFormat.ListValue <> 0 Then
  14. i = i + 1
  15. Cells(i, Paragraphe.Range.ListFormat.ListLevelNumber) = _
  16. Paragraphe.Range.ListFormat.ListString
  17. Cells(i, Paragraphe.Range.ListFormat.ListLevelNumber + 1) = _
  18. Paragraphe.Range.Sentences(1).Text
  19. End If
  20. Next
  21. End Sub


---------------
Tout à commencé par un rêve...
Reply

Marsh Posté le 20-06-2007 à 14:29:20    

en PHP, tu peux utiliser COM pour ce genre de chose : http://fr.php.net/manual/fr/ref.com.php
 
Mais c'est lourd et pas conseillé à mettre en production :/

Reply

Marsh Posté le 20-06-2007 à 14:33:32    

je voudrais déjà pouvoir juste l'utiliser, car je n'ai pas beaucoup trouvé d'info !
 
j'ai trouvé plein d'informations sur le net, mais juste pour la création de document Word !
rien concernant l'extraction de données !
 
mon seul objectif et juste de vouloir récupérer les paragraphe d'un fichier word, sans devoir faire 36 manipulation !
j'ai trouvé des solutions en transformant le doc en html mais rien de plus !
 
je crois que je vais devoir utiliser cette voie !


Message édité par stef_dobermann le 20-06-2007 à 14:36:26

---------------
Tout à commencé par un rêve...
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed