Crawler et extraction de l'information brute - Logiciels - Windows & Software
MarshPosté le 05-09-2007 à 13:54:59
Je cherche une solution pour extraire des news, des commentaires de client sur les forums ou autres mais je dois recuperer uniquement leur question/commentaire en évitant de récuperer tout le portail autour. Naturellement si le forum ou le site possède un fils RSS ca simplifie les choses, mais la solution doit pouvoir extraire l'information texetuelle brute même sans flux rss. Ces données devront aussi être stocké dans une base de donnée SQL, ou sous format Html/xml
Si quelqu'un a une petite idée de comment procéder, un logiciel sachant faire ca ou un détail,je vous en serai très reconnaissant.
Marsh Posté le 05-09-2007 à 13:54:59
Je cherche une solution pour extraire des news, des commentaires de client sur les forums ou autres mais je dois recuperer uniquement leur question/commentaire en évitant de récuperer tout le portail autour.
Naturellement si le forum ou le site possède un fils RSS ca simplifie les choses, mais la solution doit pouvoir extraire l'information texetuelle brute même sans flux rss.
Ces données devront aussi être stocké dans une base de donnée SQL, ou sous format Html/xml
Si quelqu'un a une petite idée de comment procéder, un logiciel sachant faire ca ou un détail,je vous en serai très reconnaissant.
Cordialement,