recherche un script de recuperage

recherche un script de recuperage - HTML/CSS - Programmation

Marsh Posté le 21-07-2005 à 10:51:26    

Bonjour je cherche un script
 
 
pour essayer de recuperer uniquement le title, le meta ... d'un site quelconque !!!
 
il y a t'il une fonction qui existe deja?
 
ou si no comment doit t'on le faire svp

Reply

Marsh Posté le 21-07-2005 à 10:51:26   

Reply

Marsh Posté le 21-07-2005 à 11:07:26    

Si la page est en XHTML, c'est archi simple avec un peu d'XPath...

Reply

Marsh Posté le 21-07-2005 à 11:15:08    

et comment on le fait ?
 
stp car je n'arrive pas a le trouver

Reply

Marsh Posté le 21-07-2005 à 11:16:17    

Donc quelques questions :

  • Est-ce que le document est bien de l'XHTML bien formé ?
  • Quel technologie utilise-tu : PHP, .NET, etc...

Reply

Marsh Posté le 21-07-2005 à 11:17:15    

voila mon bou de code
 
<html>
<head>
<title>Test de mon script</title>
<script language="JavaScript" type="text/javascript">
function http(){
if (document.getsource.view.defaultvalue != document.getsource.view.value)
{document.getsource.view.value = "View Source"}
if (document.getsource.url.defaultvalue != document.getsource.url.value)
{document.getsource.url.value = "http://"}
}
function viewSource(){
var geturl = document.getsource.url.value; {
//var SourceUrl = "view-source:" + geturl ; location.href = SourceUrl;
}
}
 
 
</script>
 
</head>
<body>
 
<form name="getsource" action="">
<b>URL:</b> <input type="text" name="url" onfocus="http()"
value="http://www." /> <input type="button" name="view"
value="View Source" onclick="viewSource()" />
</form>
 
 
 
</body>
</html>

Reply

Marsh Posté le 21-07-2005 à 11:18:30    

j'arrive a lire la source mais je n'arrive pas prendre le tilte et les autres info :(

Reply

Marsh Posté le 21-07-2005 à 11:19:28    

Ouais mais ce n'est pas le problème. Avec quoi compte-tu récupérer ces informations ?

Reply

Marsh Posté le 21-07-2005 à 11:19:39    

Uniquement en JavaScript ?

Reply

Marsh Posté le 21-07-2005 à 11:19:58    

oui

Reply

Marsh Posté le 21-07-2005 à 11:20:36    

je doi reussir a prendre les info sur n'importe quel site pas seulement la mienne

Reply

Marsh Posté le 21-07-2005 à 11:20:36   

Reply

Marsh Posté le 21-07-2005 à 11:30:02    

Avec XmlHttpRequest, tu peux ouvrir le doc... Puis faire 2-3 recherches. Mais comme dit, ça fonctionnera pas pour 98% des sites, qui ne sont pas en XHTML

Reply

Marsh Posté le 21-07-2005 à 11:33:24    

oui mais je veux juste faire des recherche sur des site html
 
peu tu me dire comment je dois faire stp
 
merci

Reply

Marsh Posté le 21-07-2005 à 11:33:38    

Ben du coup j'en sais rien :D

Reply

Marsh Posté le 21-07-2005 à 11:38:08    

:'( je suis vraiment en galere la je le cherche depuis 2 jour tj pas de resultat  :'(

Reply

Marsh Posté le 21-07-2005 à 11:41:49    

Salut,
j'ai peut etre une solution, mais pour changer, c'est du lourd.
Tu mets une (i)frame cachée dans laquelle tu affiches la page désirée. Tu reccupères le le document de cette pages, et en faisant un coup de  

Code :
  1. HiddenFrame.document.body.parentElement

 
tu te retrouves sur le noeud <html> de ta page (si elle est un tant soit peu bien formée). Apres il suffit naviguer dans ton arbre dom...
Bloat ware, pour changer, mais ca peut passer :p


Message édité par fred_p le 21-07-2005 à 11:45:09
Reply

Marsh Posté le 21-07-2005 à 11:57:05    

mais je viens juste de commencer a faire du javascript je ne vois meme pas ou je peu appler le (i)frame :(

Reply

Marsh Posté le 21-07-2005 à 15:36:06    

personne s'est faire du javascript? :'(

Reply

Marsh Posté le 21-07-2005 à 15:42:37    

new-tech a écrit :

personne s'est faire du javascript? :'(


 :pfff:

Reply

Marsh Posté le 21-07-2005 à 15:48:04    

lol mais sauf toi tu sais en faire.
 
la je viens de me taper au moin 2h de lecture et j'ai essayer d'avancer dans mes scripts mais sa me plante tj

Reply

Marsh Posté le 21-07-2005 à 16:57:16    

"lol mais sauf toi tu sais en faire."
C'est gentil mais c'est pas vrai. Le truc c'est que je pense que ce n'est pas la philosophie de ce forum que de fournir du script tout fait. Une majorité de personnes de ce forum sont de bon conseils. Maintenant, à toi de creuser un peu. Regarde tu mets un id à ton iframe, tu fais un getElementById pour la reccupérer.

Reply

Marsh Posté le 22-07-2005 à 12:02:23    

voila je viens de chercher depuis ce matin 8h avec sans aucun sucès :'(
mon but et de recuperer le title ou les meta enfin je dois reusir a faire une analyse de page
aidez moi svp
 
mon code  et pour voir le resultat mon site  
http://127.0.0.1/script/title12.htm
 
 
 
 
 
<html>
<head>
  <meta name="je test mon script" content="">
  <meta name="test, javascript, new-tech" content="">
<title>Test de mon script</title>
</head>
<body>
    <tr>
    <td>
 <br>
 <td><table width="650" cellpadding="7" cellspacing="7">
 <tr>
<td ALIGN="left" BGCOLOR="#eeeeee" width="600"><font face="arial"
color="#000055" size="3"><b><center>Titre de la page</b><font size="1">&nbsp;•&nbsp;Balise
<b>&lt;TITLE&gt;</b>&nbsp;de la page HTML</center>
</font></font>
     </td>
     </tr>
          <tr>
            <td align="left" bgcolor="#ffffcc" width="600"><font color="#000055" face="verdana,helvetica" size="2"><b>Contenu</b> : </font><font color="#de6363" face="verdana,helvetica" size="2">    
 
<!--debut de script title-->
<script type="text/javascript">
document.getElementById("meta" );
</script>
<!--finde script title-->
 
    </tr>  
   </font>
     
<!-- _FOOTER_START_ -->
<iframe id="meta"
         frameborder="0"  
         marginheight="0"  
         marginwidth="0"  
         width="500"  
         height="500"
         src="http://www.forummobiles.com">
 </iframe>
<!-- _FOOTER_END_ -->
 
 
</body></html>

Reply

Marsh Posté le 22-07-2005 à 12:06:46    

"http://127.0.0.1/script/title12.htm" lool =)

Reply

Marsh Posté le 22-07-2005 à 12:09:41    

Reply

Marsh Posté le 22-07-2005 à 12:09:54    

Je vais coller ici ce que j'avais écrit à FlorentG quand j'étais tété :
 

Citation :

C'est un peu du XSS ce qu'il tente de faire hein :o
 
Et xmlHttpRequest ne fonctionne qu'en appelant une URL située sur le même domaine que l'URL de la page :o
(par contre xmlHttpRequest ne rend pas automatiquement de l'XML, on peut lui demander du raw text, donc on peut parser n'importe quelle donnée si on prend le temps et qu'on a pas peur du nombre de lignes)


 
Donc il est impossible de faire ce que tu demandes de faire sans passer par un serveur que tu auras mis en place toi même et qui fera le relai entre ta page de traitement et la page à traiter :o


---------------
Stick a parrot in a Call of Duty lobby, and you're gonna get a racist parrot. — Cody
Reply

Marsh Posté le 22-07-2005 à 12:25:10    

ok, je viens de faire le test, pour des pages d'aures domaines et il y a un lock de securité.

Code :
  1. document.frames("meta" ).document.body.parentElement;


Ce code permet de reccupérer le dom de la page dans l'(i)frame,j'avais fait ça pour un intranet ou les pages dans l'iframe étaient générées par nous.
dsl new-tech


Message édité par fred_p le 22-07-2005 à 12:25:25
Reply

Marsh Posté le 22-07-2005 à 12:25:11    

okay ba merci quand meme pour l'aide,
 
je vais tenter de le faire en PHP


Message édité par new-tech le 22-07-2005 à 12:26:38
Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed