Qu'est-il à dire de cette erreur ? (URL) - Python - Programmation
Marsh Posté le 04-07-2010 à 19:19:30
erwan83 a écrit : soit le code de mon scanner web :
|
L'erreur ne s'est pas passée sur "response = urllib2.urlopen(req)" sinon l'except aurait été appelé et t'aurais eu un "E R R E U R D E V A L E U R".
Faut donner la ligne 304 de ton fichier "001_moteur_de_recherche sans les phrases.py" et non le bloc try/except qui, visiblement, n'a pas été impliqué...
Quoi qu'il en, soit, il cherche à convertir une string sensée être un nombre en base 16 (comme par exemple "1a" ) en nombre correspondant en base 10 (comme 26)
Accessoirement, tu peux remplacer
Code :
|
par
Code :
|
ou bien
Code :
|
Marsh Posté le 05-07-2010 à 02:23:30
Yes... donc y a-t-il un controle à insérer ?
Bon, vu que j'ai refait le fichier (quelques interlignes pour aérer tout ce bazar) j'attendrai la reproduction de l'erreur et je te tiendrai au courant !
Merci !
Marsh Posté le 05-07-2010 à 08:59:56
Code :
|
et voila la ligne 332
Code :
|
Marsh Posté le 05-07-2010 à 09:04:51
erwan83 a écrit :
|
Ben ça deviendra
Code :
|
Marsh Posté le 05-07-2010 à 14:49:08
ReplyMarsh Posté le 06-07-2010 à 06:53:01
Code :
|
et là je mets quoi comme except ?
heu... mon code :
Code :
|
en désespoir de cause j'ai mis except RuntimeError
( ref http://docs.python.org/library/exceptions.html )
Marsh Posté le 06-07-2010 à 22:21:29
erwan83 a écrit :
|
Hum... tu peux essayer except error. Ou bien except: sans rien derrière => ça catche toutes les exceptions
erwan83 a écrit : en désespoir de cause j'ai mis except RuntimeError |
Mouais, pourquoi pas. Si ça marche...
Marsh Posté le 07-07-2010 à 22:46:18
ben écoute, ça a marché, il a scanné tout mon fichier sans problème.
seul soucis je lui avais demandé dans l'exception runtimeError de m'écrire 50 fois 'RunTime Error' pour que ça me saute à la figure et évidemment, pas vu !!!!
Mais bon, là je passe quelques jous chez mes parents, dimanche je remettrai le nez dedans car j'ai 18000 pages web indexées et il va falloir que je les trie... Au pire on se voit lundi et on en parle autour d'un café
Marsh Posté le 09-07-2010 à 23:45:31
Bon, d'après ma copine qui jette un oeil de temps en temps, le moteur est à l'arret depuis 48 heures... Argggg 48000 pages que j'aurais pu indexer en plus...
Bref, il a bouffé toute la liste que je lui avais passée sans problème aucun !
Yes !!!
Marsh Posté le 10-07-2010 à 23:58:14
erwan83 a écrit : Bon, d'après ma copine qui jette un oeil de temps en temps, le moteur est à l'arret depuis 48 heures... Argggg 48000 pages que j'aurais pu indexer en plus... |
J'espère que l'index est stocké dans une bdd parce que Python n'est pas fait pour ça. Dans mon projet, j'avais commencé par stocker les valeurs en mémoire. 3mn30 pour analyser et afficher un truc de 36000 valeurs.
Puis j'ai déporté le stockage dans des tables temporaires de Postgres. Résultat: 35 sec...
Marsh Posté le 11-07-2010 à 12:23:45
non non je t'expliquerai j'ai environ (actuellement) 17342 index basés sur des triplets de lettres. ensuite je lance une boucle dans mon php qui cherche l'existence d'un de ces triplets :
array a b c d ..... multiplié par trois
si il me renvoie un triplet, je prends le premier, ca signifie que dans l'index qui porte le nom du triplet je trouverai mon mot...
etc pour le mot suivant etc etc
Code :
|
exemple de temps d'une requête :
http://88.163.71.238/index.php?inp [...] e=1&open=n
moins d'un dixième de seconde !
au fait :
Code :
|
YESSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS !!!
Marsh Posté le 11-07-2010 à 13:04:38
ReplyMarsh Posté le 11-07-2010 à 18:13:21
flo850 a écrit : donc que je cherche pantoufle ou pangloss, j'ai les mêmes résultats ? |
Ben oui, surtout si on cherche les pantoufles de pangloss...
Marsh Posté le 11-07-2010 à 18:48:02
ReplyMarsh Posté le 12-07-2010 à 20:55:46
attention pas encore au point le truc
non si tu cherches pantoufles tu auras admettons l'index PAN ou encore OUF etc et il cherchera le mot exact dans cet index etc etc...
Marsh Posté le 12-07-2010 à 20:56:31
flo850 a écrit : au passage , quand on cherche design, ça plante |
http://88.163.71.238/index.php?inp [...] t=0&open=n
(1067 résultats)
Marsh Posté le 12-07-2010 à 21:13:18
Bon, pour revenir sur du serieux, hier j'ai été emmerdé par cette page :
http://www.culture.gouv.fr
il se trouve que l'url, quand on ouvre la page se charge en permanence, bizarre, en fait on charge à 99.99% mais on n'arrive jamais à finir le chargement.
ça m'a planté le BOT : il m'a marqué
adresse en cours http://www.culture.gouv.fr
titre : blabla
et un quart d'heure après il était encore dessus.
=> comment et où mettre une sorte de compteur ?
Code :
|
donc c'est ValueError qui a détecté l'erreur 16 bits.
(aucune inscription dans le fichier)
Et pour finir, ce code d'erreur :
Code :
|
Comment gérer cette exception ?
Merci !!!
Marsh Posté le 12-07-2010 à 22:23:44
erwan83 a écrit :
|
Si tu regardes bien l'arbre des exceptions, tu verras que les exceptions héritent les unes des autres.
Exemple: pour gérer le cas 1/0, tu peux catcher
- ZeroDivisionError
- ArithmeticError
- StandardError
- Exception
- BaseException
Car toutes ces exceptions héritent les unes des autres.
Donc au pire tu catche BaseException (la racine de l'arbre) et là, tu devrais tout récupérer.
Code :
|
Ou alors, tu mets rien après except ce qui chopera, là aussi, tout
Code :
|
Marsh Posté le 03-07-2010 à 08:49:08
soit le code de mon scanner web :
voici l'erreur que j'ai obtenue :
---------------
http://www.ypikay.com