Récupération de données sur allociné - PHP - Programmation
Marsh Posté le 13-11-2011 à 18:49:14
Salut, 
Peut-être un problème avec le caractère accentué de 'Nationalité'... 
Personnellement je fait un utf8_decode sur le contenu à traiter, et je sauvegarde mes fichiers php en ANSI. 
Marsh Posté le 13-11-2011 à 19:29:59
la page est en utf8 donc pas de soucis 
Marsh Posté le 13-11-2011 à 20:11:26
Pour vérifier que le problème viens bien du caractère accentué, tu peux essayer de le remplacer par un point (.). 
 
| preg_match('#<li><span class="film_info lighten fl">Nationalit.</span><div class="oflow_a">(.*?)</div></li>#is', $recup, $nationalite);  | 
 
 
Par défaut les fonctions « preg » ne traitent pas de l'UTF-8.  
Si tu veux rester en UTF-8, tu peux essayer le modifier "u" en plus de "is" (#...#ius). 
 
Marsh Posté le 15-11-2011 à 14:35:59
ça ne fonctionne pas hélas 
Marsh Posté le 16-11-2011 à 11:25:35
J'ai testé ce bout de code dans mon scraper : 
| Code : 
 | 
 
Et comme tu peut le voir, ça match : 
|   | 
 
Mais l'une des première chose que je fait après avoir récupére le flux HTML UTF-8 sur allocine, c'est de le décoder (entre autre). 
J'ai eu trop de problèmes avec les caractères accentués. 
| Code : | 
 
Je m'assure aussi que mon fichier php ne soit pas en UTF-8 mais bien en ANSI (l'utilisation d'un éditeur comme Notepad++ 
est très pratique pour ça). 
Mes expressions régulières sont un peu plus simple aussi : 
| Code : 
 | 
 
Tu peut toujours sortir de l'UTF-8 en réencodant (je le fait pour des flux XML) : 
| Code : | 
 
 
Marsh Posté le 16-11-2011 à 12:20:18
Si tu veux scrapper des des données, je te conseille d'utiliser http://simplehtmldom.sourceforge.net/, tu iras 100 fois plus vite dans la construction de ton scrapper
Marsh Posté le 16-11-2011 à 17:09:58
Tout fonctionne, et j'ai regardé l'api c'est pas trop mal ! 
 
Merci !
Marsh Posté le 13-11-2011 à 16:17:47
Salut,
J'ai un problème pour récuperer une information sur allociné.
Voici le code html :
et mon code php :
Le problème est qu'il ne me renvoie rien
---------------
“ Un avis d’un homme non avisé ne doit jamais être pris en compte par un homme avisé. ” Jean Plancher, 1810, Taverne « Chez Bonaparte »