Solutions pour collecter les codes tronqués
Il existe de nombreux problèmes avec les caractères tronqués, et les solutions sont différentes selon la situation spécifique. Les solutions suivantes aux caractères tronqués sont uniquement à titre de référence.
1. Utilisez la solution tronquée intégrée de QueryList
Méthode de requête :
QueryList::Query (page cible de la collection, règle de collecte [, sélecteur de zone] [, encodage de sortie] [, encodage d'entrée ][ , s'il faut supprimer l'en-tête])
1. Définissez l'encodage d'entrée et de sortie
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
2 Définissez l'encodage d'entrée et de sortie et définissez le dernier paramètre sur true
Si la définition des paramètres d'entrée et de sortie ne parvient toujours pas à résoudre le problème. code brouillé, puis définissez Le dernier paramètre est vrai (supprimez l'en-tête)
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
2. Voir le forum QueryList [brouillé] solutions de sujets connexes
brouillé : http://querylist.cc/search/q-5Lmx56CB #all
3. Transcodez manuellement la page vous-même, puis transmettez la page à QueryList
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;