Penyelesaian untuk mengumpul kod bercelaru


Terdapat banyak masalah dengan aksara yang bercelaru, dan penyelesaiannya adalah berbeza.

1. Gunakan penyelesaian terbina dalam QueryList yang bercelaru

Kaedah pertanyaan:

QueryList::Query (halaman sasaran koleksi, peraturan koleksi [, pemilih kawasan] [, pengekodan input] , sama ada hendak mengalih keluar pengepala])

1 Tetapkan pengekodan input dan output

$html =<<<STR
<div>
   <p>这是内容</p>
</div>
STR;
$rule = array(
   'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;

2 Tetapkan pengekodan input dan output, dan tetapkan parameter terakhir kepada benar
Jika menetapkan parameter input dan output masih tidak dapat menyelesaikannya. kod kacau, kemudian tetapkan Parameter terakhir adalah benar (alih keluar pengepala)

$html =<<<STR
<div>
   <p>这是内容</p>
</div>
STR;
$rule = array(
   'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;

2. Lihat forum QueryList [bermasalah] penyelesaian topik berkaitan

garbled: http://querylist.cc/search/q-5Lmx56CB #all

3 Transkod halaman sendiri secara manual, kemudian hantar halaman itu ke QueryList

$html =<<<STR
<div>
    <p>这是内容</p>
</div>
STR;
$rule = array(
    'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
.