왜곡된 코드 수집 솔루션
깨진 문자에는 많은 문제가 있으며 구체적인 상황에 따라 해결 방법이 다릅니다. 다음은 문자 깨짐에 대한 해결 방법은 참고용일 뿐입니다.
1. QueryList에 내장된 Garbled 솔루션을 사용하세요
Query 방법 :
QueryList::Query(수집 대상 페이지, 수집 규칙 [, 영역 선택기] [, 출력 인코딩] [, 입력 인코딩 ][ , 헤더 제거 여부])
1. 입력 및 출력 인코딩을 설정합니다
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
2. 입력 및 출력 인코딩을 설정하고 마지막 매개변수를 true로 설정합니다.
입력 및 출력 매개변수를 설정해도 문제가 해결되지 않는 경우 잘못된 코드를 설정한 다음 마지막 매개변수가 true입니다(헤더 제거)
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
2. QueryList 포럼 보기 [가블링] 관련 주제 솔루션
가블링: http://querylist.cc/search/q-5Lmx56CB #all
3. 페이지를 직접 트랜스코딩한 다음 해당 페이지를 QueryList
$html =<<<STR <div> <p>这是内容</p> </div> STR; $rule = array( 'content' => array('div>p:last','text') ); $data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;