Query( ) メインメソッド
Query() 静的メソッド
戻り値:QueryList オブジェクト
Query メソッドは QueryList の唯一のメイン メソッドであり、静的な方法で呼び出されます。
プロトタイプ:
QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null ,$removeHead = false)
#中国語の説明:
QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除头部])//采集规则$rules = array( '规则名' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]), '规则名2' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]), .......... [,"callback"=>"全局回调函数"]);//注:方括号括起来的参数可选
##パラメータの説明:
$page 収集されるターゲット ページ 型:
stringクロールする Web ページの URL アドレス (https をサポート) ); または HTML コード スニペット
#$rules コレクション ルールType:array
- ルール名は、繰り返されない限り任意に選択できます。
jQuery セレクター - jQuery セレクターと完全に共通の任意の CSS3 セレクター
収集される属性
值为以下3种: 1.text:返回当前选中标签下面的纯文本 2.html:返回当前选中标签下面的html片段 3.[HTML标签属性]:如src、href、name、data-src等任意HTML标签属性名
如果要使用QueryList的内容过滤功能,就请设置这个参数,多个值之间用空格隔开 1.当标签名前面添加减号(-)时(此时标签可以为任意的jQuery选择器),表示移除该标签以及标签内容。 2.当标签名前面没有减号(-)时,当 [要采集的属性] 值为text时表示需要保留的HTML标签,为html时表示要过滤掉的HTML标签説明: マイナス記号がある場合とない場合の違いは、マイナス記号がある場合、そのタグはすべてのタグを含めて削除されることです。コンテンツ (マイナス記号がない場合) は、そのタグのみが削除され、タグ内のコンテンツは削除されません
例: コンテンツ フィルタリング
Type:callback
コールバック関数では、コンテンツの置換、完了などの追加の操作を行うことができます。リンク、画像のダウンロードなど。 ;コールバック関数には 2 つのパラメータがあります。最初のパラメータは選択されたコンテンツで、2 番目のパラメータはセレクター配列の添字 (つまり、
ルール名
) です。コールバック関数はグローバル コールバック関数をオーバーライドします。 注
: QueryList は、ネストされたマルチレベル コレクションのコールバック関数では使用できません。これらの操作は、
getData() メソッドのコールバック関数に任せてください。
#$範囲範囲セレクター (オプション) Type:string
Default値:''エリア セレクター
または
。ルールに従って最初にいくつかの大きなブロックを選択し、次にそれぞれのブロックで関連する選択を行います。リストを収集する場合は、このパラメータを設定することをお勧めします。 地域セレクターの例を表示します: http://doc.querylist.cc/site/index/doc/29
$outputEncoding 出力エンコーディング (オプション) タイプ: string
デフォルト値:null
は文字化けを防ぐために出力するエンコーディング (UTF-8、GB2312 など) を指します。null
が設定されている場合、元の文字列エンコーディングは変更されません
$inputEncoding 入力エンコーディング (オプション)
タイプ: string
デフォルト値: null
文字化けを防ぐため、入力ページのエンコード形式(UTF-8、GB2312…..)を明確に指定します。null
を設定すると、
を自動的に識別します。 $removeHead ヘッドを削除するかどうか (オプション)
タイプ: bool
デフォルト値: false
はい ページヘッダー領域を削除します。文字化けに対する究極の解決策です。
注:このパラメータが true
に設定されている場合、ページの先頭領域のコンテンツは選択できません。