Query( ) メインメソッド



    #

    Query() 静的メソッド

    戻り値:QueryList オブジェクト

    Query メソッドは QueryList の唯一のメイン メソッドであり、静的な方法で呼び出されます。

    プロトタイプ:

    QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null ,$removeHead = false)

    #中国語の説明:

    QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除头部])//采集规则$rules = array(   '规则名' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),   '规则名2' => array('jQuery选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),    ..........    [,"callback"=>"全局回调函数"]);//注:方括号括起来的参数可选

    ##パラメータの説明:

    $page 収集されるターゲット ページ 型:

    string

    クロールする Web ページの URL アドレス (https をサポート) ); または HTML コード スニペット

    #$rules コレクション ルールType:array

    ルール名
    • ルール名は、繰り返されない限り任意に選択できます。
      jQuery セレクター
    • jQuery セレクターと完全に共通の任意の CSS3 セレクター
      収集される属性
    • 值为以下3种:  1.text:返回当前选中标签下面的纯文本  2.html:返回当前选中标签下面的html片段  3.[HTML标签属性]:如src、href、name、data-src等任意HTML标签属性名
    • フィルター タグ リスト
    • 如果要使用QueryList的内容过滤功能,就请设置这个参数,多个值之间用空格隔开  1.当标签名前面添加减号(-)时(此时标签可以为任意的jQuery选择器),表示移除该标签以及标签内容。  2.当标签名前面没有减号(-)时,当 [要采集的属性] 值为text时表示需要保留的HTML标签,为html时表示要过滤掉的HTML标签
      説明: マイナス記号がある場合とない場合の違いは、マイナス記号がある場合、そのタグはすべてのタグを含めて削除されることです。コンテンツ (マイナス記号がない場合) は、そのタグのみが削除され、タグ内のコンテンツは削除されません

      例: コンテンツ フィルタリング

    • コールバック関数/グローバル コールバック関数
    • Type:callback
      コールバック関数では、コンテンツの置換、完了などの追加の操作を行うことができます。リンク、画像のダウンロードなど。 ;コールバック関数には 2 つのパラメータがあります。最初のパラメータは選択されたコンテンツで、2 番目のパラメータはセレクター配列の添字 (つまり、ルール名
      ) です。コールバック関数はグローバル コールバック関数をオーバーライドします。
      : QueryList は、ネストされたマルチレベル コレクションのコールバック関数では使用できません。これらの操作は、
      getData() メソッドのコールバック関数に任せてください。

    #$範囲範囲セレクター (オプション) Type:string

    Default値:

    ''
    エリア セレクター または

    範囲セレクター

    。ルールに従って最初にいくつかの大きなブロックを選択し、次にそれぞれのブロックで関連する選択を行います。リストを収集する場合は、このパラメータを設定することをお勧めします。 地域セレクターの例を表示します: http://doc.querylist.cc/site/index/doc/29

    $outputEncoding 出力エンコーディング (オプション) タイプ: string

    デフォルト値:

    null

    は文字化けを防ぐために出力するエンコーディング (UTF-8、GB2312 など) を指します。null が設定されている場合、元の文字列エンコーディングは変更されません

    $inputEncoding 入力エンコーディング (オプション)

    タイプ: string
    デフォルト値: null

    文字化けを防ぐため、入力ページのエンコード形式(UTF-8、GB2312…..)を明確に指定します。nullを設定すると、

    を自動的に識別します。 $removeHead ヘッドを削除するかどうか (オプション)

    タイプ: bool
    デフォルト値: false

    はい ページヘッダー領域を削除します。文字化けに対する究極の解決策です。
    注:このパラメータが true に設定されている場合、ページの先頭領域のコンテンツは選択できません。