ホームページ >バックエンド開発 >PHPチュートリアル >Webページキャプチャ情報(php正規表現、php演算excel)

Webページキャプチャ情報(php正規表現、php演算excel)

WBOY
WBOYオリジナル
2016-06-23 13:33:02876ブラウズ

1. 問題の説明

固定 Web ページ上で必要な情報をキャプチャし、表形式で保存します。練習のために wustoj のランキング リストを使用しました。アドレス: wustoj


2. アイデア

Web ページは単に自分で PHP を学習し、それを使って何かをしただけです:

(1) Web ページのソース コードを表示し、ファイルに保存します。

(2) 必要な情報に基づいて正規表現を記述し、ファイルを読み取り、正規表現に基づいて必要な情報を抽出します。正規表現を作成するときは、正規表現をグループ化して抽出を容易にすることをお勧めします。

(3) Excelを操作し、抽出した情報をExcel形式で出力します。

Excel のようなリンクを処理するためのオープンソース PHP の改善: クリックしてリンクを開きます


3. エクスペリエンス

^ は元の文字列の先頭であることを意味し、$ は元の文字列の末尾であることを意味します弦。
ヌル文字は必ずしもスペースであるとは限りません。
preg_macth_all(/$pattern/,$subject,matches) のように、() を使ってグループ化するのが良い方法です。
matches は 2 次元配列です。_all がない場合は、1 次元配列である最初の部分のみが一致します。
$matches[0] は、完全なパターンのすべての一致を保存します。 $matches[1] は、最初のサブグループ内のすべての一致、つまりすべての一致の最初の部分を保存します。
私が使用する中国語の一致文字列は $patt_ch=chr(0x80)."-".chr(0xff) です。


4. コード



5. 実行結果




声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。