ホームページ >バックエンド開発 >PHPチュートリアル >Webページキャプチャ情報(php正規表現、php演算excel)
1. 問題の説明
固定 Web ページ上で必要な情報をキャプチャし、表形式で保存します。練習のために wustoj のランキング リストを使用しました。アドレス: wustoj
2. アイデア
Web ページは単に自分で PHP を学習し、それを使って何かをしただけです:
(1) Web ページのソース コードを表示し、ファイルに保存します。
(2) 必要な情報に基づいて正規表現を記述し、ファイルを読み取り、正規表現に基づいて必要な情報を抽出します。正規表現を作成するときは、正規表現をグループ化して抽出を容易にすることをお勧めします。
(3) Excelを操作し、抽出した情報をExcel形式で出力します。
Excel のようなリンクを処理するためのオープンソース PHP の改善: クリックしてリンクを開きます
3. エクスペリエンス
^ は元の文字列の先頭であることを意味し、$ は元の文字列の末尾であることを意味します弦。
ヌル文字は必ずしもスペースであるとは限りません。
preg_macth_all(/$pattern/,$subject,matches) のように、() を使ってグループ化するのが良い方法です。
matches は 2 次元配列です。_all がない場合は、1 次元配列である最初の部分のみが一致します。
$matches[0] は、完全なパターンのすべての一致を保存します。 $matches[1] は、最初のサブグループ内のすべての一致、つまりすべての一致の最初の部分を保存します。
私が使用する中国語の一致文字列は $patt_ch=chr(0x80)."-".chr(0xff) です。
4. コード
5. 実行結果