ホームページ >バックエンド開発 >PHPチュートリアル >PHP で静的ページを収集し、ページを保存する方法 css、img、js、静的ページ css_PHP チュートリアル

PHP で静的ページを収集し、ページを保存する方法 css、img、js、静的ページ css_PHP チュートリアル

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル: 2016-07-13 10:10:58915ブラウズ

PHPで静的ページを収集し、ページCSS、IMG、JS、静的ページCSSを保存する方法

この記事の例では、PHP で静的ページを収集し、そのページの css、img、js を保存する方法を説明します。参考のためにみんなで共有してください。具体的な分析は次のとおりです:

これは、Web ページの HTML コードと CSS、JS、フォント、IMG リソースを取得できる小さなツールです。主に、UI をデザインしたり、テンプレートを表示したりする時間がない場合に使用されます。優れたテンプレートなので、このツールを使用して Web ページと抽出されたリソースファイルを取得できます。抽出されたコンテンツは相対パスに従ってリソースを保存するため、リソースファイルの間違った URL インポートを心配する必要はありません。

ホームページのindex.php、コードは次のとおりです:

コードをコピーしますコードは次のとおりです:

ウェブスクレーパー

ウェブグラバー

URL

すべて保存

ページのコードgrab.phpを取得します。コードは次のとおりです:

コードをコピーします

コードは次のとおりです:

/*
*フルート
* 2014/03/31
*/

if(isset($_POST['url'])) {
if(isset($_POST['プロジェクト']) && !is_dir($_POST['プロジェクト'])) mkdir($_POST['プロジェクト'],
); echo json_encode(grab($_POST['url'])); }

関数グラブ($url) {
//$url = 'http://ldixing-wordpress.stor.sinaapp.com/uploads/leaves/test.html'; $data = 配列(); $file = preg_replace('/^.*//', '', $url);
if(($content = file_get_contents($url)) !== false) {

If(isset($_POST['プロジェクト'])) file_put_contents($_POST['プロジェクト'].'/'.$file, $content);
$pattern = '//i';
If(preg_match_all($pattern, $content, $matches)) {

$data['css'] = $matches[2]
; }

$pattern = '//i'; If(preg_match_all($pattern, $content, $matches)) { $data['js'] = $matches[2] ; }

$pattern = '/ PHP で静的ページを収集し、ページを保存する方法 css、img、js、静的ページ css_PHP チュートリアル

/i';

If(preg_match_all($pattern, $content, $matches)) {
$data['img'] = $matches[2]
; }

$pattern = '/url(('|"|s)(.*?)1)/i';
if(preg_match_all($pattern, $content, $matches)) {
$data['src'] = $matches[2]; }
}

$data を返します。 }

関数 vardump($obj) {
エコー '

';
プリント_r($obj);
エコー '

'; }
?>

CSS、JS、IMG、その他のリソースを保存するページ save.php のコードは次のとおりです:

コードをコピーします

コードは次のとおりです:

/*
* フルート
* 2014/03/31
*/

if(isset($_POST['url']) && isset($_POST['プロジェクト']) && isset($_POST['ドメイン'])) {
抽出($_POST);
$url = preg_replace('/?.*$/', '', $url);
$file = $url;
$arr =explode('/', $file);
$length = sizeof($arr);
$filename = $arr[$length - 1];
$root = $プロジェクト;
$dir = $root;

if($domain == 'http') {
   $dir = $root.'/http';
   if(!is_dir($dir)) mkdir($dir, 0777);
} その他 {
   $file = $domain.'/'.$url;
   for($i = 0; $i     if(!emptyempty($arr[$i])) {
     $dir .= '/'.$arr[$i];
     if(!is_dir($dir)) mkdir($dir, 0777);
    }
   }
}
if(!file_exists($dir.'/'.$filename) || filesize($dir.'/'.$filename) == 0) {
   $content = file_get_contents($file);
   file_put_contents($dir.'/'.$filename, $content);
}
}
?>

使用方法:

1. インデックスを開く、タイトル名と取得する必要があるネットワーク址、ネットワーク址は必ず文件名结尾、index.html である必要があります。

2. 点Get按钮，現在の页面すべてのcss、js、img等のソース列表を取得；

3. 点击css链接会はcssファイル内の背景ソース画像を取得し、列表の後ろに追加します;

4. 点击すべて保存列表内のすべての文書を即座に保存し、相対経路を生成します;

5. ネットワーク上に http プログラムファイルがある場合、会は http ファイルの下に直接存在します;

6. Get と Save は失敗することがありますが、一度試してみると問題ありません。

ここで説明されている大家向けの php プログラムの設計が役立つことを望みます。

http://www.bkjia.com/PHPjc/932075.html

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：PHP 更新後に変更された行番号を取得する方法 mysql、mysql 行番号_PHP チュートリアル次の記事：PHP 更新後に変更された行番号を取得する方法 mysql、mysql 行番号_PHP チュートリアル

続きを見る

PHP で静的ページを収集し、ページを保存する方法 css、img、js、静的ページ css_PHP チュートリアル

PHPで静的ページを収集し、ページCSS、IMG、JS、静的ページCSSを保存する方法

ウェブグラバー

URL

リスト

関連記事