cari
RumahPerpustakaan PHPPerpustakaan lainperpustakaan merangkak laman web php
php laman web merangkak perpustakaan
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

menyokong tapak web merangkak dan merangkak Ia adalah projek sumber terbuka sebelah pelayan berdasarkan PHP. Ia membolehkan pembangun PHP memproses kandungan dokumen DOM dengan mudah, seperti mendapatkan maklumat tajuk laman web. Apa yang lebih menarik ialah ia menggunakan idea jQuery Anda boleh memproses kandungan halaman sama seperti menggunakan jQuery untuk mendapatkan maklumat halaman yang anda inginkan.

Penafian

Semua sumber di laman web ini disumbangkan oleh netizen atau dicetak semula oleh tapak muat turun utama. Sila semak integriti perisian itu sendiri! Semua sumber di laman web ini adalah untuk rujukan pembelajaran sahaja. Tolong jangan gunakannya untuk tujuan komersial. Jika tidak, anda akan bertanggungjawab untuk semua akibat! Jika terdapat sebarang pelanggaran, sila hubungi kami untuk memadamkannya. Maklumat hubungan: admin@php.cn

Artikel Berkaitan

Apakah kelebihan membina laman web dalam phpApakah kelebihan membina laman web dalam php

27Apr2022

Kelebihannya ialah: 1. Cross-platform, boleh digunakan pada windows, Linux dan platform lain 2. Sintaks mudah, perpustakaan kelas kaya disediakan, dan kos pembangunan yang rendah 3. Persekitaran berjalan mudah dibina, dan terdapat a pelbagai pakej persekitaran bersepadu PHP yang boleh digunakan pembinaan persekitaran seperti Fool 4. Menyokong pelbagai kaedah pautan pangkalan data 5. Terdapat komuniti lengkap yang boleh memberikan bantuan teknikal, dsb.

Mari kita bincangkan tentang cara menggunakan perpustakaan sumber terbuka pihak ketiga untuk melaksanakan fungsi merangkak tapak web dalam nodMari kita bincangkan tentang cara menggunakan perpustakaan sumber terbuka pihak ketiga untuk melaksanakan fungsi merangkak tapak web dalam nod

17Dec2021

Artikel ini akan memperkenalkan kepada anda cara mudah melaksanakan fungsi merangkak tapak web dalam nod dengan bantuan perpustakaan sumber terbuka pihak ketiga, saya harap ia akan membantu anda!

Adakah laman web php Cina laman web rasmi?Adakah laman web php Cina laman web rasmi?

20Sep2022

Laman web PHP Cina ialah laman web rasmi Nama domain tapak web ialah php.cn Ia bergabung dengan Suzhou Yuedongguangbiao Network Technology Co., Ltd. Ia adalah platform kebajikan awam dan pembelajaran dalam talian PHP , bahan PHP dan komuniti Soal Jawab PHP dsb., ia juga termasuk kursus PHP premium dengan bayaran, dan kelas langsung dalam talian akan diadakan secara kerap, yang sesuai untuk pelajar dengan asas yang berbeza.

Apakah kaedah untuk merangkak halaman web dengan PHP?Apakah kaedah untuk merangkak halaman web dengan PHP?

02Sep2021

Kaedah untuk PHP merangkak halaman web ialah: 1. fungsi fail() 2. fungsi file_get_contents() 3. fopen()->fread()->mod fclose; .

Bagaimanakah Saya Boleh Log masuk ke Laman Web Menggunakan Perpustakaan Permintaan Python?Bagaimanakah Saya Boleh Log masuk ke Laman Web Menggunakan Perpustakaan Permintaan Python?

09Dec2024

Cara "Log Masuk" ke Laman Web Menggunakan Modul Permintaan PythonMelog masuk ke tapak web menggunakan modul Permintaan Python memerlukan pemahaman...

Bagaimana untuk merangkak hanya pengepala halaman web dalam phpBagaimana untuk merangkak hanya pengepala halaman web dalam php

14Oct2021

Kaedah untuk php menangkap hanya pengepala halaman web: 1. Gunakan fungsi get_headers() 2. Gunakan kaedah http_response_header 3. Gunakan fungsi stream_get_meta_data() 4. Gunakan php CURL untuk mendapatkan pengepala halaman web.

See all articles