搜索
首页PHP 库Other libraries网页抓取图片的PHP类
网页抓取图片的PHP类
<?php
header('Content-Type:text/html;charset=utf-8');
/**
 * 一个用于抓去图片的类
 */
class download_image {
    public $_save_path = NULL; //图片保存路劲
    public $_limit_size = NULL; //图片限制大小
    public static $_img_url_old = array();  //存储已抓取过的图片链接地址
    public static $_a_page_url = array();    //存储抓取过的页面
    public function __construct( $_save_path, $_limit_size) {
        $this->_save_path = $_save_path;
        $this->_limit_size = $_limit_size;
    }
    public function get_all_page_image( $site_url ) {
        if ( $site_url == '' ) {
            return false;
        }
        if ( ! in_array( $site_url, self::$_a_page_url ) ) {  //判断当前页面是否抓取过
            self::$_a_page_url[] = $site_url;   //将超链接存入静态数组中
        } else {
            return;     //若抓取过则跳出
        }

1.找到一个页面

2.正则过滤所有的img

3.正则过滤出所有的src的属性

4.获取链接信息,写入文件 file_get_contents(), file_put_contents()

5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)


免责声明

本站所有资源均由网友贡献或各大下载网站转载。请自行检查软件的完整性!本站所有资源仅供学习参考。请不要将它们用于商业目的。否则,一切后果由您负责!如有侵权,请联系我们删除。联系方式:admin@php.cn

相关文章

php抓取远程图片到本地保存的方法php抓取远程图片到本地保存的方法

02Dec2019

“php”抓取远程图片到本地保存的方法是:首先判断图片路径是否为空,如果不为空则进一步执行,接着获取图片信息大小、图片路径后缀名,然后计算图片源码大小,每次实现写入1k,直到获取到全部数据即可。

如何有效处理 PHP 网页抓取过程中的 404 错误?如何有效处理 PHP 网页抓取过程中的 404 错误?

03Dec2024

如何有效处理 PHP 中的 404 错误在抓取网页时,遇到 404(未找到)错误可能会扰乱您的代码流程。为了避免这样的...

如何在 PHP 中使用网页抓取来预览给定的 URL?如何在 PHP 中使用网页抓取来预览给定的 URL?

17Oct2024

PHP 中的网页抓取:预览给定 URL 您的目标是使用 PHP 从用户提供的网页中提取特定元素。在这种情况下,您的目标是检索页面的标题、徽标图像以及简短的文本或描述。推荐一个应用程序

在网页抓取之前如何有效检查 PHP 中的 404 错误?在网页抓取之前如何有效检查 PHP 中的 404 错误?

19Dec2024

在 PHP 中测试 URL 404 的简单方法发现您的代码由于 URL 返回 404 而遇到问题,这是 Web 中的一个常见痛点...

为什么我的 JNI 项目找不到依赖库?为什么我的 JNI 项目找不到依赖库?

21Nov2024

解决 UnsatisfiedLinkError: Can't Find Dependent Libraries in JNI Projects当开发 Java Native Interface (JNI) 项目时,您可能...

phpmyadmin不显示登录页面phpmyadmin不显示登录页面

30Oct2019

​phpmyadmin不显示登录页面解决方法:找到并打开phpMyAdmin\libraries\plugins\auth\AuthenticationCookie.class.php文件,将其中关于登录页面代码中的两处hide删除即可。

See all articles