<?php header('Content-Type:text/html;charset=utf-8'); /** * 一个用于抓去图片的类 */ class download_image { public $_save_path = NULL; //图片保存路劲 public $_limit_size = NULL; //图片限制大小 public static $_img_url_old = array(); //存储已抓取过的图片链接地址 public static $_a_page_url = array(); //存储抓取过的页面 public function __construct( $_save_path, $_limit_size) { $this->_save_path = $_save_path; $this->_limit_size = $_limit_size; } public function get_all_page_image( $site_url ) { if ( $site_url == '' ) { return false; } if ( ! in_array( $site_url, self::$_a_page_url ) ) { //判断当前页面是否抓取过 self::$_a_page_url[] = $site_url; //将超链接存入静态数组中 } else { return; //若抓取过则跳出 }
1.找到一个页面
2.正则过滤所有的img
3.正则过滤出所有的src的属性
4.获取链接信息,写入文件 file_get_contents(), file_put_contents()
5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)
本站所有资源均由网友贡献或各大下载网站转载。请自行检查软件的完整性!本站所有资源仅供学习参考。请不要将它们用于商业目的。否则,一切后果由您负责!如有侵权,请联系我们删除。联系方式:admin@php.cn
相关文章
02Dec2019
“php”抓取远程图片到本地保存的方法是:首先判断图片路径是否为空,如果不为空则进一步执行,接着获取图片信息大小、图片路径后缀名,然后计算图片源码大小,每次实现写入1k,直到获取到全部数据即可。
17Oct2024
PHP 中的网页抓取:预览给定 URL 您的目标是使用 PHP 从用户提供的网页中提取特定元素。在这种情况下,您的目标是检索页面的标题、徽标图像以及简短的文本或描述。推荐一个应用程序
19Dec2024
在 PHP 中测试 URL 404 的简单方法发现您的代码由于 URL 返回 404 而遇到问题,这是 Web 中的一个常见痛点...
21Nov2024
解决 UnsatisfiedLinkError: Can't Find Dependent Libraries in JNI Projects当开发 Java Native Interface (JNI) 项目时,您可能...
30Oct2019
phpmyadmin不显示登录页面解决方法:找到并打开phpMyAdmin\libraries\plugins\auth\AuthenticationCookie.class.php文件,将其中关于登录页面代码中的两处hide删除即可。