搜索
首页php教程php手册php多线程thread开发与应用的例子

php多线程的使用,首先需要PHP5.3以上版本,并安装pthreads PHP扩展,可以使PHP真正的支持多线程,扩展如何安装请自行百度.

PHP扩展下载:https://github.com/krakjoe/pthreads

PHP手册文档:http://php.net/manual/zh/book.pthreads.php

在安装好扩展之后,就可以运用多线程了,下面贴个通过搜索结果抓取百度网盘内容的代码:

<?php
include &#39;include/CurlLoad.class.php&#39;; // 引入读取库
/** 
 * 多线程抓取内容
 * @param array $url 待抓取URL列表集合
 * @return 成功返回指定内容,失败返回NULL
 */
function vget($url) {
    $ret = BaiduSRLinksGet($url, 1); // 获取结果列表地址
    if ($ret != null) {
        if (array_key_exists("links", $ret)) {
            $infos = array();
            $number = count($ret[&#39;links&#39;]);
            for ($i = 0; $i < $number; $i++) { //循环创建线程对象
                $thread_array[$i] = new baidu_thread_run($ret[&#39;links&#39;][$i]);
                $thread_array[$i]->start();
            }
            foreach ($thread_array as $thread_array_key => $thread_array_value) { //检查线程是否执行结束
                while ($thread_array[$thread_array_key]->isRunning()) {
                    usleep(10);
                }
                if ($thread_array[$thread_array_key]->join()) { //如果执行结束,取出结果
                    $temp = $thread_array[$thread_array_key]->data;
                    if ($temp != null) $infos[&#39;res&#39;][] = $temp;
                }
            }
            $infos[&#39;pages&#39;] = $ret[&#39;pages&#39;];
            $infos[&#39;status&#39;] = "1";
        } else $infos = null;
    } else $infos = null;
    return $infos;
}
/** 
 * 获取百度搜索结果列表URL
 *
 * @param string $url
 *         搜索结果页URL
 * @param int $format
 *         默认$format=0,获取默认地址;$format=1获取跳转后真实地址
 * @return NULL multitype:array()
 */
function BaiduSRLinksGet($url, $format = 0) {
    $html = CurlLoad::HtmlGet($url); // 获取页面
    if ($html == null) return null;
    try {
        preg_match_all("/"url":"( ? < links > . *) "}/", $html, $rets); // 搜索结果链接筛选
        if (!array_key_exists(&#39;links&#39;, $rets)) // 如果数组中不包含Links键名,表示获取失败
        return null;
        $ret = array();
        if ($format == 1) {
            $number = count($rets[&#39;links&#39;]);
            for ($i = 0; $i < $number; $i++) {
                $headr_temp = CurlLoad::Get_Headers($rets[&#39;links&#39;][$i], 1); // 通过headr获取真实地址
                if (array_key_exists("Location", $headr_temp)) $ret[&#39;links&#39;][$i] = $headr_temp[&#39;Location&#39;];
                else $ret[&#39;links&#39;] = $rets[&#39;links&#39;];
            }
        } else $ret[&#39;links&#39;] = $rets[&#39;links&#39;];
        preg_match_all(&#39;/href="?/s?wd=site%3Apan.baidu.com%20(?<url>.+?)&ie=utf-8">/&#39;, $html, $out);
        unset($out[&#39;url&#39;][0]);
        $number = count($out[&#39;url&#39;]);
        for ($i = 1; $i < $number; $i++) {
            preg_match_all(&#39;/&pn=(.*)/&#39;, $out[&#39;url&#39;][$i], $temp);
            $ret[&#39;pages&#39;][$temp[1][0] / 10] = base64_encode($out[&#39;url&#39;][$i]);
        }
        return $ret;
    }
    catch(Exception $e) {
        WriteLog($e);
        return null;
    }
}
/** 
 * 百度网盘资源信息获取
 *
 * @param string $url
 *         网盘资源页URL
 * @return NULL array
 */
function PanInfoGet($url) {
    $html = CurlLoad::HtmlGet($url); // 获取页面
    if ($html == null) return null;
    try {
        if (preg_match_all("/文件名:(?<name>.*) 文件大小:(?<size>.*) 分享者:(?<user>.*) 分享时间:(?<date>.*) 下载次数:(?<number>[0-9]+)/", $html, $ret) == 0) return null;
        $rets[&#39;name&#39;] = $ret[&#39;name&#39;][0];
        $rets[&#39;size&#39;] = $ret[&#39;size&#39;][0];
        $rets[&#39;user&#39;] = $ret[&#39;user&#39;][0];
        $rets[&#39;date&#39;] = $ret[&#39;date&#39;][0];
        $rets[&#39;number&#39;] = $ret[&#39;number&#39;][0];
        $rets[&#39;link&#39;] = $url;
        return $rets;
    }
    catch(Exception $e) {
        WriteLog($e);
        return null;
    }
}
function WriteLog($str) {
    $file = fopen("../error.log", "a+");
    fwrite($file, "Warning:" . date("Y/m/d H:i:s") . ":" . $str . "rn");
    fclose($file);
}
/** 
 * 多线程抓取对象
 * @author MuXi
 *
 */
class baidu_thread_run extends Thread {
    public $url;
    public $data;
    public function __construct($url) {
        $this->url = $url;
    }
    public function run() {
        if (($url = $this->url)) {
            $this->data = PanInfoGet($url); //线程执行方法
            
        }
    }
}
?>


声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中