首页  >  文章  >  后端开发  >  php爬虫抓取的链接怎么存储成队列?

php爬虫抓取的链接怎么存储成队列?

WBOY
WBOY原创
2016-06-06 20:27:531010浏览

扩展链接函数写完后,把链接存储成队列的函数怎么写呢?

<code>  //扩展链接函数
  public function extractLink($page){
    $matches=array();
    $pat="#href=\"(http://xxxx/yyy/zzz.php\?id=\d+$)\"# i";
    preg_match_all($pat,$page,$matches,PREG_PATTERN_ORDER);
      for($i=0;$i<count($matches[0]);$i++){
        echo $matches[0][$i];
        echo "\n";
      }
  }      
</code>

有个视频上说链接库的功能包括:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
但是说到这里视频有问题,后面内容就没有了。

回复内容:

扩展链接函数写完后,把链接存储成队列的函数怎么写呢?

<code>  //扩展链接函数
  public function extractLink($page){
    $matches=array();
    $pat="#href=\"(http://xxxx/yyy/zzz.php\?id=\d+$)\"# i";
    preg_match_all($pat,$page,$matches,PREG_PATTERN_ORDER);
      for($i=0;$i<count($matches[0]);$i++){
        echo $matches[0][$i];
        echo "\n";
      }
  }      
</code>

有个视频上说链接库的功能包括:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
但是说到这里视频有问题,后面内容就没有了。

什么视频?什么教程?你在说什么?

队列不就是存成一个数组,然后array_shift, array_push么

可以试试beanstalk

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn