ホームページ  >  記事  >  バックエンド開発  >  php爬虫抓取的链接怎么存储成队列?

php爬虫抓取的链接怎么存储成队列?

WBOY
WBOYオリジナル
2016-06-06 20:27:531009ブラウズ

扩展链接函数写完后,把链接存储成队列的函数怎么写呢?

<code>  //扩展链接函数
  public function extractLink($page){
    $matches=array();
    $pat="#href=\"(http://xxxx/yyy/zzz.php\?id=\d+$)\"# i";
    preg_match_all($pat,$page,$matches,PREG_PATTERN_ORDER);
      for($i=0;$i<count echo></count></code>

有个视频上说链接库的功能包括:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
但是说到这里视频有问题,后面内容就没有了。

回复内容:

扩展链接函数写完后,把链接存储成队列的函数怎么写呢?

<code>  //扩展链接函数
  public function extractLink($page){
    $matches=array();
    $pat="#href=\"(http://xxxx/yyy/zzz.php\?id=\d+$)\"# i";
    preg_match_all($pat,$page,$matches,PREG_PATTERN_ORDER);
      for($i=0;$i<count echo></count></code>

有个视频上说链接库的功能包括:1、 存储链接;2、 对链接去重;3、对链接设置优先级。
实践方案有:1、保存在数据库;2、redis;3、内存集合;4、队列。
但是说到这里视频有问题,后面内容就没有了。

什么视频?什么教程?你在说什么?

队列不就是存成一个数组,然后array_shift, array_push么

可以试试beanstalk

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。