首頁  >  文章  >  後端開發  >  网页爬虫 - PHP 延迟执行的问题?

网页爬虫 - PHP 延迟执行的问题?

WBOY
WBOY原創
2016-06-06 20:35:411341瀏覽

去网上查了,首先是sleep系列(sleep/usleep/nanosleep/time_sleep_until)的函数,首先这些函数有个问题,sleep是当前进程挂起,比如:

<code>echo time();
sleep(10);
echo time();
</code>

其实是【等了10秒】之后,【再同时】显示两个时间戳,时间戳之间相差10秒。

而我想要的效果是先显示第一个时间戳,等10秒,再显示第二个时间戳。

于是:

我想要用无限循环,然后判断当前时间与预存时间之间的差值来break出当前的死循环。比如:

<code>for(100遍){
//一些操作
$start = time();
while(true){
if(time() - $start == 1)break;
}
}
</code>

意思for循环每执行一次,末尾都会进入死循环,然后隔了1秒跳出死循环,继续下一次for循环。
但是,但是,居然是死循环!!!

后来试了下:

<code>while(true){
echo time();
}
</code>

居然不变!!!而 echo 出 date('s') 是变的!!!

所以想问:

1、如果说需要满足延迟执行的需求,不要sleep,不要线程,单纯就是暂停下再执行(其实我是做的爬虫,频率高了会被302),除了上面死循环的方式还有其它方式吗?(不要 AJAX,仅是 PHP 端)

2、为什么那个 time() 不变?

回复内容:

去网上查了,首先是sleep系列(sleep/usleep/nanosleep/time_sleep_until)的函数,首先这些函数有个问题,sleep是当前进程挂起,比如:

<code>echo time();
sleep(10);
echo time();
</code>

其实是【等了10秒】之后,【再同时】显示两个时间戳,时间戳之间相差10秒。

而我想要的效果是先显示第一个时间戳,等10秒,再显示第二个时间戳。

于是:

我想要用无限循环,然后判断当前时间与预存时间之间的差值来break出当前的死循环。比如:

<code>for(100遍){
//一些操作
$start = time();
while(true){
if(time() - $start == 1)break;
}
}
</code>

意思for循环每执行一次,末尾都会进入死循环,然后隔了1秒跳出死循环,继续下一次for循环。
但是,但是,居然是死循环!!!

后来试了下:

<code>while(true){
echo time();
}
</code>

居然不变!!!而 echo 出 date('s') 是变的!!!

所以想问:

1、如果说需要满足延迟执行的需求,不要sleep,不要线程,单纯就是暂停下再执行(其实我是做的爬虫,频率高了会被302),除了上面死循环的方式还有其它方式吗?(不要 AJAX,仅是 PHP 端)

2、为什么那个 time() 不变?

  1. sleep确实让程序暂停了,毕竟你得到的两个时间戳相差了10秒,但为啥是10s后一起显示出来呢?因为第一次输出的内容 还在buffer里,关闭输出缓存即可看到你想要的效果 ob_end_flush();

  2. 这样的循环,1秒内能输出几十万上百万次时间,同一秒内当然都一样,1s之后肯定会变。

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn