Nginx+PHP-CGI(php-fpm) 的Web环境,突然发现系统负载上升,top 查看后发现很多 php-cgi 进程 CPU 使用率接近100%.

找其中一个 CPU 100% 的 php-cgi 进程的 PID,用strace -p 10747跟踪,结果发现以下结果:

select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 

poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 

原因是:file_get_contents的目标网站如果反应过慢,file_get_contents就会一直卡在那里不会超时,我们知道php.ini 里面max_execution_time 可以设置 PHP 脚本的最大执行时间,但是,在 php-cgi(php-fpm) 中,该参数不会起效,真正能够控制 PHP 脚本最大执行时间的是 php-fpm.conf 配置文件中的以下参数:

The timeout (in seconds) for serving a single request after which the worker process will be terminated   

Should be used when 'max_execution_time' ini option does not stop script execution for some reason   

'0s' means 'off'   


默认值为 0 秒,也就是说,PHP 脚本会一直执行下去,这样,当所有的 php-cgi 进程都卡在 file_get_contents() 函数时,这台 Nginx+PHP 的 WebServer 已经无法再处理新的 PHP 请求了,Nginx 将给用户返回"502 Bad Gateway",修改该参数,设置一个 PHP 脚本最大执行时间是必要的,但是,治标不治本,例如改成 30s,如果发生 file_get_contents() 获取网页内容较慢的情况,这就意味着 150 个 php-cgi 进程,每秒钟只能处理 5 个请求,WebServer 同样很难避免"502 Bad Gateway".


function _file_get_content($str) {  
$ctx = stream_context_create(array(    
   'http' => array(    
   'timeout' => 10 //设置一个超时时间,单位为秒    
   )   //开源代码phprm.com 
return file_get_contents($str, 0, $ctx);    

如此用_file_get_content代替直接使用file_get_contents 问题解决.



