PHP执行采集任务，结果死机，但是每次执行一条却很快 -php教程-PHP中文網

首頁

後端開發

php教程

PHP执行采集任务，结果死机，但是每次执行一条却很快

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 pm 12:54 PM

dedecmsfunctionnbspphpurl

【求助】PHP执行采集任务，结果死机，但是每次执行一条却很快。
PHP执行采集任务，程序写的步骤是
1.先从数据库中提取出url，
2.php远程获取URL标题title，通过http下载远程网址。
3.下载完之后下载另外一个网站B的数据，http。
4.下载完之后再次下载另外一个站C的数据，http。
5.每条记录总共下载远程四个网站A、B、C、D的数据后更新数据表的对应记录，然后循环下一条记录。

结果的现象是：
如果刷新一次页面一次10条都一直在加载，但是却始终都没有完成一条（三个小时候过去了，一条都没有完成）。
但是如果每次只操作一条，却很快的就完成了。一直难以明白，代码都没有改过。

------解决方案--------------------
是否是php超时了或者内存满了？

是否打开error.log查看下错误日志呢？

写这种采集程序，最重要的是判断程序运行错误的时候怎么处理。
------解决方案--------------------
多数都是代码问题...没代码没真相
------解决方案--------------------
在每一个都写log入文件，看到哪一步停止了。
------解决方案--------------------

引用:

在每一个都写log入文件，看到哪一步停止了。

正解
------解决方案--------------------
你这个
一条也完不成的一次10条的代码
和
一条很快完成的一次一条的代码

到底有何不同之处?

------解决方案--------------------
哪里的服务器？先别解析一下DNS。

------解决方案--------------------
我是说siteA，也是本地的？先别采集。直接运行siteA的相应脚本，需要多少时间？
------解决方案--------------------
你没有给出具体的代码，不能给出具体的建议
不过就是给出了代码，也不一定有心情去看和测试
对此类应用提点我哥个人意见：
1、通常页面中都有返回到首页，返回到栏目之类的连接。
  应注意排除，否则极易造成死循环
2、页面采集程序应是单一的
  即运行一次，采集一个页面
3、采集控制程序用于调度页面采集程序
  可用 fsockopen 打开页面采集程序后即可返回，目标页url只作为参数传递给页面采集程序
  这样可就模拟了一个多进程系统
4、具体是实现时以数据库为中介，所有从页面中析出的url都入库（当然要排重）
  采集控制程序读取数据库，以决定是否继续采集和每次采集的规模
------解决方案--------------------

引用:

用的是dedecms的下载的类

换个类试试，不要用dedecms集成的。
网上找一下类似功能的function或者CLASS。
------解决方案--------------------

引用:

引用:引用:用的是dedecms的下载的类
换个类试试，不要用dedecms集成的。
网上找一下类似功能的function或者CLASS。

其实的discuz的curl 和 fsocket也不行，会被有的服务器判断出来是非正常访问。只有dede的那个类成功的最多。。其他的也试了，也是很慢！
……

内牛满面....师兄你成仙了啊～～

自己写个采集的curl 封装一下有多难哪...采集其实麻烦就麻烦在各种正则上的分析校对.
------解决方案--------------------
就是，二次开发没那么难。你到底要怎么样的功能？把URL和要求贴出来，帮你写一个function。
------解决方案--------------------
网络问题是影响采集速度的最主要原因。
你先ping一下，看看响应时间是多少。

别用dedecms的那个类，自己用curl写个，很简单的。
给每个请求设置timeout。别拿自己的pc机跑，找一台配置高的服务器去跑，开多个进程，把你的任务分类，这样可以提高好几倍的效率。
------解决方案--------------------

引用:

有的域名他指向的主机是不存在的

给出这些域名，是不是有头部跳转，或者去掉www看看。

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

PHP與Python：了解差異Apr 11, 2025 am 12:15 AM

PHP和Python各有優勢，選擇應基於項目需求。 1.PHP適合web開發，語法簡單，執行效率高。 2.Python適用於數據科學和機器學習，語法簡潔，庫豐富。

php：死亡還是簡單地適應？Apr 11, 2025 am 12:13 AM

PHP不是在消亡，而是在不斷適應和進化。 1)PHP從1994年起經歷多次版本迭代，適應新技術趨勢。 2)目前廣泛應用於電子商務、內容管理系統等領域。 3)PHP8引入JIT編譯器等功能，提升性能和現代化。 4)使用OPcache和遵循PSR-12標準可優化性能和代碼質量。

PHP的未來：改編和創新Apr 11, 2025 am 12:01 AM

PHP的未來將通過適應新技術趨勢和引入創新特性來實現：1)適應云計算、容器化和微服務架構，支持Docker和Kubernetes；2)引入JIT編譯器和枚舉類型，提升性能和數據處理效率；3)持續優化性能和推廣最佳實踐。

您什麼時候使用特質與PHP中的抽像類或接口？Apr 10, 2025 am 09:39 AM

在PHP中，trait適用於需要方法復用但不適合使用繼承的情況。 1)trait允許在類中復用方法，避免多重繼承複雜性。 2)使用trait時需注意方法衝突，可通過insteadof和as關鍵字解決。 3)應避免過度使用trait，保持其單一職責，以優化性能和提高代碼可維護性。

什麼是依賴性注入容器（DIC），為什麼在PHP中使用一個？Apr 10, 2025 am 09:38 AM

依賴注入容器（DIC）是一種管理和提供對象依賴關係的工具，用於PHP項目中。 DIC的主要好處包括：1.解耦，使組件獨立，代碼易維護和測試；2.靈活性，易替換或修改依賴關係；3.可測試性，方便注入mock對象進行單元測試。

與常規PHP陣列相比，解釋SPL SplfixedArray及其性能特徵。Apr 10, 2025 am 09:37 AM

SplFixedArray在PHP中是一種固定大小的數組，適用於需要高性能和低內存使用量的場景。 1)它在創建時需指定大小，避免動態調整帶來的開銷。 2)基於C語言數組，直接操作內存，訪問速度快。 3)適合大規模數據處理和內存敏感環境，但需謹慎使用，因其大小固定。

PHP如何安全地上載文件？Apr 10, 2025 am 09:37 AM

PHP通過$\_FILES變量處理文件上傳，確保安全性的方法包括：1.檢查上傳錯誤，2.驗證文件類型和大小，3.防止文件覆蓋，4.移動文件到永久存儲位置。

什麼是無效的合併操作員（??）和無效分配運算符（?? =）？Apr 10, 2025 am 09:33 AM

JavaScript中處理空值可以使用NullCoalescingOperator(??)和NullCoalescingAssignmentOperator(??=)。 1.??返回第一個非null或非undefined的操作數。 2.??=將變量賦值為右操作數的值，但前提是該變量為null或undefined。這些操作符簡化了代碼邏輯，提高了可讀性和性能。

See all articles