帝國cms怎麼收集資訊?
帝國cms是我們用得比較多得PHP的建站系統,在建站過程中,如果自己沒有資訊來源,只能靠手工不斷的重複copy和粘貼,這樣費時費力,於是我們就要使用帝國cms自帶的採集功能來完成資訊的輸入。為了深入了解帝國cms採集功能,以下我們以「新浪各地新聞」專欄為例來進行實戰採集。
一、增加採集節點
1、新增節點:
2、選擇增加採集的欄位:
3、進入增加節點表單:
4、在節點名稱框裡取個名字,然後把要採集的新浪各地新聞列表地址copy過來:
5、下來發現好多選項,如「採集頁面地址方式二,內容頁地址前綴...」先不要理他,後面再一一詳解,直接拉到「資訊連結區域正規」這裡:
6、這裡是設定採集的清單資訊連結區域正則,我們點擊查看新浪各地新聞清單「原始檔案」:
7、將原始檔案程式碼copy到Dreamweaver裡,在Dreamweaver裡選定要收集的資訊連結區域:
8、切換到Dreamweaver程式碼方式,
就是訊息連結區:
9、得到資訊連結區域正規:
10、得到資訊頁連結正規則:
11、注意:如果資訊頁連結是相對位址,例如,那麼「內容頁位址前綴」要加網域:
##12、現在要收集內容頁的標題和內容:
#13、查看新聞頁“來源檔案”,找title標籤:
14、取得標題正規: 15、這裡是要採集的內容區域:######### ######16、取得新聞內容正規:###############(注意:新聞內容正規裡的d_id='*' 用了通配符,因為每一篇新聞的d_id值是不同的,所以可以用*來代替它,「*」可以代替任意字元。)######17、點擊提交按鈕就完成了整個採集節點:####### ####### ######二、預覽採集節點是否正確######1、提交按鈕後返回管理節點:############2、點選「預覽」擷取,進入節點預覽結果:
3、擷取內容頁清單:
4、採集內容頁頁面:
#三、採集
1、預覽採集節點無誤後,然後返回“管理節點”,點擊“開始採集”連結就開始進行採集:
2、系統正在採集中:
3、採集完後顯示本地臨時入庫的信息,這時可以修改臨時入庫的資訊或刪除:
##4、修改資訊頁面如圖: 5、對採集的資訊進行審核併入庫,點選「入庫全部資訊按鈕」: 6、確定操作: 7、資訊入庫完畢提示: 資訊入庫完畢後下來點選」管理資訊「: 我們可以看到剛剛收集入庫的新聞資訊: 最後到「資料更新」刷新首頁、欄位、和內容頁就可以完成網站的資訊收集了。以上是帝國cms怎麼蒐集訊息的詳細內容。更多資訊請關注PHP中文網其他相關文章!