首頁  >  文章  >  搜尋引擎檢索的順序是什麼

搜尋引擎檢索的順序是什麼

coldplay.xixi
coldplay.xixi原創
2020-10-29 15:47:408501瀏覽

搜尋引擎檢索的順序:1、從網路上抓取網頁;2、建立索引資料庫;3、在索引資料庫中搜尋排序;4、對搜尋結果進行處理與排序。

搜尋引擎檢索的順序是什麼

搜尋引擎檢索的順序:

 搜尋引擎是指根據一定的策略,運用特定的電腦程式蒐集網路上的信息,在組織和處理資訊後,提供使用者檢索服務的系統。搜尋引擎並不是真正的互聯網,它搜尋的其實是預先整理好的網頁索引資料庫。真正意義上的搜尋引擎,通常指的是收集了互聯網上幾千萬到幾十億個網頁並對我那個也中的每一個字(即關鍵字)進行索引。建立索引資料庫的全文搜尋引擎。現在的搜尋引擎已普遍使用超鏈分析技術,除了分析索引網頁本身的內容,還分析索引所有指向該網頁的連結的URL、Anchor、Text,甚至連結周圍的文字。所以,有時候,即使某個網頁A中並沒有出現某個詞,比如

“信息檢索”,但如果有網頁B用鏈接“信息檢索”指向這個網頁A,那麼用戶搜索“資訊檢索”時也能找到網頁A。而且,如果有越多的網頁的「資訊檢索」連結指向網頁A,那麼網頁A在使用者搜尋「資訊檢索」時也會被認為更相關,排序也會越靠前。

  搜尋引擎的原理,可分為四個步驟:從網路抓取網頁、建立索引資料庫、在索引資料庫中搜尋排序、處理搜尋結果和排序。

  (1)、從互聯網上抓取網頁:利用能夠從互聯網上自動收集網頁的蜘蛛系統程序,自動訪問互聯網,並沿著任何網頁中所有URL爬到其他網頁,重複這個過程,並把爬過的所有網頁收集回來。

  (2)、建立索引資料庫:由分析索引系統程式對收集回來的網頁進行分析,擷取相關網頁資訊(包括網頁所在URL、編碼類型、頁面內容包含的關鍵字、關鍵字位置、產生時間、大小、與其他網頁的連結關係等),並根據一定的相關度演算法進行大量的複雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵字的相關度(或重要性),然後利用這些相關資訊建立網頁索引資料庫。

  (3)、在索引資料庫中搜尋排序:當使用者輸入關鍵字後,由搜尋系統程式從網頁索引資料庫中找到符合該關鍵字的所有相關網頁。因為所用相關網頁針對此關鍵字的相關度早已計算好,所以只要依照現成的相關數值排序,相關度越高,排名越前。最後由頁面產生系統將搜尋結果的連結位址和頁面內容摘要等內容組織起來回傳給使用者。

  (4)、對搜尋結果進行處理排序:所有相關網頁針對該關鍵字的相關資訊在索引庫中都有記錄,只需綜合相關資訊和網頁層級形成相關數值度,然後進行排序,相關度越高,排名越前。最後由頁面產生系統將搜尋結果的連結位址和頁面內容摘要等內容組織起來回傳給使用者。

相關免費推薦:#程式設計影片課程

以上是搜尋引擎檢索的順序是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn