lucene是一個公用的全文索引元件,它的目標是把各種格式的資料轉換成lucene特有的索引檔案格式,這樣才能透過lucene的高速檢索機制進行全文檢索。
你的資料來源可以是關係資料庫,可以是word、execl、txt文檔,可以是html網頁,對於這些資料來源,你必須將它們內部的資料讀取出來,並且封裝成lucene的document實例,之後請lucene幫你建構索引。
舉個例子:你的有一個用戶資料庫,裡面儲存了幾十萬的用戶信息,你現在要對這個資料庫進行全文索引,那麼你要做的事情是:
1.寫一段傳統的JDBC程序,講每條的使用者資訊從資料庫讀取出來
2.針對每個使用者記錄,建立一個lucene document
Document doc = new Document();
並根據你的需要,將使用者資訊的各個欄位對應luncene document中的field 加,如:
doc.add(new Field("NAME","USERNAME", Field.Store.YES,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field.Index,Field. .UN_TOKENIZED));
然後將該條doc加入索引中, 如:luceneWriter.addDocument(doc);
這樣就建立了lucene的索引庫
3.編寫索引庫的搜尋程式(看lucene文件),透過對lucene的索引庫的查找,你可以快速找到對應記錄的ID
4.透過ID到資料庫中尋找相關記錄
以上是怎麼用java的lucene對資料庫進行檢索的詳細內容。更多資訊請關注PHP中文網其他相關文章!