本文主要介紹如何使用IKAnalyzer分詞器自訂擴充字典,希望大家可以耐心學習。
下載IKAnalyzer完整分發包後,IK Analyzer安裝包包含:
1. 《IKAnalyzer中文分詞器V2012使用手冊》
2. IKAnalyzer2012.jar(主jar包)
3 . IKAnalyzer.cfg.xml(分詞器擴充設定檔)
4. stopword.dic(停止字典)
5. LICENSE.TXT ; NOTICE.TXT (apache版權申明)
它的安裝部署十分簡單,將IKAnalyzer2012.jar 部署於專案的lib 目錄中;
IKAnalyzer.cfg.xml 與stopword.dic 檔案放置在class 根目錄(對於web 項目,通常是
WEB-INF/classes目錄,同hibernate、log4j等設定檔相同)下即可。
要擴充自訂字典,開啟IKAnalyzer.cfg.xml
#將擴充字典的註解去掉。
同時在class根目錄,即src資料夾下自己新建ext.dic檔案。建置好之後用Notepad 軟體開啟ext.dic。
相關推薦:
以上是如何使用IKAnalyzer分詞器自訂擴充詞典的詳細內容。更多資訊請關注PHP中文網其他相關文章!