在一個txt文檔中有2000w行數據,數據的格式如下
行屍走肉_Mother
金蟬脫殼_Smile
霸王別姬_Love
逍遙法外_Eternity
.......
八仙過海
.......
八仙過海逍遙法外_Eternity_Destiny
請問如何快速檢索出成語或英文單詞,麻煩請給我演算法,謝謝大牛們
回覆內容:
行屍走肉_Mother
金蟬脫殼_Smile霸王別姬_Love
逍遙法外_Eternity
.......
逍遙法外_Eternity
.......
八仙過海🎜逍遙法外_Eternity🎜.......🎜八仙過海🎜_Destiny🎜 🎜請問如何快速檢索出成語或英文單詞,麻煩請給我演算法,謝謝大牛們🎜 🎜 🎜你的目的到底是要確定某個成語/英文存在不存在還是要計算這個成語/單字出現的次數? 🎜我以為不論什麼方法,最大的可能性就是把全文都要過一遍。如果你這個檢索的頻率很高,這2000萬個資料放到記憶體中再索引儲存下會最快,如果只運行一次,那麼最快的時間就是把文件都讀一遍的時間(計算出現次數)。 🎜 🎜 🎜搭一個 solr,建立索引,這樣搜尋效率提升很大🎜