>  기사  >  백엔드 개발  >  2천만 줄의 텍스트 데이터를 검색하는 방법

2천만 줄의 텍스트 데이터를 검색하는 방법

WBOY
WBOY원래의
2016-08-04 09:19:11980검색

1개의 txt 문서에 2천만 행의 데이터가 있습니다.
워킹데드_마더
탈출_미소
후궁_사랑
살인_영원탈출
.. .. ...
팔선도해_운명

숙어나 영어단어를 어떻게 빨리 검색할 수 있나요? 알고리즘 알려주세요, 감사합니다

답글 내용:

1개의 txt 문서에 2천만 행의 데이터가 있습니다.
워킹데드_마더
탈출_미소
후궁_사랑
살인_영원탈출
.. .. ...
팔선도해_운명

숙어나 영어단어를 어떻게 빨리 검색할 수 있나요? 알고리즘 알려주세요, 감사합니다

특정 관용구/단어가 영어에 존재하는지 확인하려는 목적인가요, 아니면 이 관용구/단어가 나타나는 횟수를 세는 것이 목적인가요?
어떤 방법이든 가장 큰 가능성은 본문 전체를 읽는 것이라고 생각합니다. 검색 빈도가 매우 높을 경우 2천만 개의 데이터를 메모리에 넣은 다음 인덱싱하여 저장하는 것이 가장 빠릅니다. 한 번만 실행하는 경우 가장 빠른 시간은 모든 파일을 읽는 시간입니다( 발생 횟수를 계산합니다).

Solr를 구축하고 인덱스를 생성하면 검색 효율성이 크게 향상됩니다

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.