집 > 기사 > 백엔드 개발 > 2천만 줄의 텍스트 데이터를 검색하는 방법

2천만 줄의 텍스트 데이터를 검색하는 방법

WBOY원래의: 2016-08-04 09:19:11980검색

1개의 txt 문서에 2천만 행의 데이터가 있습니다.
워킹데드_마더
탈출_미소
후궁_사랑
살인_영원탈출
.. .. ...
팔선도해_운명

숙어나 영어단어를 어떻게 빨리 검색할 수 있나요? 알고리즘 알려주세요, 감사합니다

답글 내용:

1개의 txt 문서에 2천만 행의 데이터가 있습니다.
워킹데드_마더
탈출_미소
후궁_사랑
살인_영원탈출
.. .. ...
팔선도해_운명

숙어나 영어단어를 어떻게 빨리 검색할 수 있나요? 알고리즘 알려주세요, 감사합니다

특정 관용구/단어가 영어에 존재하는지 확인하려는 목적인가요, 아니면 이 관용구/단어가 나타나는 횟수를 세는 것이 목적인가요?
어떤 방법이든 가장 큰 가능성은 본문 전체를 읽는 것이라고 생각합니다. 검색 빈도가 매우 높을 경우 2천만 개의 데이터를 메모리에 넣은 다음 인덱싱하여 저장하는 것이 가장 빠릅니다. 한 번만 실행하는 경우 가장 빠른 시간은 모든 파일을 읽는 시간입니다( 발생 횟수를 계산합니다).

Solr를 구축하고 인덱스를 생성하면 검색 효율성이 크게 향상됩니다

성명：

이전 기사：IP의 65535 포트가 열려 있는지 동시에 검사하기 위해 PHP 스울을 확장하는 방법에 대한 조언을 요청합니다.다음 기사：IP의 65535 포트가 열려 있는지 동시에 검사하기 위해 PHP 스울을 확장하는 방법에 대한 조언을 요청합니다.

2천만 줄의 텍스트 데이터를 검색하는 방법

답글 내용:

관련 기사