Redis는 문자열, 해시 테이블, 목록, 집합, 순서 집합 등 다양한 기능과 데이터 구조를 제공하는 고성능 NoSQL 데이터베이스입니다. 또한 Redis는 게시 및 구독, Lua 스크립트 및 트랜잭션과 같은 일부 고급 기능도 제공합니다. 그 중 Redis의 분산 검색 기능은 매우 실용적이며 많은 양의 데이터를 빠르게 검색하는 데 도움이 될 수 있습니다. 이 기사에서는 Redis가 분산 검색 기능을 구현하는 방법을 살펴보고 특정 코드 예제를 제공합니다.
1. Redis 분산 검색 기능 개요
Redis는 전체 텍스트 검색과 특정 속성 기반 검색이라는 두 가지 분산 검색 기능을 제공합니다. 여기서는 먼저 이 두 기능의 개념과 구현 방법을 살펴보겠습니다.
1. 전체 텍스트 검색
전체 텍스트 검색은 텍스트 데이터에서 특정 문자열을 검색하는 것을 의미합니다. Redis에서는 Redisearch 플러그인을 사용하여 전체 텍스트 검색 기능을 구현할 수 있습니다. Redisearch는 역색인을 사용하여 검색을 구현합니다. 즉, 먼저 각 문서를 용어로 분할한 다음 각 용어와 문서 번호 간의 매핑 관계를 설정하고 마지막으로 모든 용어에 대한 역색인 테이블을 생성합니다. 검색시에는 역색인표에서 조회하고자 하는 용어만 조회하시면 됩니다.
Redisearch는 검색 시 와일드카드 및 퍼지 검색을 지원하며 "AND", "OR" 등의 논리 연산도 지원합니다. 검색 결과는 특정 규칙에 따라 정렬되거나 결과의 일부만 반환되도록 지정할 수 있습니다.
2. 속성 기반 스캐닝
속성 기반 스캐닝은 여러 속성을 가진 데이터 컬렉션에서 하나 이상의 속성에 따라 조건을 충족하는 데이터를 필터링하는 것을 의미합니다. Redis에서는 RedisGears와 Redisearch를 사용하여 이 기능을 구현할 수 있습니다.
RedisGears는 Redis에서 유지 관리하는 플러그인으로 Redis 키-값 쌍을 스트림으로 변환하는 기능을 제공합니다. RedisGears를 사용하여 일부 스트림을 생성한 다음 Redisearch의 "FT.AGGREGATE" 명령을 사용하여 이러한 스트림을 집계할 수도 있습니다. 집계 후 데이터는 필터링 및 정렬될 수 있으며 Redis의 다른 데이터 구조로 출력되거나 네트워크를 통해 전송될 수도 있습니다.
2. Redis의 분산 검색 기능의 구체적인 구현
여기에서는 분산 검색 기능을 구현하기 위해 전체 텍스트 검색을 예로 들어 보겠습니다. redisearch-py를 Python 클라이언트로 사용하고 두 노드에서 Redis 인스턴스를 시뮬레이션합니다. 이 예에서는 두 Redis 인스턴스 각각에 인덱스를 생성하고 검색합니다.
1. 종속성 설치
redisearch-py 라이브러리 설치:
pip install redisearch
2. Redis 인스턴스 구축
먼저 두 개의 서로 다른 포트에서 두 개의 Redis 인스턴스를 시작해야 합니다. 여기서는 Redis의 공식 이미지를 사용하고 포트 매개변수를 수정하여 두 개의 인스턴스를 생성합니다.
$ docker run -d -p 6380:6379 redis
$ docker run -d -p 6381:6379 redis --port 6379
3 인덱스 생성
redisearch-py(redisearch-py Main)에서 RediSearch 개체를 사용합니다. 인터페이스)는 두 개의 전체 텍스트 인덱스를 생성합니다. 여기서는 "FT.CREATE" 명령을 사용했습니다.
from redisearch import Client, Query, TextField, NumericField
client1 = Client('index1', port=6380)
client2 = Client('index2', port=6381)
client1.create_index((TextField('title' , Weight=5.0), TextField('content')))
client2.create_index((TextField('title', Weight=5.0), TextField('content')))
여기서 두 개의 필드를 정의합니다. 그리고 내용은 각각. 그 중 제목의 가중치는 5.0이고, 내용의 가중치는 기본값인 1.0으로 제목이 더 중요함을 나타낸다. 이 두 필드를 사용하여 검색어를 일치시킬 수 있습니다.
4. 데이터 추가
후속 검색 작업을 용이하게 하기 위해 두 인덱스에 일부 데이터를 추가합니다. 여기서는 간단히 "FT.ADD" 명령을 사용하여 데이터를 추가합니다.
client1.redis.execute_command('FT.ADD', 'idx1', 'doc1', 1.0, 'FIELDS', 'title', 'this is a title', 'content', '여기에 일부 콘텐츠가 있습니다.')
client1.redis.execute_command('FT.ADD', 'idx1', 'doc2', 1.0, 'FIELDS', 'title', '제목이 중요함', 'content', 'content is not important')
client2.redis.execute_command('FT.ADD', 'idx2', 'doc1', 1.0, 'FIELDS', 'title', 'this is a title', 'content', '여기에 일부 콘텐츠가 있습니다.')
client2.redis.execute_command('FT.ADD', 'idx2', 'doc2', 1.0, 'FIELDS', 'title', '제목이 중요함', 'content', 'content is not important')
여기서는 두 개의 문서를 추가했습니다. 각 문서에는 제목과 내용이라는 두 개의 필드가 있습니다.
5. 데이터 검색
RediSearch 개체를 사용하여 검색 명령을 실행합니다. 여기서는 "FT.SEARCH" 명령을 사용하여 검색할 쿼리 문자열과 인덱스를 검색하고 지정합니다.
result1 = client1.search('content')
result2 = client2.search('content')
두 결과 세트가 두 개의 서로 다른 인덱스에서 나온 것을 볼 수 있습니다.
6. 결과 표시
마지막으로 Python의 pprint 라이브러리를 사용하여 결과를 인쇄합니다.
from pprint import pprint
pprint(result1)
pprint(result2)
실행 결과는 다음과 같습니다.
{'docs': [{'content': '여기에 일부 콘텐츠가 있습니다', 'title': '제목입니다', 'id': 'doc1'}], 'total_results': 1, 'cursor': 0, 'total_pages': 1}
{'docs': [{'content': '여기에 일부 콘텐츠가 있습니다', 'title': '제목입니다', 'id': 'doc1'}], 'total_results ': 1, 'cursor': 0, 'total_pages': 1}
두 검색 결과 모두 "여기에 일부 콘텐츠가 있습니다"라는 문서가 포함되어 있는 것을 볼 수 있습니다.
3. 요약
이 글에서는 Redis 분산 검색 기능을 소개하고 전체 텍스트 검색을 위한 코드 예제를 제공했습니다. 분산 검색을 구현할 때 Redisearch와 RedisGears라는 두 가지 플러그인을 사용하고 Redis용 클러스터를 구성해야 합니다.
Redis 분산 검색 기능은 대량의 데이터를 신속하게 검색하는 데 도움이 될 뿐만 아니라 단일 장애 지점을 방지하고 시스템 가용성을 향상시킵니다. 우리는 이 글을 공부함으로써 여러분이 Redis의 분산 검색 기능에 대해 더 깊이 이해하게 되었다고 믿습니다.
위 내용은 Redis가 분산 검색 기능을 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!