Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법-Redis-php.cn

집

데이터 베이스

Redis

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

PHPz

Jun 02, 2023 pm 06:53 PM

redis

1. Background

인덱싱을 하면 첫인상은 데이터베이스라는 단어인데 Gaussian Redis도 2차 인덱싱을 구현할 수 있어요! ! ! Gaussian Redis의 보조 인덱스는 일반적으로 zset을 사용하여 구현됩니다. Gaussian Redis는 오픈 소스 Redis보다 더 높은 안정성과 비용 이점을 제공합니다. Gaussian Redis zset을 사용하여 비즈니스 보조 인덱스를 구현하면 성능과 비용 측면에서 윈윈(win-win) 상황을 달성할 수 있습니다.

인덱싱의 핵심은 순서화된 구조를 사용하여 쿼리 속도를 높이는 것이므로 Zset 구조 Gaussian Redis를 통해 숫자 및 문자 유형 인덱스를 쉽게 구현할 수 있습니다.

• 숫자 유형 색인(zset은 점수별로 정렬됨):

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

• 문자 유형 색인(점수가 동일한 경우 zset는 사전순으로 정렬됨):

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

두 가지 유형의 고전적인 비즈니스 시나리오를 살펴보고 Gaussian Redis를 사용하여 안정적이고 신뢰할 수 있는 보조 인덱스 시스템을 구축하는 방법을 살펴보겠습니다.

2. 시나리오 1: 사전 완성

브라우저에 쿼리를 입력하면 브라우저는 일반적으로 가능성을 기준으로 동일한 접두어를 사용하여 검색을 추천합니다. 이 시나리오는 Gaussian Redis 보조 인덱스 기능을 사용하여 실현할 수 있습니다.

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

2.1 기본 솔루션

가장 간단한 방법은 사용자의 모든 쿼리를 인덱스에 추가하는 것입니다. 사용자에게 완료 프롬프트를 제공해야 하는 경우 ZRANGEBYLEX를 사용하여 범위 쿼리를 수행할 수 있습니다. 결과 수를 줄이기 위해 LIMIT 옵션을 사용하는 것이 Gaussian Redis에서 지원하는 방법입니다.

• 색인에 사용자 검색 바나나 추가:

ZADD myindex 0 banana:1

• 사용자가 검색 양식에 "bit"를 입력하고 "bit"로 시작할 수 있는 검색 키워드를 제공한다고 가정합니다.

ZRANGEBYLEX myindex "[bit" "[bit\xff"

즉, ZRANGEBYLEX를 사용하여 범위 쿼리를 수행합니다. 쿼리 범위는 사용자가 지금 입력한 문자열과 동일한 문자열에 후행 바이트 255(xff)를 더한 것입니다. 이 방법을 사용하여 사용자가 입력한 문자열이 앞에 붙은 모든 문자열을 가져올 수 있습니다.

2.2 빈도 관련 사전 완성

실제 응용에서 사람들은 일반적으로 발생 빈도에 맞게 완성 용어를 자동으로 정렬하고, 향후 입력에 적응하면서 더 이상 인기가 없는 용어를 제거하기를 원합니다. 이 목표를 달성하기 위해 Gaussian Redis의 ZSet 구조를 계속 사용할 수 있지만 인덱스 구조에서는 검색어뿐만 아니라 검색어와 관련된 빈도도 저장해야 합니다.

• 사용자 검색 바나나를 인덱스에 추가

• 바나나가 존재하지 않는다고 가정하고 바나나를 추가합니다. 여기서 1은 빈도입니다.

ZRANGEBYLEX myindex "[banana:" + LIMIT 0 1

• 빈도를 높이려면

ZRANGEBYLEX myindex "[banana:" + LIMIT 0 1에서 반환된 빈도가 1인 경우

1) 이전 항목 삭제:

ZADD myindex 0 banana:1

2) 빈도를 1씩 추가하고 다시 참여하세요:

ZREM myindex 0 banana:1

제발 동시 업데이트 가능성으로 인해 위의 세 가지 명령은 Lua 스크립트를 통해 전송되어야 합니다. Lua 스크립트는 자동으로 이전 카운트를 얻고 점수를 올린 후 항목을 다시 추가합니다.

사용자가 검색창에 "바나나"를 입력하면 관련 검색어가 제공되기를 바랍니다. ZRANGEBYLEX를 통해 결과를 얻은 후 빈도별로 정렬합니다.

ZADD myindex 0 banana:2

• 스트리밍 알고리즘을 사용하여 자주 사용되지 않는 입력을 정리합니다. 반환된 항목을 무작위로 선택하고 점수에서 하나를 뺀 다음 업데이트된 점수로 다시 추가합니다. 그러나 새 점수가 0이면 목록에서 해당 항목을 제거해야 합니다.

• banaooo:1

ZRANGEBYLEX myindex "[banana:" + LIMIT 0 10
1) "banana:123"
2) "banaooo:1"
3) "banned user:49"
4) "banning:89"

•과 같이 무작위로 선택된 항목의 빈도가 1인 경우 바나나:123

ZREM myindex 0 banaooo:1

과 같이 무작위로 선택된 항목의 빈도가 1보다 큰 경우 색인에는 인기 검색어가 포함되며, 시간이 지남에 따라 인기 검색어가 변경되면 자동으로 조정됩니다.

3. 시나리오 2: 다차원 인덱스

Gaussian Redis는 단일 차원의 쿼리를 지원할 뿐만 아니라 다차원 데이터에서도 검색할 수 있습니다. 예를 들어, 나이가 50~55세이고 급여가 70,000~85,000이라는 기준을 충족하는 사람을 검색합니다. 2차원 데이터 인코딩을 1차원 데이터로 변환한 후 Gaussian 분산 Redis zset 스토리지를 사용하는 것은 다차원 보조 인덱스를 구현하는 중요한 방법입니다.

시각적 관점에서 2차원 인덱스를 표현합니다. 이 공간에는 좌표(x, y)로 표현된 일부 데이터 샘플 포인트가 있으며, 이 좌표에서 x, y 변수의 최대값은 400입니다. 이미지의 파란색 상자는 쿼리를 나타냅니다. 우리는 x 좌표가 50에서 100 사이이고 y 좌표가 100에서 300 사이인 모든 점을 찾고 싶습니다.

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법 3.1 데이터 인코딩

삽입된 데이터 포인트가 x = 75이고 y = 200인 경우

1) 0을 입력합니다(최대 데이터는 400이므로 3자리를 입력합니다)

x = 075

y = 200

2）交织数字，以x表示最左边的数字，以y表示最左边的数字，依此类推，以便创建一个编码

027050

若使用00和99替换最后两位，即027000 to 027099，map回x和y，即：

x = 70-79

y = 200-209

因此，针对x=70-79和y = 200-209的二维查询，可以通过编码map成027000 to 027099的一维查询，这可以通过高斯Redis的Zset结构轻松实现。

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

同理，我们可以针对后四/六/etc位数字进行相同操作，从而获得更大范围。

3）使用二进制

如果将数据表示为二进制，就可以获得更细的粒度，而在数字替换时，每次都将搜索范围扩大两倍。如果我们使用二进制表示法数字，每个变量最多需要9位（表示最多400个值），那么我们将得到：

x = 75 -> 001001011

y = 200 -> 011001000

交织后，000111000011001010

让我们看看在交错表示中用0s ad 1s替换最后的2、4、6、8，...位时我们的范围是什么：

Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법

3.2 添加新元素

若插入数据点为x = 75和y = 200

x = 75和y = 200二进制交织编码后为000111000011001010，

ZADD myindex 0 000111000011001010

3.3 查询

查询：x介于50和100之间，y介于100和300之间的所有点

从索引中替换N位会给我们边长为2^(N/2)的搜索框。因此，我们要做的是检查搜索框较小的尺寸，并检查与该数字最接近的2的幂，并不断切分剩余空间，随后用ZRANGEBYLEX进行搜索。

下面是示例代码：

def spacequery(x0,y0,x1,y1,exp)
    bits=exp*2
    x_start = x0/(2**exp)
    x_end = x1/(2**exp)
    y_start = y0/(2**exp)
    y_end = y1/(2**exp)
    (x_start..x_end).each{|x|
        (y_start..y_end).each{|y|
            x_range_start = x*(2**exp)
            x_range_end = x_range_start | ((2**exp)-1)
            y_range_start = y*(2**exp)
            y_range_end = y_range_start | ((2**exp)-1)
            puts "#{x},#{y} x from #{x_range_start} to #{x_range_end}, y from #{y_range_start} to #{y_range_end}"
            # Turn it into interleaved form for ZRANGEBYLEX query.
            # We assume we need 9 bits for each integer, so the final
            # interleaved representation will be 18 bits.
            xbin = x_range_start.to_s(2).rjust(9,&#39;0&#39;)
            ybin = y_range_start.to_s(2).rjust(9,&#39;0&#39;)
            s = xbin.split("").zip(ybin.split("")).flatten.compact.join("")
            # Now that we have the start of the range, calculate the end
            # by replacing the specified number of bits from 0 to 1.
            e = s[0..-(bits+1)]+("1"*bits)
            puts "ZRANGEBYLEX myindex [#{s} [#{e}"
        }
    }
end
spacequery(50,100,100,300,6)

위 내용은 Gaussian Redis를 사용하여 보조 인덱스를 구현하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

REDIS : 키 가치 데이터 저장에 대한 안내서May 02, 2025 am 12:10 AM

Redis는 데이터베이스, 캐시 및 메시지 중개인으로 사용되는 오픈 소스 메모리 데이터 구조 스토리지로 빠른 응답 및 높은 동시성이 필요한 시나리오에 적합합니다. 1.Redis는 메모리를 사용하여 데이터를 저장하고 마이크로 초 읽기 및 쓰기 속도를 제공합니다. 2. 문자열, 목록, 컬렉션 등과 같은 다양한 데이터 구조를 지원합니다. 3. Redis는 RDB 및 AOF 메커니즘을 통한 데이터 지속성을 인식합니다. 4. 단일 스레드 모델 및 멀티플렉싱 기술을 사용하여 요청을 효율적으로 처리하십시오. 5. 성능 최적화 전략에는 LRU 알고리즘 및 클러스터 모드가 포함됩니다.

Redis : 캐싱, 세션 관리 등May 01, 2025 am 12:03 AM

Redis의 기능에는 주로 캐시, 세션 관리 및 기타 기능이 포함됩니다. 1) 캐시 함수는 메모리를 통해 데이터를 저장하여 읽기 속도를 향상시키고 전자 상거래 웹 사이트와 같은 고주파 액세스 시나리오에 적합합니다. 2) 세션 관리 기능은 분산 시스템에서 세션 데이터를 공유하고 만료 시간 메커니즘을 통해 자동으로 정리합니다. 3) 실시간 메시지 푸시 및 다중 스레드 시스템 및 기타 시나리오에 적합한 Publish-Subscribe 모드, 분산 잠금 및 카운터와 같은 기타 기능.

Redis : 핵심 기능과 이점을 탐색합니다Apr 30, 2025 am 12:22 AM

Redis의 핵심 기능에는 메모리 저장 및 지속 메커니즘이 포함됩니다. 1) 메모리 스토리지는 고성능 응용 프로그램에 적합한 매우 빠른 읽기 및 쓰기 속도를 제공합니다. 2) 지속성은 RDB 및 AOF를 통해 데이터가 손실되지 않도록하고, 선택은 응용 프로그램 요구를 기반으로합니다.

Redis의 서버 측 작업 : 제공하는 내용Apr 29, 2025 am 12:21 AM

redis 'sserver-sideoperationsofferfolinctionsandtriggerSforexecutingcomplexOperationsontheserver.1) functionsallowCustomOperationsInlua, javaScript, orredissscripttingLanguage, 2) triggerSenableAutomicalfutionone

Redis : 데이터베이스 또는 서버? 역할을 시연합니다Apr 28, 2025 am 12:06 AM

redisisbothadatabaseandaserver.1) asadatabase, itusesin-memorystorageforfestaccess, 이상적인 우림-타이어 배제 및 캐치.

REDIS : NOSQL 접근법의 장점Apr 27, 2025 am 12:09 AM

Redis는 고성능과 유연성을 제공하는 NOSQL 데이터베이스입니다. 1) 대규모 데이터 및 높은 동시성을 처리하는 데 적합한 키 가치 쌍을 통해 데이터를 저장합니다. 2) 메모리 저장 및 단일 스레드 모델은 빠른 읽기 및 쓰기 및 원자력을 보장합니다. 3) RDB 및 AOF 메커니즘을 사용하여 데이터를 지속하여 고 가용성 및 스케일 아웃을 지원합니다.

REDIS : 건축과 목적을 이해합니다Apr 26, 2025 am 12:11 AM

Redis는 주로 데이터베이스, 캐시 및 메시지 중개인으로 사용되는 메모리 데이터 구조 스토리지 시스템입니다. 핵심 기능에는 단일 스레드 모델, I/O 멀티플렉싱, 지속 메커니즘, 복제 및 클러스터링 기능이 포함됩니다. Redis는 일반적으로 캐싱, 세션 저장 및 메시지 대기열을위한 실제 응용 프로그램에 사용됩니다. 올바른 데이터 구조를 선택하고 파이프 라인 및 트랜잭션을 사용하여 모니터링 및 튜닝을 통해 성능을 크게 향상시킬 수 있습니다.

Redis vs. SQL 데이터베이스 : 주요 차이점Apr 25, 2025 am 12:02 AM

Redis와 SQL 데이터베이스의 주요 차이점은 Redis가 고성능 및 유연성 요구 사항에 적합한 메모리 데이터베이스라는 것입니다. SQL 데이터베이스는 관계형 데이터베이스로 복잡한 쿼리 및 데이터 일관성 요구 사항에 적합합니다. 구체적으로, 1) Redis는 고속 데이터 액세스 및 캐싱 서비스를 제공하고 캐싱 및 실시간 데이터 처리에 적합한 여러 데이터 유형을 지원합니다. 2) SQL 데이터베이스는 테이블 구조를 통한 데이터를 관리하고 복잡한 쿼리 및 트랜잭션 처리를 지원하며 데이터 일관성이 필요한 전자 상거래 및 금융 시스템과 같은 시나리오에 적합합니다.

See all articles