怎麼使用高斯Redis實現二級索引-Redis-PHP中文網

首頁

資料庫

Redis

怎麼使用高斯Redis實現二級索引

PHPz

Jun 02, 2023 pm 06:53 PM

redis

一、背景

提起索引，第一印象就是資料庫的名詞，但是，高斯Redis也可以實現二級索引！！！高斯Redis中的二級索引一般利用zset來實現。高斯Redis相比開源Redis有著更高的穩定性、以及成本優勢，使用高斯Redis zset實現業務二級索引，可以獲得效能與成本的雙贏。

索引的本質就是利用有序結構來加速查詢，因而透過Zset結構高斯Redis可以輕鬆實現數值類型以及字元類型索引。

• 數值類型索引（zset依分數排序）：

怎麼使用高斯Redis實現二級索引

#• 字元類型索引（分數相同時zset依字典序排序）：

怎麼使用高斯Redis實現二級索引

#下面讓我們切入兩類經典業務場景，看看如何使用高斯Redis來構建穩定可靠的二級索引系統。

二、場景一：字典補全

當在瀏覽器中鍵入查詢時，瀏覽器通常會依照可能性推薦相同前綴的搜索，這種場景可以用高斯Redis二級索引功能實作。

怎麼使用高斯Redis實現二級索引

2.1 基本方案

最簡單的方法是將使用者的每個查詢加入索引。如果需要提供使用者補全提示，可以使用ZRANGEBYLEX來進行範圍查詢。為了減少結果數量，使用LIMIT選項是高斯Redis支援的一種方法。

• 將使用者搜尋banana加入索引：

ZADD myindex 0 banana:1

• 假設使用者在搜尋表單中輸入“bit”，並且我們想要提供可能以“bit”開頭的搜尋關鍵字。

ZRANGEBYLEX myindex "[bit" "[bit\xff"

即使用ZRANGEBYLEX進行範圍查詢，查詢的區間為使用者現在輸入的字串，以及相同的字串加上一個尾隨位元組255（\xff）。我們可以使用這種方法來取得所有以使用者輸入的字串為前綴的字串。

2.2 與頻率相關的字典補全

在實際應用中，人們通常希望自動排序補全詞條，以適應出現頻率，並清除已不再流行的詞條，同時自適應未來的輸入。我們依然可以使用高斯Redis的ZSet結構來實現這一目標，只是在索引結構中，不僅需要儲存搜尋詞，還需要儲存與之關聯的頻率。

• 將使用者搜尋banana加入索引

• 判斷banana是否存在

ZRANGEBYLEX myindex "[banana:" + LIMIT 0 1

• 假設banana不存在，加上banana:1，其中1是頻率

ZADD myindex 0 banana:1

• 假設banana存在，需要遞增頻率

若ZRANGEBYLEX myindex "[banana:" LIMIT 0 1 中傳回的頻率為1

#1）刪除舊條目：

ZREM myindex 0 banana:1

2）頻率加一重新加入：

ZADD myindex 0 banana:2

請注意，由於可能存在並發更新，因此應透過Lua腳本發送上述三個命令，用Lua script自動獲得舊計數並增加分數後重新新增條目。

假如使用者在搜尋表單中輸入“banana”，我們希望提供相關的搜尋關鍵字。透過ZRANGEBYLEX獲得結果後按頻率排序。

ZRANGEBYLEX myindex "[banana:" + LIMIT 0 10
1) "banana:123"
2) "banaooo:1"
3) "banned user:49"
4) "banning:89"

• 使用流演算法清除不常用輸入。隨機選擇一個傳回的條目，並將其分數減一，然後將其與更新後的分數重新添加。但是，如果新分數為0，我們需從清單中刪除該條目。

• 若隨機挑選的條目頻率是1，如banaooo:1

ZREM myindex 0 banaooo:1

• 若隨機挑選的條目頻率大於1，如banana:123

ZREM myindex 0 banana:123
ZADD myindex 0 banana:122

從長遠來看，該索引會包含熱門搜索，如果熱門搜尋隨時間變化，它也會自動適應。

三、場景二：多維索引

高斯Redis不僅支援單一維度上的查詢，也能夠在多維資料中進行檢索。舉個例子，搜尋符合條件的人員：年齡介於50至55歲之間，且薪水在70000至85000之間。將二維資料編碼轉換為一維數據，然後利用高斯分佈的 Redis zset 存儲，是實現多維二級索引的重要方法。

從視覺化視角表示二維索引。在這個空間中，有一些資料樣本點被表示為座標(x,y)，而這些座標中x和y兩個變數的最大值都為400。圖片中的藍色框代表我們的查詢。我們想要找出所有座標 x 位於50和100之間，y 位於100和300之間的點。

怎麼使用高斯Redis實現二級索引

3.1 資料編碼

若插入資料點為x = 75和y = 200

1）填入0（資料最大為400，故填3位元）

x = 075

y = 200

2）交织数字，以x表示最左边的数字，以y表示最左边的数字，依此类推，以便创建一个编码

027050

若使用00和99替换最后两位，即027000 to 027099，map回x和y，即：

x = 70-79

y = 200-209

因此，针对x=70-79和y = 200-209的二维查询，可以通过编码map成027000 to 027099的一维查询，这可以通过高斯Redis的Zset结构轻松实现。

怎麼使用高斯Redis實現二級索引

同理，我们可以针对后四/六/etc位数字进行相同操作，从而获得更大范围。

3）使用二进制

如果将数据表示为二进制，就可以获得更细的粒度，而在数字替换时，每次都将搜索范围扩大两倍。如果我们使用二进制表示法数字，每个变量最多需要9位（表示最多400个值），那么我们将得到：

x = 75 -> 001001011

y = 200 -> 011001000

交织后，000111000011001010

让我们看看在交错表示中用0s ad 1s替换最后的2、4、6、8，...位时我们的范围是什么：

怎麼使用高斯Redis實現二級索引

3.2 添加新元素

若插入数据点为x = 75和y = 200

x = 75和y = 200二进制交织编码后为000111000011001010，

ZADD myindex 0 000111000011001010

3.3 查询

查询：x介于50和100之间，y介于100和300之间的所有点

从索引中替换N位会给我们边长为2^(N/2)的搜索框。因此，我们要做的是检查搜索框较小的尺寸，并检查与该数字最接近的2的幂，并不断切分剩余空间，随后用ZRANGEBYLEX进行搜索。

下面是示例代码：

def spacequery(x0,y0,x1,y1,exp)
    bits=exp*2
    x_start = x0/(2**exp)
    x_end = x1/(2**exp)
    y_start = y0/(2**exp)
    y_end = y1/(2**exp)
    (x_start..x_end).each{|x|
        (y_start..y_end).each{|y|
            x_range_start = x*(2**exp)
            x_range_end = x_range_start | ((2**exp)-1)
            y_range_start = y*(2**exp)
            y_range_end = y_range_start | ((2**exp)-1)
            puts "#{x},#{y} x from #{x_range_start} to #{x_range_end}, y from #{y_range_start} to #{y_range_end}"
            # Turn it into interleaved form for ZRANGEBYLEX query.
            # We assume we need 9 bits for each integer, so the final
            # interleaved representation will be 18 bits.
            xbin = x_range_start.to_s(2).rjust(9,&#39;0&#39;)
            ybin = y_range_start.to_s(2).rjust(9,&#39;0&#39;)
            s = xbin.split("").zip(ybin.split("")).flatten.compact.join("")
            # Now that we have the start of the range, calculate the end
            # by replacing the specified number of bits from 0 to 1.
            e = s[0..-(bits+1)]+("1"*bits)
            puts "ZRANGEBYLEX myindex [#{s} [#{e}"
        }
    }
end
spacequery(50,100,100,300,6)

以上是怎麼使用高斯Redis實現二級索引的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：亿速云。如有侵權，請聯絡admin@php.cn刪除

REDIS與SQL數據庫：關鍵差異Apr 25, 2025 am 12:02 AM

Redis和SQL數據庫的主要區別在於：Redis是內存數據庫，適用於高性能和靈活性需求；SQL數據庫是關係型數據庫，適用於復雜查詢和數據一致性需求。具體來說，1)Redis提供高速數據訪問和緩存服務，支持多種數據類型，適用於緩存和實時數據處理；2)SQL數據庫通過表格結構管理數據，支持複雜查詢和事務處理，適用於電商和金融系統等需要數據一致性的場景。

REDIS：它如何充當數據存儲和服務Apr 24, 2025 am 12:08 AM

REDISACTSASBOTHADATASTOREANDASERVICE.1）ASADATASTORE，ITUSESIN-MEMORYSTOOGATOFORFOFFASTESITION，支持VariousDatharptructuresLikeKey-valuepairsandsortedsetsetsetsetsetsetsets.2）asaservice，ItprovidespunctionslikeItionitionslikepunikeLikePublikePublikePlikePlikePlikeAndluikeAndluAascriptingiationsmpleplepleclexplectiations

REDIS與其他數據庫：比較分析Apr 23, 2025 am 12:16 AM

Redis與其他數據庫相比，具有以下獨特優勢：1)速度極快，讀寫操作通常在微秒級別；2)支持豐富的數據結構和操作；3)靈活的使用場景，如緩存、計數器和發布訂閱。選擇Redis還是其他數據庫需根據具體需求和場景，Redis在高性能、低延遲應用中表現出色。

REDIS的角色：探索數據存儲和管理功能Apr 22, 2025 am 12:10 AM

Redis在數據存儲和管理中扮演著關鍵角色，通過其多種數據結構和持久化機製成為現代應用的核心。 1）Redis支持字符串、列表、集合、有序集合和哈希表等數據結構，適用於緩存和復雜業務邏輯。 2）通過RDB和AOF兩種持久化方式，Redis確保數據的可靠存儲和快速恢復。

REDIS：了解NOSQL概念Apr 21, 2025 am 12:04 AM

Redis是一種NoSQL數據庫，適用於大規模數據的高效存儲和訪問。 1.Redis是開源的內存數據結構存儲系統，支持多種數據結構。 2.它提供極快的讀寫速度，適合緩存、會話管理等。 3.Redis支持持久化，通過RDB和AOF方式確保數據安全。 4.使用示例包括基本的鍵值對操作和高級的集合去重功能。 5.常見錯誤包括連接問題、數據類型不匹配和內存溢出，需注意調試。 6.性能優化建議包括選擇合適的數據結構和設置內存淘汰策略。

REDIS：現實世界的用例和示例Apr 20, 2025 am 12:06 AM

Redis在現實世界中的應用包括：1.作為緩存系統加速數據庫查詢，2.存儲Web應用的會話數據，3.實現實時排行榜，4.作為消息隊列簡化消息傳遞。 Redis的多功能性和高性能使其在這些場景中大放異彩。

REDIS：探索其功能和功能Apr 19, 2025 am 12:04 AM

Redis脫穎而出是因為其高速、多功能性和豐富的數據結構。 1)Redis支持字符串、列表、集合、散列和有序集合等數據結構。 2)它通過內存存儲數據，支持RDB和AOF持久化。 3)從Redis6.0開始引入多線程處理I/O操作，提升了高並發場景下的性能。

Redis是SQL還是NOSQL數據庫？答案解釋了Apr 18, 2025 am 12:11 AM

RedisisclassifiedasaNoSQLdatabasebecauseitusesakey-valuedatamodelinsteadofthetraditionalrelationaldatabasemodel.Itoffersspeedandflexibility,makingitidealforreal-timeapplicationsandcaching,butitmaynotbesuitableforscenariosrequiringstrictdataintegrityo

See all articles