Redis HyperLog日誌
Redis 在 2.8.9 版本中新增了 HyperLogLog 結構。
Redis HyperLogLog 是用來做基數統計的演算法,HyperLogLog 的優點是,在輸入元素的數量或體積非常非常大時,計算基數所需的空間總是固定 的、並且是很小的。
在 Redis 裡面,每個 HyperLogLog 鍵只需要花費 12 KB 內存,就可以計算接近 2^64 個不同元素的基 數。這和計算基數時,元素越多耗費記憶體就越多的集合形成鮮明對比。
但是,因為 HyperLogLog 只會根據輸入元素來計算基數,而不會儲存輸入元素本身,所以 HyperLogLog 不能像集合一樣,傳回輸入的各個元素。
什麼是基數?
例如資料集{1, 3, 5, 7, 5, 7, 8}, 那麼這個資料集的基數集合為{1, 3 , 5 ,7, 8}, 基數(不重複元素)為5。 基數估計就是在誤差可接受的範圍內,快速計算基數。
實例
以下實例示範了HyperLogLog 的工作流程:
redis 127.0.0.1:6379> PFADD w3ckey "redis" 1) (integer) 1 redis 127.0.0.1:6379> PFADD w3ckey "mongodb" 1) (integer) 1 redis 127.0.0.1:6379> PFADD w3ckey "mysql" 1) (integer) 1 redis 127.0.0.1:6379> PFCOUNT w3ckey (integer) 3
Redis HyperLogLog 指令
下表列出了redis HyperLogLog 的基本指令:
#序號 | #指令與描述 |
---|---|
1 | ##PFADD key element [element ...]新增指定元素到HyperLogLog 中。 |
PFCOUNT key [key ...] | 傳回給定 HyperLogLog 的基數估算值。 |
PFMERGE destkey sourcekey [sourcekey ...] | 將多個HyperLogLog 合併為一個HyperLogLog |