搜尋
首頁資料庫RedisRedis怎麼進行去重? 4種去重方法淺析

Redis怎麼進行去重?以下這篇文章跟大家介紹一下Redis去重的4種方法,希望對大家有幫助!

Redis怎麼進行去重? 4種去重方法淺析

這篇文章主要介紹了Redis實作唯一計數的3種方法分享,本文講解了基於SET、基於bit、基於HyperLogLog三種方法,需要的朋友可以參考下

唯一計數是網站系統中十分常見的一個功能特性,例如網站需要統計每天訪問的人數unique visitor (也就是UV)。計數問題很常見,但解決起來可能十分複雜:一是需要計數的量可能很大,比如大型的站點每天有數百萬的人訪問,數據量相當大;二是通常還希望擴展計數的維度,例如除了需要每天的UV,還想知道每週或每月的UV,導致計算十分複雜。 【相關推薦:Redis影片教學

在關聯式資料庫儲存的系統裡,實作唯一計數的方法就是select count(distinct ),它十分簡單,但如果資料量很大,這個語句執行是很慢的。用關聯式資料庫另外一個問題是插入資料效能也不高。

Redis 解決這類計數問題得心應手,相比關係資料庫速度更快,消耗資源更少,甚至提供了 3 種不同的方法。

1.基於set

Redis 的set 用來保存唯一的資料集合,透過它可以快速判斷某一個元素是否存在於集合中,也可以快速計算某一個集合的元素個數,另外和可以合併集合到一個新的集合。涉及的命令如下:

複製程式碼如下:

SISMEMBER key member  # 判断 member 是否存在
SADD key member  # 往集合中加入 member
SCARD key   # 获取集合元素个数

基於set 的方法簡單有效,計數精確,適用面廣,易於理解,它的缺點是消耗資源比較大(當然比起關聯式資料庫是少很多的),如果元素個數很大(例如上億的計數),消耗記憶體很恐怖。

2.基於bit

Redis 的bit 可以用來實現比set 記憶體高度壓縮的計數,它透過一個bit 1 或0 來儲存某個元素是否存在資訊。例如網站唯一訪客計數,可以把 user_id 作為 bit 的偏移量 offset,設定為 1 表示有訪問,使用 1 MB的空間就可以存放 800 多萬用戶的一天訪問計數情況。涉及的命令如下: 複製程式碼程式碼如下:

SETBIT key offset value  # 设置位信息
GETBIT key offset        # 获取位信息
BITCOUNT key [start end] # 计数
BITOP operation destkey key [key ...]  # 位图合并

基於bit 的方法比起set 空間消耗小得多,但是它要求元素能否簡單映射為位元偏移,適用面窄了不少,另外它消耗的空間取決於最大偏移量,和計數值無關,如果最大偏移量很大,消耗記憶體也相當可觀。

3.基於HyperLogLog

實現超大資料量精確的唯一計數都是比較困難的,但是如果只是近似的話​​,計算科學裡有很多高效的演算法,其中HyperLogLog Counting 就是其中非常著名的演算法,它可以僅使用12 k左右的內存,實現上億的唯一計數,而且誤差控制在百分之一左右。涉及的命令如下: 複製代碼代碼如下:

PFADD key element [element ...]  # 加入元素
PFCOUNT key [key ...]   # 计数

這種計數方法真的很神奇,其中涉及到統計學中的一些均勻分佈、隨機機率、伯努利分佈等,我也沒有徹底弄清楚,有興趣可以深入研究相關文章。

redis 提供的這三種唯一計數方式各有優劣,可以充分滿足不同情況下的計數要求。

4. 基於bloomfilter

BloomFilter是利用類似位圖或位元集合資料結構來儲存數據,利用位元組來簡潔的表示一個集合,並且能夠快速的判斷一個元素是不是已經存在於這個集合中。雖然BloomFilter不是100%準確,但可以透過調整參數,使用Hash函數的個數,位數組的大小來降低失誤率。這樣調節完全可以把失誤率降低到接近0。可以滿足大部分場景了。

假如此時有一個集合S = {x1, x2, … xn},Bloom Filter使用k個獨立的hash函數,分別將集合中的每一個元素映射到{1,…,m}的範圍。對於任何一個元素,被映射到的數字作為對應的位數組的索引,該位會被置為1。例如元素x1被hash函數映射到數字8,那麼位數組的第8位就會被置為1。下圖中集合S只有兩個元素x和y,分別被3個hash函數進行映射,映射到的位置分別為(0,3,6)和(4,7,10),對應的位會被置為1:

Redis怎麼進行去重? 4種去重方法淺析

現在假如要判斷另一個元素是否是在此集合中,只需要被這3個hash函數進行映射,查看對應的位置是否有0存在,如果有的話,表示此元素肯定不存在於這個集合,否則有可能存在。

redis使用布隆過濾器需要安裝外掛:https://blog.csdn.net/u013030276/article/details/88350641

更多程式相關知識,請造訪:程式設計入門! !

以上是Redis怎麼進行去重? 4種去重方法淺析的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:掘金社区。如有侵權,請聯絡admin@php.cn刪除
REDIS:數據庫還是服務器?揭開角色的神秘面紗REDIS:數據庫還是服務器?揭開角色的神秘面紗Apr 28, 2025 am 12:06 AM

redisisbothadatabaseandaserver.1)asadatabase,ituseSin-memorystorageforfastaccess,ifealforreal-timeapplications andCaching.2)Asaserver,ItsupportsPub/submessagingAndluAsessingandluAsessingandluascriptingftingftingftingftingftingftingftingfinteral-timecommunicationandserverserverserverserverserverserverserver-soperations。

REDIS:NOSQL方法的優勢REDIS:NOSQL方法的優勢Apr 27, 2025 am 12:09 AM

Redis是NoSQL數據庫,提供高性能和靈活性。 1)通過鍵值對存儲數據,適合處理大規模數據和高並發。 2)內存存儲和單線程模型確保快速讀寫和原子性。 3)使用RDB和AOF機制進行數據持久化,支持高可用性和橫向擴展。

REDIS:了解其架構和目的REDIS:了解其架構和目的Apr 26, 2025 am 12:11 AM

Redis是一种内存数据结构存储系统,主要用作数据库、缓存和消息代理。它的核心特点包括单线程模型、I/O多路复用、持久化机制、复制与集群功能。Redis在实际应用中常用于缓存、会话存储和消息队列,通过选择合适的数据结构、使用管道和事务、以及进行监控和调优,可以显著提升其性能。

REDIS與SQL數據庫:關鍵差異REDIS與SQL數據庫:關鍵差異Apr 25, 2025 am 12:02 AM

Redis和SQL數據庫的主要區別在於:Redis是內存數據庫,適用於高性能和靈活性需求;SQL數據庫是關係型數據庫,適用於復雜查詢和數據一致性需求。具體來說,1)Redis提供高速數據訪問和緩存服務,支持多種數據類型,適用於緩存和實時數據處理;2)SQL數據庫通過表格結構管理數據,支持複雜查詢和事務處理,適用於電商和金融系統等需要數據一致性的場景。

REDIS:它如何充當數據存儲和服務REDIS:它如何充當數據存儲和服務Apr 24, 2025 am 12:08 AM

REDISACTSASBOTHADATASTOREANDASERVICE.1)ASADATASTORE,ITUSESIN-MEMORYSTOOGATOFORFOFFASTESITION,支持VariousDatharptructuresLikeKey-valuepairsandsortedsetsetsetsetsetsetsets.2)asaservice,ItprovidespunctionslikeItionitionslikepunikeLikePublikePublikePlikePlikePlikeAndluikeAndluAascriptingiationsmpleplepleclexplectiations

REDIS與其他數據庫:比較分析REDIS與其他數據庫:比較分析Apr 23, 2025 am 12:16 AM

Redis與其他數據庫相比,具有以下獨特優勢:1)速度極快,讀寫操作通常在微秒級別;2)支持豐富的數據結構和操作;3)靈活的使用場景,如緩存、計數器和發布訂閱。選擇Redis還是其他數據庫需根據具體需求和場景,Redis在高性能、低延遲應用中表現出色。

REDIS的角色:探索數據存儲和管理功能REDIS的角色:探索數據存儲和管理功能Apr 22, 2025 am 12:10 AM

Redis在數據存儲和管理中扮演著關鍵角色,通過其多種數據結構和持久化機製成為現代應用的核心。 1)Redis支持字符串、列表、集合、有序集合和哈希表等數據結構,適用於緩存和復雜業務邏輯。 2)通過RDB和AOF兩種持久化方式,Redis確保數據的可靠存儲和快速恢復。

REDIS:了解NOSQL概念REDIS:了解NOSQL概念Apr 21, 2025 am 12:04 AM

Redis是一種NoSQL數據庫,適用於大規模數據的高效存儲和訪問。 1.Redis是開源的內存數據結構存儲系統,支持多種數據結構。 2.它提供極快的讀寫速度,適合緩存、會話管理等。 3.Redis支持持久化,通過RDB和AOF方式確保數據安全。 4.使用示例包括基本的鍵值對操作和高級的集合去重功能。 5.常見錯誤包括連接問題、數據類型不匹配和內存溢出,需注意調試。 6.性能優化建議包括選擇合適的數據結構和設置內存淘汰策略。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器