首頁 >常見問題 >2023年最新版 68道Redis面試題(收藏)

2023年最新版 68道Redis面試題(收藏)

coldplay.xixi
coldplay.xixi原創
2020-08-05 15:49:0911425瀏覽

文章內容太長,建議先收藏 慢慢看!    

Redis(Remote Dictionary Server) 是使用 C 語言編寫的,開源的(BSD授權)高效能非關係型(NoSQL)的鍵值對資料庫。

2023年最新版 68道Redis面試題(收藏)

Redis 可以儲存鍵和五種不同類型的值之間的對應。鍵的類型只能為字串,只支援五種資料型別:字串、列表、集合、散列表、有序集合。

與傳統資料庫不同的是Redis 的資料是存在記憶體中的,所以讀寫速度非常快,因此redis 被廣泛應用於快取方向,每秒可以處理超過10萬次讀寫操作,是已知效能最快的Key-Value DB。另外,Redis 也常用來做分散式鎖。除此之外,Redis 支援交易 、持久化、LUA腳本、LRU驅動事件、多種叢集方案。

2023年最新版 68道Redis面試題(收藏)

今天就來講講Redis面試題,為復工後的面試做好準備。

一、概述​​

1、Redis有哪些優缺點

優點

##讀寫效能優異, Redis能讀的速度是110000次/s,寫的速度是81000次/s。

支持資料持久化,支援AOF和RDB兩種持久化方式。

支援事務,Redis的所有操作都是原子性的,同時Redis也支援對幾個操作合併後的原子性執行。

資料結構豐富,除了支援string類型的value外還支援hash、set、zset、list等資料結構。

支援主從複製,主機會自動將資料同步到從機,可以進行讀寫分離。

缺點

資料庫容量受到實體記憶體的限制,不能用作海量資料的高效能讀寫,因此Redis適合的場景主要限制在較小資料量的高性能操作和運算上。

Redis 不具備自動容錯和復原功能,主機從機的宕機都會導致前端部分讀寫請求失敗,需要等待機器重新啟動或手動切換前端的IP才能恢復。

主機宕機,當機前有部分資料未能及時同步到從機,切換IP後還會引入資料不一致的問題,降低了系統的可用性。

Redis 較難支援線上擴容,在叢集容量達到上限時線上擴容會變得很複雜。為避免這個問題,維運人員在系統上線時必須確保有足夠的空間,這對資源造成了極大的浪費。

2、為什麼要用 Redis /為什麼要用快取

#主要從「高效能」和「高並發」這兩點來看待這個問題。

高效能:

假如使用者第一次存取資料庫中的某些資料。這個過程會比較慢,因為是從硬碟上讀取的。將該用戶存取的資料存在數快取中,這樣下一次再存取這些資料的時候就可以直接從快取中取得了。

操作快取就是直接操作內存,所以速度相當快。如果資料庫中的對應資料改變的之後,同步改變快取中對應的資料即可!

2023年最新版 68道Redis面試題(收藏)

高並發:

直接操作快取能夠承受的請求是遠大於直接存取資料庫的,所以我們可以考慮把資料庫中的部分資料轉移到快取中去,這樣使用者的一部分請求會直接到快取這裡而不用經過資料庫。

2023年最新版 68道Redis面試題(收藏)

3、為什麼要用Redis 而不用map/guava 做快取?

快取分為本地快取和分散式緩存。以Java 為例,使用自帶的map 或者guava 實現的是本地緩存,最主要的特點是輕量級以及快速,生命週期隨著jvm 的銷毀而結束,並且在多實例的情況下,每個實例都需要各自保存一份緩存,緩存不具一致性。

使用 redis 或 memcached 之類的稱為分散式緩存,在多實例的情況下,各實例共用一份緩存數據,緩存具有一致性。缺點是需要保持 redis 或 memcached服務的高可用,整個程式架構上較為複雜。

4、Redis為什麼這麼快

1)完全基於內存,絕大部分請求是純粹的記憶體操作,非常快速。資料存在記憶體中,類似HashMap,HashMap 的優點就是查找和操作的時間複雜度都是O(1);

2)資料結構簡單,對資料操作也簡單,Redis 中的資料結構是專門進行設計的;

3)採用單線程,避免了不必要的上下文切換和競爭條件,也不存在多進程或多線程導致的切換而消耗CPU,不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有因為可能出現死鎖而導致的性能消耗;

4)使用多路I/O 復用模型,非阻塞IO;

5使用底層模型不同,它們之間底層實作方式以及與客戶端之間通訊的應用協定不一樣,Redis 直接自己建構了VM 機制,因為一般的系統呼叫系統函數的話,會浪費一定的時間去移動和請求;

二、資料型別

5、Redis有哪些資料型別

#Redis主要有5種資料型,包括String,List,Set,Zset,Hash,滿足大部分的使用要求

2023年最新版 68道Redis面試題(收藏)

6、Redis的應用程式場景

##總結一

計數器:可以對String 進行自增自減運算,從而實現計數器功能。 Redis 這種記憶體型資料庫的讀寫效能非常高,很適合儲存頻繁讀寫的計數量。

快取:將熱點資料放到記憶體中,設定記憶體的最大使用量以及淘汰策略來保證快取的命中率。

會話快取:可以使用 Redis 來統一儲存多台應用程式伺服器的會話資訊。當應用程式伺服器不再儲存使用者的會話訊息,也就不再具有狀態,一個使用者可以請求任意一個應用程式伺服器,從而更容易實現高可用性以及可擴展性。

全頁快取(FPC):除基本的會話token之外,Redis還提供很簡單的FPC平台。以Magento為例,Magento提供一個外掛程式來使用Redis作為全頁快取後端。此外,對於WordPress的用戶來說,Pantheon有一個非常好的外掛程式 wp-redis,這個外掛程式能幫助你以最快速度載入你曾經瀏覽過的頁面。

查找表:例如 DNS 記錄就很適合使用 Redis 進行儲存。查找表和快取類似,也是利用了 Redis 快速的查找特性。但是查找表的內容不能失效,而快取的內容可以失效,因為快取不作為可靠的資料來源。

訊息佇列(發布/訂閱功能):List 是一個雙向鍊錶,可以透過 lpush 和 rpop 寫入和讀取訊息。不過最好使用 Kafka、RabbitMQ 等訊息中間件。

分散式鎖定實作:在分散式場景下,無法使用單機環境下的鎖定來對多個節點上的進程進行同步。可以使用 Redis 內建的 SETNX 指令來實現分散式鎖定,除此之外,還可以使用官方提供的 RedLock 分散式鎖定實作。

其它:Set 可以實現交集、並集等操作,從而實現共同好友等功能。 ZSet 可以實現有序性操作,從而實現排行榜等功能。

總結二

Redis相比其他緩存,有一個非常大的優勢,就是支援多種資料類型。

資料型態說明string字串,最簡單的k-v儲存hashhash格式,value為field和value,適合ID-Detail這樣的場景。 list簡單的list,順序列表,支援首位或結尾插入資料set無序list,查找速度快,適合交集、並集、差集處理sorted set有序的set

其實,透過上面的數據類型的特性,基本就能想到合適的應用場景了。

string——適合最簡單的k-v存儲,類似於memcached的存儲結構,短信驗證碼,配置信息等,就用這種類型來存儲。

hash-一般key為ID或唯一標示,value對應的就是詳情了。如商品詳情,個人資訊詳情,新聞詳情等。

list-因為list是有順序的,比較適合儲存一些有順序且資料相對固定的資料。如省市區表、字典表等。因為list是有順序的,適合依照寫入的時間來排序,如:最新的***,訊息佇列等。

set-可以簡單的理解為ID-List的模式,如微博中一個人有哪些好友,set最牛的地方在於,可以對兩個set提供交集、並集、差集操作。例如:找出兩個人共同的好友等。

Sorted Set-是set的增強版本,增加了一個score參數,自動會依照score的值進行排序。比較適合類似top 10等不根據插入的時間來排序的資料。

如上所述,雖然Redis不像關係型資料庫那麼複雜的資料結構,但是,也能適合很多場景,比一般的快取資料結構要多。了解每種資料結構適合的業務場景,不僅有利於提升開發效率,也能有效運用Redis的效能。

三、持久化

7、什麼是Redis持久化?

持久化就是把記憶體的資料寫到磁碟中去,防止服務宕機了記憶體資料遺失。

8、Redis 的持久化機制是什麼?各自的優缺點?

Redis 提供兩種持久化機制RDB(預設) 和AOF 機制:

RDB:是Redis DataBase縮寫快照

#RDB是Redis預設的持久化方式。依照一定的時間將記憶體的資料以快照的形式儲存到硬碟中,對應產生的資料檔為dump.rdb。透過設定檔中的save參數來定義快照的周期。

2023年最新版 68道Redis面試題(收藏)

優點:

1、只有一個檔案 dump.rdb,方便持久化。

2、容災性好,一個檔案可以儲存到安全的磁碟。

3、效能最大化,fork 子程序來完成寫入操作,讓主程序繼續處理指令,所以是 IO 最大化。使用單獨子程序來進行持久化,主程序不會進行任何 IO 操作,保證了 redis 的高效能

4.相對於資料集大時,比 AOF 的啟動效率更高。

缺點:

1、資料安全性低。 RDB 是間隔一段時間進行持久化,如果持久化之間 redis 發生故障,會發生資料遺失。所以這種方式更適合資料要求不嚴謹的時候)

2、AOF(Append-only file)持久化方式:是指所有的命令列記錄以redis 命令請求協議的格式完全持久化存儲)儲存為aof 檔案。

AOF:持久化

AOF持久化(即Append Only File持久化),則是將Redis執行的每次寫入命令記錄到單獨的日誌文件中,當重啟Redis會重新將持久化的日誌中檔案還原資料。

當兩種方式同時開啟時,資料恢復Redis會優先選擇AOF恢復。

2023年最新版 68道Redis面試題(收藏)

優點:

1、資料安全,aof 持久化可以設定appendfsync 屬性,有always,每進行一次指令操作就記錄到aof 文件中一次。

2、透過 append 模式寫入文件,即使中途伺服器宕機,可以透過 redis-check-aof 工具解決資料一致性問題。

3、AOF 機制的 rewrite 模式。 AOF 檔案沒被rewrite 之前(檔案過大時會對指令合併重寫),可以刪除其中的某些指令(例如誤操作的flushall))

##缺點:

1、AOF 檔案比RDB 檔案大,且恢復速度慢。

2、資料集大的時候,比 rdb 啟動效率低。

優缺點是什麼?

AOF檔案比RDB更新頻率高,優先使用AOF還原資料。

AOF比RDB更安全也更大

RDB效能比AOF好

如果兩個都配了優先載入AOF

9 、如何選擇合適的持久化方式

一般來說, 如果想達到足以媲美PostgreSQL的資料安全性,你應該同時使用兩種持久化功能。在這種情況下,當 Redis 重新啟動的時候會優先載入AOF檔案來恢復原始的數據,因為在通常情況下AOF檔案保存的資料集比RDB檔案保存的資料集要完整。

如果你非常關心你的數據, 但仍然可以承受幾分鐘以內的資料遺失,那麼你可以只使用RDB持久化。

有許多使用者都只使用AOF持久化,但不建議使用這種方式,因為定時產生RDB快照(snapshot)非常便於進行資料庫備份,且RDB 復原資料集的速度也要比AOF恢復的速度要快,除此之外,使用RDB還可以避免AOF程式的bug。

如果你只希望你的資料在伺服器運作的時候存在,你也可以不使用任何持久化方式。

10、Redis持久化資料和快取怎麼做擴容?

如果Redis被當作快取使用,使用一致性雜湊實作動態擴容縮容。

如果Redis被當作一個持久化儲存使用,必須使用固定的keys-to-nodes映射關係,節點的數量一旦確定不能變化。否則的話(即Redis節點需要動態變化的情況),必須使用可以在運行時進行資料再平衡的一套系統,而當前只有Redis叢集可以做到這樣。

四、記憶體相關

14、MySQL裡有2000w數據,redis中只存20w的數據,如何保證redis中的數據都是熱點數據?

redis記憶體資料集大小上升到一定大小的時候,就會施加資料淘汰策略。

15、Redis的記憶體淘汰策略有哪些?

Redis的記憶體淘汰策略是指在Redis的用於快取的記憶體不足時,怎麼處理需要新寫入且需要申請額外空間的資料。

全域的鍵空間選擇性移除

noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯誤。

allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的key。 (這個是最常用的)

allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,隨機移除某個key。

設定過期時間的鍵空間選擇性移除

volatile-lru:當記憶體不足以容納新寫入資料時,在設定了過期時間的按鍵空間中,移除最近最少使用的key。

volatile-random:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,隨機移除某個key。

volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,有更早過期時間的key優先移除。

總結

Redis的記憶體淘汰策略的選取並不會影響過期的key的處理。記憶體淘汰策略用於處理記憶體不足時的需要申請額外空間的資料;過期策略用於處理過期的快取資料。

16、Redis主要消耗什麼實體資源?

記憶體。

17、Redis的記憶體用完了會發生什麼事?

如果達到設定的上限,Redis的寫指令會回傳錯誤訊息(但讀取指令還可以正常回傳。)或是你可以設定記憶體淘汰機制,當Redis達到記憶體上限時會沖刷掉舊的內容。

18、Redis如何做記憶體優化?

可以好好利用Hash,list,sorted set,set等集合類型數據,因為通常情況下很多小的Key-Value可以用更緊湊的方式存放在一起。盡可能使用散列表(hashes),散列表(是說散列表裡面儲存的數少)使用的記憶體非常小,所以你應該盡可能的將你的資料模型抽象化到一個散列表裡面。例如你的web系統中有一個用戶對象,不要為這個用戶的名稱,姓氏,郵箱,密碼設定單獨的key,而是應該把這個用戶的所有資訊儲存到一張散列表裡面。

五、執行緒模型

19、Redis執行緒模型

Redis基於Reactor模式開發了網路事件處理器,這個處理器被稱為文件事件處理器(file event handler)。它的組成結構為4部分:多個套接字、IO多工程式、檔案事件分派器、事件處理器。因為檔案事件分派器佇列的消費是單線程的,所以Redis才叫單線程模型。

檔案事件處理器使用I/O 多重化(multiplexing)程式同時監聽多個套接字, 並根據套接字目前執行的任務來為套接字關聯不同的事件處理器。

當被監聽的套接字準備好執行連接應答(accept)、讀取(read)、寫入(write)、關閉(close)等操作時, 與操作相對應的檔案事件就會產生, 這時檔案事件處理器就會呼叫套接字之前關聯好的事件處理器來處理這些事件。

雖然檔案事件處理器以單執行緒方式運行, 但透過使用I/O 多路復用程式來監聽多個套接字, 檔案事件處理器既實現了高效能的網路通訊模型,又可以很好地與redis 伺服器中其他同樣以單執行緒方式運行的模組進行對接, 這保持了Redis 內部單執行緒設計的簡單性。

六、執行緒模型

19、Redis執行緒模型

Redis基於Reactor模式開發了網路事件處理器,這個處理器稱為文件事件處理器(file event handler)。它的組成結構為4部分:多個套接字、IO多工程式、檔案事件分派器、事件處理器。因為檔案事件分派器佇列的消費是單線程的,所以Redis才叫單線程模型。

檔案事件處理器使用I/O 多重化(multiplexing)程式同時監聽多個套接字, 並根據套接字目前執行的任務來為套接字關聯不同的事件處理器。

當被監聽的套接字準備好執行連接應答(accept)、讀取(read)、寫入(write)、關閉(close)等操作時, 與操作相對應的檔案事件就會產生, 這時檔案事件處理器就會呼叫套接字之前關聯好的事件處理器來處理這些事件。

雖然檔案事件處理器以單執行緒方式運行, 但透過使用I/O 多路復用程式來監聽多個套接字, 檔案事件處理器既實現了高效能的網路通訊模型,又可以很好地與redis 伺服器中其他同樣以單執行緒方式運行的模組進行對接, 這保持了Redis 內部單執行緒設計的簡單性。

七、交易

20、什麼是事務?

交易是一個單獨的隔離操作:事務中的所有指令都會序列化、依序執行。事務在執行的過程中,不會被其他客戶端發送來的命令請求所打斷。

事務是一個原子操作:事務中的指令要麼全部被執行,要麼全部都不執行。

21、Redis事務的概念

#

Redis 交易的本質是透過MULTI、EXEC、WATCH等一組命令的集合。事務支援一次執行多個命令,一個事務中所有命令都會被序列化。在事務執行過程,會依照順序串列化執行佇列中的命令,其他客戶端提交的命令請求不會插入到交易執行命令序列中。

總結說:redis事務就是一次性、順序性、排他性的執行一個佇列中的一系列指令。

22、Redis事務的三個階段

命令入隊

交易執行EXEC

事務執行過程中,如果服務端收到有EXEC、DISCARD、WATCH、MULTI以外的請求,則會把請求放入隊列中排隊。

23、Redis交易相關指令

Redis交易功能是透過MULTI、EXEC、DISCARD和WATCH 四個原語實現的。

Redis會將一個交易中的所有指令序列化,然後依序執行。

1)

redis 不支援回滾,“Redis 在交易失敗時不進行回滾,而是繼續執行餘下的命令”, 所以 Redis 的內部可以保持簡單且快速。

2)

如果在一個交易中的指令出現錯誤,那麼所有的指令都不會執行;

.3)

如果在一個事務中出現運行錯誤,那麼正確的命令就會被執行。

WATCH 指令是一個樂觀鎖,可以為 Redis 交易提供 check-and-set (CAS)行為。可以監控一個或多個鍵,一旦其中有一個鍵被修改(或刪除),之後的事務就不會執行,監控一直持續到EXEC指令。

MULTI指令用來開啟一個事務,它總是回傳OK。 MULTI執行之後,客戶端可以繼續向伺服器發送任意多條命令,這些命令不會立即被執行,而是被放到一個佇列中,當EXEC命令被呼叫時,所有佇列中的命令才會被執行。

EXEC:執行所有事務區塊內的命令。傳回事務區塊內所有指令的回傳值,依指令執行的先後順序排列。當操作被打斷時,傳回空值 nil 。

透過呼叫DISCARD,客戶端可以清空交易佇列,並放棄執行事務, 且客戶端會從交易狀態中退出。

UNWATCH指令可以取消watch對所有key的監控。

24、事務管理(ACID)概述

原子性(Atomicity):

原子性是指事務是一個不可分割的工作單位,事務中的操作要么都發生,要么都不發生。

一致性(Consistency):

事務前後資料的完整性必須保持一致。

隔離性(Isolation):

多個交易並發執行時,一個交易的執行不應影響其他交易的執行。

持久性(Durability):

持久性是指一個交易一旦被提交,它對資料庫中資料的改變就是永久性的,接下來即使資料庫發生故障也不應該對其有任何影響

Redis的事務總是具有ACID中的一致性和隔離性,

其他特性是不支援的。當伺服器運行在AOF持久化模式下,且appendfsync選項的值為always時,交易也具有耐久性。

25、Redis交易支援隔離性嗎?

Redis 是單一進程程序,並且它保證在執行事務時,不會對事務進行中斷,事務可以運行直到執行完所有事務佇列中的命令為止。因此,Redis 的事務是總是帶有隔離性的。

26、Redis事務保證原子性嗎,支援回滾嗎?在

Redis中,單一指令是原子性執行的,但交易不保證原子性,且沒有回滾。事務中任意指令執行失敗,其餘的指令仍會被執行。

27、Redis事務其他實作

基於Lua腳本,Redis可以保證腳本內的命令一次性、按順序地執行,同時也不提供事務運行錯誤的回滾,執行過程中如果部分命令運行錯誤,剩下的命令還是會繼續運行完

基於中間標記變量,通過另外的標記變量來標識事務是否執行完成,讀取數據時先讀取該標記變數判斷是否事務執行完成。但這會需要額外寫程式碼實現,比較繁瑣。

八、叢集方案

28、哨兵模式

2023年最新版 68道Redis面試題(收藏)

哨兵的介紹:

sentinel,中文名是哨兵。哨兵是 redis 叢集機構中非常重要的一個元件,主要有以下功能:

叢集監控

:負責監控 redis master 和 slave 流程是否正常運作。

訊息通知

:如果某個 redis 實例有故障,那麼哨兵負責發送訊息作為警報通知給管理員。

故障轉移

:如果 master node 掛掉了,就會自動轉移到 slave node 上。 ###

設定中心:如果故障轉移發生了,通知 client 用戶端新的 master 位址。

哨兵用來實作 redis 叢集的高可用,本身也是分散式的,作為一個哨兵叢集去運行,互相協同工作。

故障轉移時,判斷一個 master node 是否宕機了,需要大部分的哨兵都同意才行,涉及到了分散式選舉的問題。

即使部分哨兵節點掛掉了,哨兵集群還是能正常工作的,因為如果一個作為高可用機制重要組成部分的故障轉移系統本身是單點的,那就很坑爹了。

哨兵的核心知識

哨兵至少需要 3 個實例,來確保自己的健全性。

哨兵 redis 主從的部署架構,是不保證資料零遺失的,只能保證 redis 叢集的高可用性。

對於哨兵 redis 主從這種複雜的部署架構,盡量在測試環境和生產環境,都進行充足的測試和演練。

29、官方Redis Cluster 方案(服務端路由查詢)

2023年最新版 68道Redis面試題(收藏)

#redis 叢集模式的工作原理能說一下麼?在叢集模式下,redis 的 key 是如何定址的?分散式尋址都有哪些演算法?了解一致性 hash 演算法嗎?

簡介

Redis Cluster是一種服務端Sharding技術,3.0版本開始正式提供。 Redis Cluster並沒有使用一致性hash,而是採用slot(槽)的概念,總共分成16384個槽。將請求傳送到任意節點,接收到請求的節點會將查詢請求傳送到正確的節點上執行

#方案說明

透過哈希的方式,將數據分片,每個節點均分儲存一定哈希槽(哈希值)區間的數據,預設分配了16384 個槽位

每份數據分片會儲存在多個互為主從的多節點上

資料寫入先寫主節點,再同步到從節點(支援配置為阻塞同步)

同一分片多個節點間的資料不保持一致性

讀取資料時,當客戶端操作的key沒有被指派在該節點上時,redis會回傳轉向指令,指向正確的節點

擴充時需要需要把舊節點的資料遷移一部分到新節點

在redis cluster 架構下,每個redis 要放開兩個連接埠號,例如一個是6379,另外一個就是加1w 的連接埠號,例如16379。

16379 埠號是用來進行節點間通訊的,也就是 cluster bus 的東西,cluster bus 的通信,用來進行故障偵測、設定更新、故障轉移授權。 cluster bus 用了另外一種二進位的協議,gossip 協議,用於節點間進行高效的資料交換,佔用更少的網路頻寬和處理時間。

節點間的內部通訊機制

(基本通訊原理)叢集元資料的維護有兩種方式:集中式、Gossip 協定。 redis cluster 節點間採用 gossip 協定進行通訊。

分散式定址演算法

hash 演算法(大量快取重建)

一致性hash 演算法(自動快取遷移) 虛擬節點(自動負載均衡)

redis cluster 的hash slot 演算法

#優點

無中心架構,支援動態擴容,對業務透明

#具備Sentinel的監控與自動Failover(故障轉移)能力

客戶端不需要連接叢集所有節點,連線叢集中任何一個可用節點即可

高效能,客戶端直連redis服務,免去了proxy代理的損耗

缺點

運維也很複雜,資料遷移需要人工幹預

只能使用0號資料庫

不支援批量操作(pipeline管道操作)

分散式邏輯和儲存模組耦合等

30、基於客戶端分配

2023年最新版 68道Redis面試題(收藏)

簡介

Redis Sharding是Redis Cluster出來之前,業界普遍使用的多Redis實例叢集方法。其主要想法是採用雜湊演算法將Redis資料的key進行雜湊,透過hash函數,特定的key會映射到特定的Redis節點上。 Java redis客戶端驅動jedis,支援Redis Sharding功能,即ShardedJedis以及結合快取池的ShardedJedisPool

優點

##優點在於非常簡單,服務端的Redis實例彼此獨立,相互無關聯,每個Redis實例像單一伺服器一樣運行,非常容易線性擴展,系統的靈活性很強

缺點

由於sharding處理放到客戶端,規模進一步擴大時為運維帶來挑戰。

客戶端sharding不支援動態增刪節點。服務端Redis實例群拓樸結構有變化時,每個客戶端都需要更新調整。連線不能共享,當應用程式規模增加時,資源浪費限制優化

31、基於代理伺服器分片#

2023年最新版 68道Redis面試題(收藏)

簡介

客戶端發送請求到一個代理元件,代理解析客戶端的數據,並將請求轉發至正確的節點,最後將結果回覆給客戶端

特徵

透明接入,業務程式不用關心後端Redis實例,切換成本低

Proxy 的邏輯和儲存的邏輯是隔離的

代理層多了一次轉發,效能有所損耗

#業界開源方案

Twtter開源的Twemproxy

豌豆莢開源的Codis

32、Redis 主從架構

單機的redis,能夠承載的QPS 大概就在上萬到幾萬不等。對於快取來說,一般都是用來支撐讀高並發的。因此架構做成主從(master-slave)架構,一主多從,主負責寫,並且將資料複製到其它的 slave 節點,從節點負責讀取。所有的讀取請求全部走從節點。這樣也可以很輕鬆達到水平擴容,支撐讀高並發。

2023年最新版 68道Redis面試題(收藏)

redis replication -> 主從架構-> 讀寫分離-> 水平擴容支撐讀高並發

redis replication 的核心機制

redis 採用非同步方式複製資料到slave 節點,不過redis2.8 開始,slave node 會週期性地確認自己每次複製的資料量;

一個master node 是可以配置多個slave node 的;

slave node 也可以連接其他的slave node;

slave node 做複製的時候,不會block master node 的正常工作;

slave node 在做複製的時候,也不會block 對自己的查詢操作,它會用舊的資料集來提供服務;但是複製完成的時候,需要刪除舊資料集,載入新資料集,這個時候就會暫停對外服務了;

slave node 主要用來進行橫向擴容,做讀寫分離,擴容的slave node 可以提高讀取的吞吐量。

注意,如果採用了主從架構,那麼建議必須開啟master node 的持久化,不建議用slave node 作為master node 的資料熱備,因為那樣的話,如果你關掉master 的持久化,可能在master 宕機重啟的時候資料是空的,然後可能一經過複製, slave node 的資料也丟了。

另外,master 的各種備份方案,也需要做。萬一地的所有檔案遺失了,從備份中挑選一份rdb 去恢復master,這樣才能確保啟動的時候,是有資料的,即使採用了後續講解的高可用機制,slave node可以自動接管master node,但也可能sentinel 還沒偵測到master failure,master node 就自動重新啟動了,還是可能導致上面所有的slave node 資料被清空。

redis 主從複製的核心原理

當啟動一個 slave node 的時候,它會發送一個 PSYNC 指令給 master node。

如果這是 slave node 初次連接到 master node,那麼會觸發一次 full resynchronization 全量複製。此時 master 會啟動一個後台執行緒,開始產生一份 RDB 快照檔案。

同時也會將從客戶端 client 新收到的所有寫入指令快取在記憶體中。 RDB 檔案產生完畢後, master 會將這個 RDB 傳送給 slave,slave 會先寫入本機磁碟,然後再從本機磁碟載入到記憶體。

接著 master 會將記憶體中快取的寫入指令傳送到 slave,slave 也會同步這些資料。

slave node 如果跟 master node 有網路故障,斷開了連接,會自動重連,連接之後 master node 僅會複製給 slave 部分缺少的資料。

2023年最新版 68道Redis面試題(收藏)

流程原理

當從函式庫和主函式庫建立MS關係後,會向主資料庫傳送SYNC指令

主庫接收到SYNC命令後會開始在背景保存快照(RDB持久化過程),並將期間接收到的寫命令緩存起來

#當快照完成後,主Redis會將快照文件和所有快取的寫命令發送給從Redis

從Redis接收到後,會載入快照檔案並且執行收到的快取的命令

之後,主Redis每當接收到寫指令時就會將指令傳送從Redis,從而確保資料的一致

缺點

#所有的slave節點資料的複製和同步都由master節點來處理,會照成master節點壓力太大,使用主從結構來解決

33、Redis叢集的主從複製模型是怎樣的?

為了使在部分節點失敗或大部分節點無法通訊的情況下叢集仍然可用,所以叢集使用了主從複製模型,每個節點都會有N-1個複製品

34、生產環境中的redis 是怎麼部署的?

redis cluster,10 台機器,5 台機器部署了redis 主實例,另外5 台機器部署了redis 的從實例,每個主實例掛了一個從實例,5 個節點對外提供讀寫服務,每個節點的讀寫高峰qps可能可以達到每秒5 萬,5 台機器最多是25 萬讀寫請求/s。

機器是什麼配置? 32G 內存 8 核 CPU 1T 磁盤,但是分配給 redis 進程的是10g內存,一般線上生產環境,redis 的內存盡量不要超過 10g,超過 10g 可能會有問題。

5 台機器對外提供讀寫,總共有 50g 記憶體。

因為每個主實例都掛了一個從實例,所以是高可用的,任何一個主實例宕機,都會自動故障遷移,redis 從實例會自動變成主實例繼續提供讀寫服務。

你往記憶體裡寫的是什麼資料?每條數據的大小是多少?商品數據,每個數據是 10kb。 100 筆資料是 1mb,10 萬筆資料是 1g。常駐記憶體的是 200 萬條商品數據,佔用記憶體是 20g,僅不到總記憶體的 50%。目前高峰期每秒就是 3500 左右的請求量。

其實大型的公司,會有基礎架構的 team 負責快取叢集的運維。

35、說Redis哈希槽的概念?

Redis集群並沒有使用一致性hash,而是引入了哈希槽的概念,Redis集群有16384個哈希槽,每個key透過CRC16校驗後對16384取模來決定放置哪個槽,叢集的每個節點負責一部分hash槽。

36、Redis叢集會有寫入操作遺失嗎?為什麼?

Redis並不能保證資料的強一致性,這意味著這在實際中叢集在特定的條件下可能會遺失寫入操作。

37、Redis叢集之間是如何複製的?

非同步複製

38、Redis叢集最大節點個數是多少?

16384個

39、Redis叢集如何選擇資料庫?

Redis叢集目前無法做資料庫選擇,預設在0資料庫。

九、分區

40、Redis是單執行緒的,如何提高多核心CPU的使用率?

可以在同一個伺服器部署多個Redis的實例,並把他們當作不同的伺服器來使用,在某些時候,無論如何一個伺服器是不夠的, 所以,如果你想使用多個CPU,你可以考慮一下分片(shard)。

41、為什麼要做Redis分割區?

分割區可以讓Redis管理更大的內存,Redis將可以使用所有機器的記憶體。如果沒有分區,你最多只能使用一台機器的記憶體。分區使Redis的運算能力透過簡單地增加電腦而成倍提升,Redis的網路頻寬也會隨著電腦和網路卡的增加而成倍增長。

42、你知道有哪些Redis分割區實作方案?

客戶端分區就是在客戶端就已經決定資料會被儲存到哪個redis節點或從哪個redis節點讀取。大多數客戶端已經實現了客戶端分區。

代理分區 表示客戶端將請求傳送給代理,然後代理決定去哪個節點寫資料或讀取資料。代理根據分區規則決定要要求哪些Redis實例,然後根據Redis的回應結果傳回給客戶端。 redis和memcached的一種代理實作就是Twemproxy

查詢路由(Query routing) 的意思是客戶端隨機地請求任一個redis實例,然後由Redis將請求轉送給正確的Redis節點。 Redis Cluster實作了一種混合形式的查詢路由,但並不是直接將請求從一個redis節點轉送到另一個redis節點,而是在客戶端的幫助下直接redirected到正確的redis節點。

43、Redis分割區有什麼缺點?

涉及多個key的操作通常不會被支援。例如你不能對兩個集合求交集,因為他們可能被儲存到不同的Redis實例(實際上這種情況也有辦法,但是不能直接使用交集指令)。

同時操作多個key,則不能使用Redis事務.

分區使用的粒度是key,不能使用一個非常長的排序key存儲一個資料集(The partitioning granularity is the key , so it is not possible to shard a dataset with a single huge key like a very big sorted set)

當使用分區的時候,資料處理會非常複雜,例如為了備份你必須從不同的Redis實例和主機同時收集RDB / AOF檔。

分割區時動態擴容或縮容可能非常複雜。 Redis叢集在執行時增加或刪除Redis節點,能做到最大程度對使用者透明地資料再平衡,但其他一些客戶端分割區或代理分割區方法則不支援此特性。然而,有一種預分片的技術也可以較好的解決這個問題。

十、分散式問題

44、Redis實作分散式鎖定

Redis為單一進程單執行緒模式,採用佇列模式將並發訪問變成串行訪問,且多客戶端對Redis的連接並不存在競爭關係Redis中可以使用SETNX命令實現分散式鎖定。

當且僅當 key 不存在,將 key 的值設為 value。若給定的 key 已經存在,則 SETNX 不做任何動作。

SETNX 是『SET if Not eXists』(如果不存在,則 SET)的簡寫。

傳回值:設定成功,回傳 1 。設定失敗,返回 0 。

2023年最新版 68道Redis面試題(收藏)

使用SETNX完成同步鎖定的流程及事項如下:

使用SETNX指令取得鎖定,若傳回0(key已存在,鎖已存在)則獲取失敗,反之獲取成功。

為了防止取得鎖定後程式出現異常,導致其他執行緒/進程呼叫SETNX指令總是回傳0而進入死鎖狀態,需要為該key設定一個「合理」的過期時間。

釋放鎖定,使用DEL指令將鎖定資料刪除。

45、如何解決Redis 的並發競爭Key 問題

#所謂Redis 的並發競爭Key 的問題也就是多個系統同時對一個key 進行操作,但是最後執行的順序和我們期望的順序不同,這也導致了結果的不同!

推薦一種方案:分散式鎖定(zookeeper 和 redis 都可以實作分散式鎖定)。 (如果不存在 Redis 的並發競爭 Key 問題,不要使用分散式鎖,這會影響效能)

基於zookeeper臨時有序節點可以實現的分散式鎖定。大致觀念為:每個客戶端對某個方法加鎖時,在zookeeper上的與該方法對應的指定節點的目錄下,產生一個唯一的瞬時有序節點。判斷是否取得鎖的方式很簡單,只需要判斷有序節點中序號最小的一個。當釋放鎖的時候,只要將這個瞬時節點刪除即可。同時,其可以避免服務宕機導致的鎖無法釋放,而產生的死鎖問題。完成業務流程後,刪除對應的子節點釋放鎖定。

在實踐中,當然是從以可靠性為主。所以首推Zookeeper。

46、分散式Redis是前期做還是後期尺度上來了再做好?為什麼?

既然Redis是如此的輕量(單一實例只使用1M記憶體),為防止以後的擴容,最好的方法就是一開始就啟動較多實例。即便你只有一台伺服器,你也可以一開始就讓Redis以分散式的方式運行,使用分區,在同一台伺服器上啟動多個實例。

一開始就多設定幾個Redis實例,例如32或64個實例,對大多數使用者來說這操作起來可能比較麻煩,但是從長久來看做這點犧牲是值得的。

這樣的話,當你的資料不斷成長,需要更多的Redis伺服器時,你需要做的就是僅僅將Redis實例從一個服務遷移到另外一台伺服器而已(而不用考慮重新分區的問題)。一旦你增加了另一台伺服器,你需要將你一半的Redis實例從第一台機器遷移到第二台機器。

47、什麼是RedLock

Redis 官方站提出了一種權威的基於Redis 實現分散式鎖的方式名叫Redlock,此種方式比原先的單節點的方法比較安全。它可以確保以下特性:

安全特性:互斥訪問,即永遠只有一個client 能拿到鎖

避免死鎖:最後client 都可能拿到鎖,不會出現死鎖的情況,即使原本鎖住某資源的client crash 了或出現了網路分割區

容錯性:只要大部分Redis節點存活就可以正常提供服務

十一、快取異常

48、快取雪崩

快取雪崩是指快取相同時間大面積的失效,所以,後面的請求都會落到資料庫上,造成資料庫短時間內承受大量請求而崩掉。

解決方案:

快取資料的過期時間設定隨機,防止在同一時間大量資料過期現象發生。

一般並發量不是特別多的時候,使用最多的解決方案是加鎖排隊。

為每一個快取資料增加對應的快取標記,記錄快取的是否失效,如果快取標記失效,則更新資料快取。

49、快取穿透

快取穿透是指快取和資料庫中都沒有的數據,導致所有的請求都落到資料庫上,造成資料庫短時間內承受大量請求而崩掉。

解決方案:

介面層增加校驗,如使用者鑑權校驗,id做基礎校驗,id

從緩訪問不到的數據,在資料庫中也沒有取到,這時也可以將key-value對寫為key-null,快取有效時間可以設定短點,如30秒(設定太長會導致正常情況也沒辦法使用)。這樣可以防止攻擊用戶重複用同一個id暴力攻擊

採用布隆過濾器,將所有可能存在的資料哈希到一個足夠大的bitmap 中,一個一定不存在的資料會被這個bitmap攔截掉,從而避免了對底層儲存系統的查詢壓力

#附加:

#

對於空間的利用到達了一種極致,那就是Bitmap和布隆過濾器(Bloom Filter)。

Bitmap:典型的就是雜湊表

缺點是,Bitmap對於每個元素只能記錄1bit訊息,如果還想完成額外的功能,恐怕只能靠犧牲更多的空間、時間來完成了。

布隆過濾器(建議)

就是引入了k(k>1)k(k>1)個相互獨立的雜湊函數,保證在在給定的空間、誤判率下,完成元素判重的過程。

它的優點是空間效率和查詢時間都遠遠超過一般的演算法,缺點是有一定的誤辨識率和刪除困難。

Bloom-Filter演算法的核心思想就是利用多個不同的Hash函數來解決「衝突」。

Hash存在一個衝突(碰撞)的問題,而用同一個Hash得到的兩個URL的值有可能相同。為了減少衝突,我們可以多引入幾個Hash,如果透過其中的一個Hash值我們得到某元素不在集合中,那麼該元素肯定不在集合中。只有在所有的Hash函數告訴我們該元素在集合中時,才能確定該元素存在於集合中。這便是Bloom-Filter的基本思想。

Bloom-Filter一般用於在大資料量的集合中判定某元素是否存在。

50、快取擊穿

快取擊穿是指快取中沒有但資料庫中有的資料(一般是快取時間到期),這時由於並發用戶特別多,同時讀緩存沒讀到數據,又同時去數據庫去取數據,引起數據庫壓力瞬間增大,造成過大壓力。和快取雪崩不同的是,快取擊穿指並發查同一條數據,快取雪崩是不同數據都過期了,很多數據都查不到從而查資料庫。

解決方案

設定熱點資料永遠不會過期。

加上互斥鎖,互斥鎖

51、快取預熱

快取預熱就是系統上線後,將相關的快取數據直接加載到快取系統。這樣就可以避免在用戶請求的時候,先查詢資料庫,然後再將資料快取的問題!使用者直接查詢事先被預熱的快取資料!

解決方案:

直接寫個快取刷新頁面,上線時手動操作一下;

資料量不大,可以在專案啟動的時候自動進行載入;

定時刷新快取;

52、快取降級

當訪問量劇增、服務出現問題(如回應時間慢或不回應)或非核心服務影響到核心流程的效能時,仍需要保證服務還是可用的,即使是有損服務。系統可以根據一些關鍵資料進行自動降級,也可以配置開關來實現人工降級。 、

快取降級的最終目的是確保核心服務可用,即使是有損的。而且有些服務是無法降級的(如加入購物車、結算)。

在進行降級之前要對系統進行梳理,看看系統是否可以丟卒保帥;從而梳理出哪些必須誓死保護,哪些可降級;比如可以參考日誌級別設置預案:

一般:例如有些服務偶爾因為網路抖動或服務正在上線而超時,可以自動降級;

警告:有些服務在一段時間內成功率有波動(如在95~100%之間),可以自動降級或人工降級,並發送警告;

錯誤:例如可用率低於90%,或者資料庫連接池被打爆了,或是訪問量突然激增到系統能承受的最大閥值,此時可以根據情況自動降級或人工降級;

嚴重錯誤:例如因為特殊原因資料錯誤了,此時需要緊急人工降級。

服務降級的目的,是為了防止Redis服務故障,導致資料庫跟著一起發生雪崩問題。因此,對於不重要的快取數據,可以採取服務降級策略,例如一個比較常見的做法就是,Redis出現問題,不去資料庫查詢,而是直接傳回預設值給使用者。

53、熱點數據和冷數據

熱點數據,快取才有價值。

對於冷資料而言,大部分資料可能還沒有再次訪問到就已經被擠出內存,不僅佔用內存,而且價值不大。頻繁修改的數據,看情況考慮使用緩存

對於熱點數據,例如我們的某IM產品,生日祝福模組,當天的壽星列表,緩存以後可能讀取數十萬次。再舉個例子,某導航產品,我們將導航訊息,快取以後可能讀取數百萬次。

資料更新前至少讀取兩次,快取才有意義。這個是最基本的策略,如果快取還沒起作用就失效了,那就沒有太大價值了。

那存不存在,修改頻率很高,但又得考慮快取的場景呢?有!例如,這個讀取介面對資料庫的壓力很大,但是又是熱點數據,這個時候就需要考慮透過快取手段,減少資料庫的壓力,例如我們的某助手產品的,點讚數,收藏數,分享數等是非常典型的熱點數據,但又不斷變化,此時就需要將數據同步保存到Redis緩存,減少資料庫壓力。

54、快取熱點key

快取中的一個Key(例如促銷商品),在某個時間點過期的時候,剛好在這個時間點對這個Key有大量的並發請求過來,這些請求發現緩存過期一般都會從後端DB加載資料並回設到緩存,這個時候大並發的請求可能會瞬間把後端DB壓垮。

解決方案:

對快取查詢加鎖,如果KEY不存在,就加鎖,然後查DB入緩存,然後解鎖;其他行程如果發現有鎖定就等待,然後等解鎖後回傳資料或是進入DB查詢

常用工具

#55、Redis支援的Java客戶端都有哪些?官方推薦用哪一個?

Redisson、Jedis、lettuce等等,官方推薦使用Redisson。

56、Redis和Redisson有什麼關係?

Redisson是一個高階的分散式協調Redis客服端,能幫助使用者在分散式環境中輕鬆實作一些Java的物件(Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map , ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

57、Jedis與Redisson對比有什麼優缺點?

Jedis是Redis的Java實現的客戶端,其API提供了比較全面的Redis指令的支援;Redisson實作了分散式和可擴展的Java資料結構,和Jedis相比,功能較為簡單,不支援字串操作,不支援排序、事務、管道、分區等Redis特性。 Redisson的宗旨是促進使用者對Redis的關注分離,從而讓使用者能夠將精力更集中地放在處理業務邏輯上

其他問題

##58、Redis與Memcached的差異

兩者都是非關聯式記憶體鍵值資料庫,現在公司一般都是用Redis 來實現緩存,而且Redis 本身也越來越強大了! Redis 與Memcached 主要有以下不同:

2023年最新版 68道Redis面試題(收藏)

(1) memcached所有的值都是簡單的字串,redis作為其替代者,支援更為豐富的資料類型

(2) redis的速度比memcached快很多

(3) redis可以持久化其資料

59、如何保證快取與資料庫雙寫時的數據一致性?

你只要用緩存,就可能會牽涉到快取與資料庫雙儲存雙寫,你只要是雙寫,就一定會有資料一致性的問題,那麼你如何解決一致性問題?

一般來說,就是如果你的系統不是嚴格要求快取資料庫必須一致性的話,快取可以稍微的跟資料庫偶爾有不一致的情況,最好不要做這個方案,讀請求和寫請求串行化,串到一個記憶體佇列裡去,這樣就可以保證一定不會出現不一致的情況

串行化之後,就會導致系統的吞吐量會大幅度的降低,用比正常情況下多幾倍的機器去支撐線上的一個請求。

還有一種方式就是可能會暫時產生不一致的情況,但是發生的幾率特別小,就是先更新資料庫,然後再刪除快取。

2023年最新版 68道Redis面試題(收藏)

60、Redis常見效能問題和解決方案?

Master最好不要做任何持久化工作,包括記憶體快照和AOF日誌文件,特別是不要啟用記憶體快照做持久化。

如果資料比較關鍵,某個Slave開啟AOF備份數據,策略為每秒同步一次。

為了主從複製的速度和連接的穩定性,Slave和Master最好在同一個區域網路內。

盡量避免在壓力較大的主庫上增加從庫

Master調用BGREWRITEAOF重寫AOF文件,AOF在重寫的時候會佔大量的CPU和記憶體資源,導致服務load過高,出現短暫服務暫停現象。

為了Master的穩定性,主從複製不要用圖狀結構,用單向鍊錶結構更穩定,即主從關係為:Master

61、Redis官方為什麼不提供Windows版本?

因為目前Linux版本已經相當穩定,而且使用者量很大,無需開發windows版本,反而會帶來相容性等問題。

62、一個字串類型的值能儲存最大容量是多少?

512M

63、Redis如何做大量資料插入?

Redis2.6開始redis-cli支援一種新的被稱為pipe mode的新模式用於執行大量資料插入工作。

64、假如Redis裡面有1億個key,其中有10w個key是以某個固定的已知的前綴開頭的,如果將它們全部找出來?

使用keys指令可以掃出指定模式的key清單。

對方接著追問:如果這個redis正在為線上的業務提供服務,那使用keys指令會有什麼問題?

這時候你要回答redis關鍵的一個特性:redis的單線程的。 keys指令會導致執行緒阻塞一段時間,線上服務會停頓,直到指令執行完畢,服務才能恢復。這時候可以使用scan指令,scan指令可以無阻塞的提取出指定模式的key列表,但是會有一定的重複機率,在客戶端做一次去重就可以了,但是整體所花費的時間會比直接用keys指令長。

65、使用Redis做過非同步佇列嗎,是如何實現的?

使用list類型保存資料訊息,rpush生產訊息,lpop消費訊息,當lpop沒有訊息時,可以sleep一段時間,然後再檢查有沒有訊息,如果不想sleep的話,可以使用blpop , 在沒有訊息的時候,會一直阻塞,直到訊息的到來。 redis可以透過pub/sub主題訂閱模式實現一個生產者,多個消費者,當然也存在一定的缺點,當消費者下線時,生產的訊息會遺失。

66、Redis如何實作延時佇列?

使用sortedset,使用時間戳做score, 訊息內容作為key,呼叫zadd來生產訊息,消費者使用zrangbyscore取得n秒之前的資料做輪詢處理。

67、Redis回收進程如何運作的?

一個客戶端運行了新的命令,新增了新的資料。

Redis檢查記憶體使用情況,如果大於maxmemory的限制, 則根據設定好的策略進行回收。

一個新的指令被執行,等等。

所以我們不斷地穿越記憶體限制的邊界,透過不斷達到邊界然後不斷地回收回到邊界以下。

如果一個指令的結果導致大量記憶體被使用(例如很大的集合的交集保存到一個新的鍵),不用多久記憶體限制就會被這個記憶體使用量超越。

68、Redis回收使用的是什麼演算法?

LRU演算法。

好了,Redis面試題就分享到這裡,如果對你有幫助的話,請「按個讚」鼓勵一下哦~

#

以上是2023年最新版 68道Redis面試題(收藏)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn