Heim  >  Artikel  >  Datenbank  >  So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis

So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis

WBOY
WBOYnach vorne
2023-05-26 11:47:411452Durchsuche

Request/Response-Protokolle und RTT

Redis ist ein TCP-Dienst im Client-Server-Modus, der auch als Implementierung des Request/Response-Protokolls bezeichnet wird. client-server模式的TCP服务,也被称为Request/Response协议的实现。

So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis

这意味着通常一个请求的完成是遵循下面两个步骤:

  • Client发送一个操作命令给Server,从TCP的套接字Socket中读取Server的响应值,通常来说这是一种阻塞的方式

  • Server执行操作命令,然后将响应值返回给Client

举个例子

Client: INCR X
Server: 1
Client: INCR X
Server: 2
Client: INCR X
Server: 3
Client: INCR X
Server: 4

Clients和Servers是通过网络进行连接。网络连接速度可能会快得很快(例如本地回环网络)或者慢得很慢(例如跨越多个主机的网络)。不管网络怎么样,一个数据包从Client到Server,然后相应值又从Server返回Client都需要一定的时间。

这个时间被称为RTT(Round Trip Time)。当一个Client需要执行多个连续请求(比如添加许多个元素到一个list中,或者清掉Redis中许多个键值对),那么RTT是怎样影响到性能的呢?这个也是很方便去计算的。比如如果RTT的时间为250ms(假设互联网连接速度非常慢),即使Server可以每秒处理100k个请求,那么最多也只能接受每秒4个请求。

如果是回环网络,RTT将会特别的短(比如作者的127.0.0.1,RTT的响应时间为44ms),但是对于执行连续多次写操作时,也是一笔不小的消耗。

其实我们有其他办法来降低这种场景的消耗,开心不?惊喜不?

Redis Pipelining

在一个Request/Response方式的服务中有一个特性:即使Client没有收到之前的响应值,也可以继续发送新的请求。这种特性意味着我们可以不需要等待Server的响应,可以率先发送许多操作命令给Server,然后在一次性读取Server的所有响应值。

这种方式被称为Pipelining技术,该技术近几十年来被广泛的使用。比如多POP3协议的实现就支持这个特性,大大的提升了从server端下载新的邮件的速度。

Redis在很早的时候就支持该项技术,所以不管你运行的是什么版本,你都可以使用pipelining技术,比如这里有一个使用 netcat 工具的:

$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
+PONG
+PONG
+PONG

现在我们不需要为每一次请求付出RTT的消耗了,而是一次性发送三个操作命令。为了便于直观的理解,还是拿之前的说明,使用pipelining技术该的实现顺序如下:

Client: INCR X
Client: INCR X
Client: INCR X
Client: INCR X
Server: 1
Server: 2
Server: 3
Server: 4

划重点(敲黑板):当client使用pipelining发送操作命令时,server端将强制使用内存来排列响应结果。所以在使用pipelining发送大量的操作命令的时候,最好确定一个合理的命令条数,一批一批的发送给Server端,比如发送10k个操作命令,读取响应结果,再发送10k个操作命令,以此类推…虽然说耗时近乎相同,但是额外的内存消耗将是这10k操作命令的排列响应结果所需的最大值。(为防止内存耗尽,选择一个合理的值)

It’s not just a matter of RTT

Pipelining不是减少因为 RTT 造成消耗的唯一方式,但是它确实帮助你极大的提升每秒的执行命令数量。事实的真相是:从访问相应的数据结构并且生成答复结果的角度来看,不使用pipelining确实代价很低;但是从套接字socket I/O的角度来看,恰恰相反。因为这涉及到了read()write()调用,需要从用户态切换到内核态。这种上下文切换会特别损耗时间的。

一旦使用了pipelining技术,很多操作命令将会从同一个read()调用中执行读操作,大量的答复结果将会被分发到同一个write()调用中执行写操作。基于此,随着管道的长度增加,每秒执行的查询数量最开始几乎呈直线型增加,直到不使用pipelining技术的基准的10倍,如下图: 

So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis

Some real world code example

不翻译,基本上就是说使用了pipelining

So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis🎜🎜Das bedeutet, dass eine Anfrage normalerweise durch Befolgen der folgenden zwei Schritte abgeschlossen wird: 🎜
  • 🎜Der Client sendet einen Betriebsbefehl an den Server und liest den Server vom TCP-Socket Socket Der Antwortwert, normalerweise ist dies eine Blockierungsmethode🎜
  • 🎜Der Server führt den Betriebsbefehl aus und gibt dann den Antwortwert an den Client zurück🎜
🎜Zum Beispiel🎜
FOR-ONE-SECOND:
    Redis.SET("foo","bar")
END
🎜Clients und Server sind über das Netzwerk verbunden. Netzwerkverbindungen können sehr schnell (z. B. ein lokales Loopback-Netzwerk) oder sehr langsam (z. B. ein Netzwerk, das mehrere Hosts umfasst) sein. Egal wie das Netzwerk beschaffen ist, es dauert eine gewisse Zeit, bis ein Datenpaket vom Client zum Server gelangt und dann der entsprechende Wert vom Server an den Client zurückgegeben wird. 🎜🎜Diese Zeit wird RTT (Round Trip Time) genannt. Wie wirkt sich RTT auf die Leistung aus, wenn ein Client mehrere aufeinanderfolgende Anforderungen ausführen muss (z. B. das Hinzufügen vieler Elemente zu einer Liste oder das Löschen vieler Schlüssel-Wert-Paare in Redis)? Dies ist auch sehr bequem zu berechnen. Wenn die RTT-Zeit beispielsweise 250 ms beträgt (vorausgesetzt, die Internetverbindung ist sehr langsam), kann der Server, selbst wenn er 100.000 Anfragen pro Sekunde verarbeiten kann, höchstens 4 Anfragen pro Sekunde akzeptieren. 🎜🎜Wenn es sich um ein Loopback-Netzwerk handelt, ist die RTT besonders kurz (z. B. 127.0.0.1 des Autors, die RTT-Antwortzeit beträgt 44 ms), aber es ist auch ein erheblicher Aufwand, wenn mehrere aufeinanderfolgende Schreibvorgänge ausgeführt werden. 🎜🎜Tatsächlich haben wir in diesem Szenario andere Möglichkeiten, den Verbrauch zu reduzieren. Sind Sie zufrieden? Überraschung? 🎜🎜Redis Pipelining🎜🎜Es gibt eine Funktion in einem Request/Response-Dienst: Auch wenn der Client den vorherigen Antwortwert nicht erhält, kann er weiterhin neue Anfragen senden. Diese Funktion bedeutet, dass wir nicht auf die Antwort des Servers warten müssen. Wir können zuerst viele Betriebsbefehle an den Server senden und dann alle Antwortwerte des Servers auf einmal lesen. 🎜🎜Diese Methode wird als Pipelining-Technologie bezeichnet und ist in den letzten Jahrzehnten weit verbreitet. Beispielsweise unterstützt die Implementierung mehrerer POP3-Protokolle diese Funktion, was die Geschwindigkeit beim Herunterladen neuer E-Mails vom Server erheblich verbessert. 🎜🎜Redis hat diese Technologie schon sehr früh unterstützt, sodass Sie die Pipelining-Technologie verwenden können, egal welche Version Sie verwenden. Hier ist beispielsweise eine mit dem Netcat-Tool: 🎜rrreee🎜Jetzt nein Sie müssen nicht mehr RTT für jede Anfrage bezahlen, sondern senden drei Betriebsbefehle gleichzeitig. Um das intuitive Verständnis zu erleichtern, nehmen wir die vorherigen Anweisungen. Die Implementierungssequenz für die Verwendung der pipelining-Technologie ist wie folgt: 🎜rrreee🎜Schwerpunkt (klopfen Sie an die Tafel): Wenn der Client pipelining verwendet zum Senden Bei der Ausführung eines Befehls erzwingt die Serverseite die Verwendung von Speicher zum Ordnen der Antwortergebnisse. Wenn Sie daher Pipelining zum Senden einer großen Anzahl von Betriebsbefehlen verwenden, ist es am besten, eine angemessene Anzahl von Befehlen zu ermitteln und diese stapelweise an den Server zu senden, z. B. das Senden von 10.000 Betriebsbefehlen und das Lesen der Antwort Ergebnisse und dann 10.000 Betriebsbefehle senden usw. Obwohl der Zeitverbrauch nahezu gleich ist, ist der zusätzliche Speicherverbrauch der maximale Wert, der für das Anordnungsantwortergebnis dieser 10.000 Betriebsbefehle erforderlich ist. (Um eine Erschöpfung des Speichers zu verhindern, wählen Sie einen angemessenen Wert) 🎜🎜Es geht nicht nur um RTT🎜🎜Pipelining ist nicht die einzige Möglichkeit, den durch RTT verursachten Verbrauch zu reduzieren, aber es hilft Ihnen Verbessern Sie die Anzahl der ausgeführten Befehle pro Sekunde erheblich. Die Wahrheit ist: Aus Sicht des Zugriffs auf die entsprechende Datenstruktur und der Generierung des Antwortergebnisses ist es zwar sehr günstig, Pipelining nicht zu verwenden, aber aus Sicht der Socket-E/A ist es genau das im Gegenteil. Da es sich dabei um read()- und write()-Aufrufe handelt, müssen Sie vom Benutzermodus in den Kernelmodus wechseln. Diese Art des Kontextwechsels wird besonders zeitaufwändig sein. 🎜🎜Sobald die pipelining-Technologie verwendet wird, führen viele Betriebsbefehle Lesevorgänge aus demselben read()-Aufruf aus und eine große Anzahl von Antwortergebnissen wird an die verteilt gleich Der Schreibvorgang wird während des write()-Aufrufs ausgeführt. Auf dieser Grundlage steigt mit zunehmender Länge der Pipeline die Anzahl der pro Sekunde ausgeführten Abfragen zunächst fast linear an, bis sie ohne Verwendung der pipelining-Technologie das Zehnfache der Basislinie beträgt, wie unten gezeigt: 🎜🎜So lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis🎜🎜Einige Codebeispiel aus der realen Welt🎜 🎜 Ohne Übersetzung bedeutet dies im Grunde, dass die Verwendung von Pipelining die Leistung um das Fünffache verbessert. 🎜

Pipelining VS Scripting

Redis Scripting(2.6+版本可用),通过使用在Server端完成大量工作的脚本Scripting,可以更加高效的解决大量pipelining用例。使用脚本Scripting的最大好处就是在读和写的时候消耗更少的性能,使得像读、写、计算这样的操作更加快速。(当client需要写操作之前获取读操作的响应结果时,pepelining就显得相形见拙。) 有时候,应用可能需要在使用pipelining时,发送 EVAL 或者 EVALSHA 命令,这是可行的,并且Redis明确支持这么这种SCRIPT LOAD命令。(它保证可可以调用 EVALSHA 而不会有失败的风险)。

Appendix: Why are busy loops slow even on the loopback interface?

读完全文,你可能还会感到疑问:为什么如下的Redis测试基准 benchmark 会执行这么慢,甚至在Client和Server在一个物理机上也是如此:

FOR-ONE-SECOND:
    Redis.SET("foo","bar")
END

毕竟Redis进程和测试基准benchmark在相同的机器上运行,并且这是没有任何实际的延迟和真实的网络参与,不就是消息通过内存从一个地方拷贝到另一个地方么? 原因是进程在操作系统中并不是一直运行。真实的情景是系统内核调度,调度到进程运行,它才会运行。比如测试基准benchmark被允许运行,从Redis Server中读取响应内容(与最后一次执行的命令相关),并且写了一个新的命令。这时命令将在回环网络的套接字中,但是为了被Redis Server读取,系统内核需要调度Redis Server进程(当前正在系统中挂起),周而复始。所以由于系统内核调度的机制,就算是在回环网络中,仍然会涉及到网络延迟。 简言之,在网络服务器中衡量性能时,使用回环网络测试并不是一个明智的方式。应该避免使用此种方式来测试基准。

Das obige ist der detaillierte Inhalt vonSo lösen Sie das Problem der Verwendung von Pipelining zur Beschleunigung von Abfragen in Redis. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:yisu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen