Heim >Datenbank >Redis >Analyse und Aufbau der hochverfügbaren Redis-Servicearchitektur

Analyse und Aufbau der hochverfügbaren Redis-Servicearchitektur

青灯夜游
青灯夜游nach vorne
2019-11-23 15:49:012075Durchsuche

Analyse und Aufbau der hochverfügbaren Redis-Servicearchitektur

Speicherbasiertes Redis sollte in verschiedenen Webentwicklungsunternehmen die am häufigsten verwendete Schlüsselwertdatenbank sein. Wir verwenden es häufig, um den Benutzeranmeldestatus (Sitzungsspeicher) in unserem Unternehmen zu speichern Einige heiße Datenabfragen (im Vergleich zu MySQL ist die Geschwindigkeit um Größenordnungen verbessert), einfache Nachrichtenwarteschlangen (LPUSH und BRPOP), Abonnementveröffentlichungssysteme (PUB/SUB) usw. erstellen. Größere Internetunternehmen verfügen im Allgemeinen über spezielle Teams, die Redis-Speicher als Basisdienst für verschiedene Geschäftsanrufe bereitstellen.

Allerdings wird jeder Basisdienstleister vom Anrufer gefragt: Ist Ihr Dienst hochverfügbar? Es ist am besten, dass mein Unternehmen nicht unter häufigen Problemen mit Ihrem Service leidet. Kürzlich habe ich in meinem Projekt auch einen kleinen „hochverfügbaren“ Redis-Dienst erstellt. Hier ist meine Zusammenfassung und Reflexion.

Zunächst müssen wir definieren, was Hochverfügbarkeit für den Redis-Dienst ausmacht, das heißt, er kann in verschiedenen Ausnahmesituationen weiterhin Dienste normal bereitstellen. Oder seien Sie entspannter: Im Falle einer Auffälligkeit können die normalen Dienste bereits nach kurzer Zeit wiederhergestellt werden. Die sogenannte Ausnahme sollte mindestens die folgenden Möglichkeiten umfassen:

[Ausnahme 1] Ein Prozess eines bestimmten Knotenservers ist plötzlich ausgefallen (zum Beispiel wurde ein Entwickler deaktiviert und der Redis-Server-Prozess eines Servers wurde deaktiviert war ausgefallen.)

[Ausnahme 2] Ein bestimmter Knotenserver ist ausgefallen, was bedeutet, dass alle Prozesse auf diesem Knoten gestoppt wurden (z. B. wird ein Server aufgrund einer Betriebs- und Wartungsbehinderung vom Stromnetz getrennt; (z. B. ein alter Computer hat einen Hardwarefehler)

[Ausnahme 3] Die Kommunikation zwischen zwei beliebigen Knotenservern ist unterbrochen (z. B. hat ein Zeitarbeiter mit einer behinderten Hand das für die Kommunikation verwendete optische Kabel ausgegraben zwischen zwei Computerräumen)

Tatsächlich handelt es sich bei allen oben genannten Anomalien um Ereignisse mit geringer Wahrscheinlichkeit, und die grundlegende Leitidee zum Erreichen einer hohen Verfügbarkeit lautet: Die Wahrscheinlichkeit, dass mehrere Ereignisse mit geringer Wahrscheinlichkeit gleichzeitig auftreten, beträgt vernachlässigbar. Eine hohe Verfügbarkeit kann erreicht werden, solange wir das System so gestalten, dass es einen Single Point of Failure für einen kurzen Zeitraum toleriert.

Im Internet gibt es viele Lösungen für den Aufbau hochverfügbarer Redis-Dienste, wie zum Beispiel Keepalived, Codis, Twemproxy und Redis Sentinel. Unter ihnen werden Codis und Twemproxy hauptsächlich in großen Redis-Clustern verwendet. Sie waren auch Open-Source-Lösungen, die von Twitter und Wandoujia bereitgestellt wurden, bevor Redis Redis Sentinel offiziell veröffentlichte. Die Datenmenge in meinem Unternehmen ist nicht groß, daher ist die Bereitstellung von Clusterdiensten eine Maschinenverschwendung. Schließlich habe ich mich zwischen Keepalived und Redis Sentinel entschieden und mich für die offizielle Lösung Redis Sentinel entschieden.

Redis Sentinel kann als ein Prozess verstanden werden, der überwacht, ob der Redis-Server-Dienst normal ist. Sobald eine Anomalie erkannt wird, kann der Backup-(Slave-)Redis-Server automatisch aktiviert werden, sodass externe Benutzer auftretende Anomalien erkennen können innerhalb des Redis-Dienstes. Wir folgen den Schritten von einfach bis komplex, um einen minimalen und hochverfügbaren Redis-Dienst aufzubauen.

Option 1: Standalone-Version von Redis Server, ohne Sentinel

Unter normalen Umständen verwenden wir Für persönliche Websites oder während der täglichen Entwicklung wird eine einzelne Instanz von Redis Server eingerichtet. Der Anrufer kann sich direkt mit dem Redis-Dienst verbinden, und sogar der Client und Redis selbst befinden sich auf demselben Server. Diese Kombination eignet sich nur zum persönlichen Lernen und zur Unterhaltung. Schließlich wird es in dieser Konfiguration immer einen einzigen Fehlerpunkt geben, der nicht behoben werden kann. Sobald der Redis-Dienstprozess hängt oder Server 1 heruntergefahren wird, ist der Dienst nicht verfügbar. Und wenn die Redis-Datenpersistenz nicht konfiguriert ist, gehen auch die bereits in Redis gespeicherten Daten verloren.

Option 2: Master-Slave-Synchronisation Redis Server, Einzelinstanz Sentinel

Um dies zu erreichen Hohe Verfügbarkeit. Für das in Lösung 1 beschriebene Single-Point-of-Failure-Problem müssen wir einen Backup-Dienst hinzufügen, d. h. einen Redis-Server-Prozess auf jedem der beiden Server starten. Im Allgemeinen stellt der Master Dienste bereit und der Slave ist nur dafür verantwortlich zur Synchronisierung und Sicherung. Gleichzeitig wird ein zusätzlicher Sentinel-Prozess gestartet, um die Verfügbarkeit von zwei Redis-Server-Instanzen zu überwachen, sodass der Slave rechtzeitig in die Rolle des Masters befördert werden kann, um weiterhin Dienste bereitzustellen. Dadurch wird eine hohe Verfügbarkeit erreicht des Redis-Servers. Dies basiert auf einem hochverfügbaren Service-Design, das heißt, ein einzelner Fehlerpunkt selbst ist ein Ereignis mit geringer Wahrscheinlichkeit und mehrere einzelne Fehlerpunkte gleichzeitig (dh der Master und der Slave hängen gleichzeitig auf). Zeit) kann als (grundsätzlich) unmögliches Ereignis angesehen werden.

Für den Aufrufer des Redis-Dienstes muss jetzt der Redis Sentinel-Dienst verbunden werden, nicht der Redis-Server. Der übliche Aufrufvorgang besteht darin, dass der Client zunächst eine Verbindung zu Redis Sentinel herstellt und fragt, welcher Dienst auf dem aktuellen Redis-Server der Master und welcher der Slave ist, und sich dann für den Betrieb mit dem entsprechenden Redis-Server verbindet. Natürlich haben aktuelle Bibliotheken von Drittanbietern diesen Aufrufprozess im Allgemeinen implementiert, und wir müssen ihn nicht mehr manuell implementieren (z. B. ioredis von Nodejs, predis von PHP, go-redis/redis von Golang, jedis von JAVA usw.).

Nachdem wir jedoch die Master-Slave-Umschaltung des Redis-Serverdienstes implementiert hatten, trat ein neues Problem auf, nämlich, dass Redis Sentinel selbst ebenfalls ein Einzelpunktdienst ist. Sobald der Sentinel-Prozess hängt, hat der Client dies getan Nichts zu tun. Mit Sentinel verbunden. Daher kann mit der Konfiguration von Option 2 keine hohe Verfügbarkeit erreicht werden.

Lösung 3: Master-Slave-Synchronisierung Redis Server, Dual-Instanz Sentinel

Zu Lösung 2 Frage Außerdem starten wir einen zusätzlichen Redis Sentinel-Prozess. Die beiden Sentinel-Prozesse stellen gleichzeitig Service-Erkennungsfunktionen für den Client bereit. Der Client kann sich mit jedem Redis Sentinel-Dienst verbinden, um grundlegende Informationen über die aktuelle Redis Server-Instanz zu erhalten. Normalerweise konfigurieren wir mehrere Redis Sentinel-Link-Adressen auf der Client-Seite. Sobald der Client feststellt, dass eine Verbindung zu anderen Sentinel-Instanzen hergestellt werden kann, ist eine manuelle Implementierung nicht erforderlich Verschiedene Entwicklungssprachen Die populäreren Redis-Verbindungsbibliotheken haben uns dabei geholfen, diese Funktion zu realisieren. Wir gehen davon aus, dass es, selbst wenn einer der Redis-Sentinels auflegt, einen anderen Sentinel gibt, der Dienste bereitstellen kann.

Die Vision ist zwar schön, aber die Realität ist sehr grausam. Unter einer solchen Architektur ist es immer noch unmöglich, eine hohe Verfügbarkeit des Redis-Dienstes zu erreichen. Im schematischen Diagramm von Option 3 ist die rote Linie die Kommunikation zwischen den beiden Servern, und das abnormale Szenario, das wir uns vorstellen ([Ausnahme 2]), besteht darin, dass ein bestimmter Server insgesamt ausgefallen ist Derzeit ist nur Redis Sentinel und der Slave-Redis-Server auf Server 2 verfügbar. Zu diesem Zeitpunkt schaltet Sentinel den verbleibenden Slave nicht tatsächlich auf den Master um, um den Dienst fortzusetzen, was dazu führt, dass der Redis-Dienst nicht verfügbar ist, da Redis so eingestellt ist, dass nur dann eine Verbindung hergestellt werden kann, wenn mehr als 50 % der Sentinel-Prozesse eine Verbindung herstellen können Wenn Sie für den neuen Master stimmen, findet tatsächlich eine Master-Slave-Umschaltung statt. In diesem Beispiel kann nur einer der beiden Sentinels verbunden werden, was 50 % entspricht und kein Szenario darstellt, in dem eine Master-Slave-Umschaltung möglich ist.

Sie fragen sich vielleicht, warum Redis diese 50 %-Einstellung hat? Unter der Annahme, dass wir weniger als oder gleich 50 % der Sentinel-Konnektivität zulassen, kann auch eine Master-Slave-Umschaltung durchgeführt werden. Stellen Sie sich [Ausnahme 3] vor, das heißt, das Netzwerk zwischen Server 1 und Server 2 ist unterbrochen, der Server selbst ist jedoch betriebsbereit. Wie in der Abbildung unten gezeigt:

Tatsächlich ist der Effekt, wenn Server 1 direkt ausfällt, für Server 2 derselbe wie der, wenn Server 1 keine Verbindung herstellen kann Auf jeden Fall ist keine Kommunikation mehr möglich. Angenommen, wir erlauben Sentinel von Server 2, bei einer Netzwerkunterbrechung vom Slave zum Master zu wechseln. Das Ergebnis ist, dass Sie jetzt über zwei Redis-Server verfügen, die Dienste für die Außenwelt bereitstellen können. Alle vom Client durchgeführten Hinzufügungs-, Lösch- und Änderungsvorgänge können auf Redis von Server 1 oder Redis von Server 2 (je nachdem, mit welchem ​​Sentinel der Client verbunden ist) erfolgen und zu Datenverwirrung führen. Selbst wenn das Netzwerk zwischen Server 1 und Server 2 später wiederhergestellt wird, können wir die Daten nicht vereinheitlichen (zwei verschiedene Daten, wem sollten wir vertrauen?) Und die Datenkonsistenz wird vollständig zerstört.

Option 4: Master-Slave-Synchronisierung Redis Server, drei Instanzen von Sentinel

Seit Option 3 Um eine hohe Verfügbarkeit zu erreichen, ist unsere endgültige Version die in der Abbildung oben gezeigte Lösung 4. Tatsächlich ist dies die Architektur, die wir letztendlich gebaut haben. Wir haben Server 3 eingeführt und einen Redis Sentinel-Prozess auf Server 3 aufgebaut. Jetzt verwalten drei Sentinel-Prozesse zwei Redis Server-Instanzen. In diesem Szenario können Redis-Dienste weiterhin für die Außenwelt bereitgestellt werden, unabhängig davon, ob es sich um einen einzelnen Prozessfehler, einen einzelnen Maschinenfehler oder einen Netzwerkkommunikationsfehler zwischen zwei Maschinen handelt.

Wenn Ihr Computer relativ inaktiv ist, können Sie natürlich auch einen Redis-Server auf Server 3 öffnen, um eine 1-Master- + 2-Slave-Architektur zu bilden. Für jede Datengruppe gibt es zwei Sicherungen, wodurch die Verfügbarkeit verbessert wird . Manche. Natürlich gilt: Je mehr Slaves, desto besser. Denn auch die Master-Slave-Synchronisation erfordert Zeit.

Sobald in Szenario 4 die Kommunikation zwischen Server 1 und anderen Servern vollständig unterbrochen ist, wechseln die Server 2 und 3 vom Slave zum Master. Für den Client gibt es derzeit zwei Master, die Dienste bereitstellen, und sobald das Netzwerk wiederhergestellt ist, gehen alle neuen Daten verloren, die während des Ausfalls auf Server 1 gelangt sind. Wenn Sie dieses Problem teilweise lösen möchten, können Sie den Redis-Serverprozess so konfigurieren, dass er den Dienst sofort stoppt, wenn er ein Problem mit seinem eigenen Netzwerk erkennt, um zu verhindern, dass während des Netzwerkausfalls neue Daten eingehen (siehe Redis-Min- (slaves-to-write und min-slaves-max-lag zwei Konfigurationselemente).

Zu diesem Zeitpunkt haben wir einen hochverfügbaren Redis-Dienst mit 3 Maschinen aufgebaut. Tatsächlich gibt es im Internet eine maschinenschonendere Möglichkeit, einen Sentinel-Prozess auf dem Client-Rechner statt auf dem Rechner des Dienstanbieters zu platzieren. Es ist nur so, dass im Unternehmen Anbieter und Anrufer allgemeiner Dienstleistungen nicht aus demselben Team stammen. Wenn zwei Teams dieselbe Maschine gemeinsam bedienen, kann es aufgrund von Kommunikationsproblemen leicht zu Fehlbedienungen kommen. Aus Rücksicht auf menschliche Faktoren haben wir dennoch die Architektur von Plan 4 übernommen. Und da auf Server 3 nur ein Sentinel-Prozess ausgeführt wird, verbraucht dieser nicht viele Serverressourcen. Server 3 kann auch zum Ausführen einiger anderer Dienste verwendet werden.

Benutzerfreundlichkeit: Verwenden Sie Redis Sentinel wie eine eigenständige Version von Redis

Als Dienstleister sprechen wir immer über Benutzererfahrung Probleme. Unter den oben genannten Lösungen gibt es immer etwas, das die Nutzung für den Kunden nicht so komfortabel macht. Bei der eigenständigen Version von Redis stellt der Client eine direkte Verbindung zum Redis-Server her. Wir müssen lediglich eine IP und einen Port angeben, und der Client kann unseren Dienst nutzen. Nach der Umwandlung in den Sentinel-Modus muss der Client einige externe Abhängigkeitspakete verwenden, die den Sentinel-Modus unterstützen, und außerdem seine eigene Redis-Verbindungskonfiguration ändern, was für „anspruchsvolle“ Benutzer offensichtlich inakzeptabel ist. Gibt es eine Möglichkeit, Dienste bereitzustellen, indem dem Client nur eine feste IP und ein fester Port zugewiesen werden, wie bei der eigenständigen Version von Redis?

Die Antwort ist natürlich ja. Dies erfordert möglicherweise die Einführung einer virtuellen IP (Virtual IP, VIP), wie in der Abbildung oben gezeigt. Wir können die virtuelle IP auf den Server verweisen, auf dem sich der Redis-Server-Master befindet. Wenn ein Redis-Master-Slave-Wechsel stattfindet, wird ein Rückrufskript ausgelöst. Das Rückrufskript schaltet die VIP auf den Server um, auf dem sich der Slave befindet. Auf diese Weise scheint es für den Kunden so zu sein, dass er immer noch eine eigenständige Version des hochverfügbaren Redis-Dienstes verwendet.

Fazit

Es ist eigentlich sehr einfach, jeden Dienst zu erstellen und „nutzbar“ zu machen, genau wie wir eine eigenständige Version betreiben Redis. Doch sobald man „hohe Verfügbarkeit“ erreichen will, wird es kompliziert. Im Unternehmen werden zwei zusätzliche Server eingesetzt, 3 Sentinel-Prozesse + 1 Slave-Prozess, um sicherzustellen, dass der Dienst im unwahrscheinlichen Fall eines Unfalls weiterhin verfügbar ist. Im tatsächlichen Geschäftsbetrieb aktivieren wir außerdem die Prozessüberwachung durch den Supervisor. Sobald der Prozess unerwartet beendet wird, versucht er automatisch, neu zu starten.

Empfohlenes Lernen: Redis-Video-Tutorial

Das obige ist der detaillierte Inhalt vonAnalyse und Aufbau der hochverfügbaren Redis-Servicearchitektur. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:cnblogs.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen