Heim >System-Tutorial >LINUX >DBA entdeckt neues Problem mit PostgreSQL
Wie immer werden Benutzer, die einen neuen Cluster aktualisieren oder initialisieren, eine bessere Leistung (z. B. bessere parallele Indexscans, Merge-Joins und unabhängige Unterabfragen, schnellere Aggregationen, intelligentere Joins auf Remote-Servern) und Aggregation feststellen, die alle sofort funktionieren , aber in diesem Artikel möchte ich über etwas sprechen, das nicht sofort funktioniert und tatsächlich erfordert, dass Sie einige Schritte unternehmen, um davon zu profitieren. Die unten hervorgehobenen Funktionen wurden aus der Sicht eines Datenbankadministrators zusammengestellt. In Kürze wird es einen Artikel geben, der die Änderungen aus der Sicht eines Entwicklers behandelt.
Upgrade-HinweiseZuerst einige Tipps für das Upgrade von einem bestehenden Setup – es gibt einige kleine Dinge, die bei der Migration von 9.6 oder älter zu Problemen führen können. Testen Sie das Upgrade daher unbedingt auf einer separaten Kopie und führen Sie die Version durch, bevor Sie das eigentliche Upgrade durchführen. Alles möglich Fragen in der Beschreibung. Die auffälligsten Mängel sind:
Alle Funktionen, die „xlog“ enthalten, wurden umbenannt, um „wal“ anstelle von „xlog“ zu verwenden.
Die letztgenannte Benennung kann mit normalen Serverprotokollen verwechselt werden, es handelt sich also um eine „nur für den Fall“-Änderung. Wenn Sie Sicherungs-/Replikations-/HA-Tools von Drittanbietern verwenden, überprüfen Sie, ob diese auf dem neuesten Stand sind.
Der Ordner pg_log, der Serverprotokolle (Fehlermeldungen/Warnungen usw.) enthält, wurde in „log“ umbenannt.
Stellen Sie sicher, dass Ihr Protokoll-Parsing- oder Grep-Skript (falls vorhanden) funktioniert.
Standardmäßig nutzen Abfragen bis zu 2 Hintergrundprozesse.
Wenn Sie den Standardwert 10 in der postgresql.conf-Einstellung auf einem Computer mit einer geringen Anzahl von CPUs verwenden, kann es zu Spitzen bei der Ressourcennutzung kommen, da die Parallelverarbeitung standardmäßig aktiviert ist – das ist eine gute Sache, wie es auch bedeuten sollte schnellere Abfragen. Wenn Sie das alte Verhalten wünschen, setzen Sie max_parallel_workers_per_gather auf 0.
Standardmäßig sind Replikationsverbindungen für localhost aktiviert.
Um Dinge wie das Testen zu vereinfachen, sind Localhost- und lokale Unix-Socket-Replikationsverbindungen jetzt im „Vertrauens“-Modus (kein Passwort) in pg_hba.conf aktiviert! Ändern Sie daher unbedingt die Konfiguration, wenn andere Nicht-DBA-Benutzer Zugriff auf die reale Produktionsmaschine haben.
Meine Favoriten aus DBA-SichtLogische Kopie
Diese lang erwartete Funktion erfordert eine einfache Einrichtung mit minimalem Leistungsverlust, wenn Sie nur eine einzelne Tabelle, einen Teil einer Tabelle oder alle Tabellen kopieren möchten, was auch bedeutet, dass nachfolgende Hauptversionen ohne Ausfallzeit aktualisiert werden können! In der Vergangenheit (erfordert Postgres 9.4+) war dies durch die Verwendung von Erweiterungen von Drittanbietern oder langsamen Trigger-basierten Lösungen möglich. Für mich sind das die 10 besten Features.
Partitionen deklarieren
Die bisherige Art der Partitionsverwaltung bestand darin, Trigger zu erben und zu erstellen, um Einfügungen in die richtige Tabelle umzuleiten, was ärgerlich war, ganz zu schweigen von den Auswirkungen auf die Leistung. Derzeit werden die Partitionierungsschemata „Bereich“ und „Liste“ unterstützt. Wenn jemand in einigen Datenbank-Engines die „Hash“-Partitionierung vermisst, können Sie die „Listen“-Partitionierung mit Ausdrücken verwenden, um die gleiche Funktionalität zu erreichen.
Verfügbare Hash-Indizes
Hash-Indizes sind jetzt WAL-protokolliert und daher absturzsicher. Sie haben einige Leistungsverbesserungen erfahren, sodass sie für einfache Suchvorgänge bei größeren Datenmengen schneller sind als Standard-B-Tree-Indizes. Größere Indexgrößen werden ebenfalls unterstützt.
Spaltenübergreifende Optimierungsstatistiken
Solche Statistiken müssen manuell für eine Reihe von Tabellenspalten erstellt werden, um anzuzeigen, dass die Werte tatsächlich in irgendeiner Weise voneinander abhängig sind. Dadurch werden langsame Abfragen behandelt, bei denen der Planer der Meinung ist, dass nur sehr wenige Daten zurückgegeben werden (das Produkt von Wahrscheinlichkeiten ergibt oft sehr kleine Zahlen) und daher bei großen Datenmengen zu einer schlechten Leistung führt (z. B. Auswahl eines Joins mit „verschachtelter Schleife“).
Parallele Schnappschüsse auf Replikaten
Es ist jetzt möglich, mehrere Prozesse (Flag -jobs) in pg_dump zu verwenden, um Backups auf Standby-Servern erheblich zu beschleunigen.
Optimieren Sie das Verhalten von Parallelverarbeitungsarbeitern besser
Beziehen Sie sich auf die Parameter max_parallel_workers und min_parallel_table_scan_size/min_parallel_index_scan_size. Ich empfehle, die Standardwerte für die beiden letztgenannten etwas zu erhöhen (8 MB, 512 KB).
Neue integrierte Überwachungsrollen für einfachere Werkzeugnutzung
Neue Rollen pg_monitor, pg_read_all_settings, pg_read_all_stats und pg_stat_scan_tables erleichtern die Durchführung verschiedener Überwachungsaufgaben – die zuvor mit einem Superuser-Konto oder einer SECURITY DEFINER-Wrapper-Funktion erledigt werden mussten.
Temporärer Replikationsslot (pro Sitzung) für eine sicherere Replikatgenerierung
Eine neue Contrib-Erweiterung zur Überprüfung der Gültigkeit von B-Tree-Indizes
Diese beiden intelligenten Prüfungen decken strukturelle Inkonsistenzen und Inhalte auf, die nicht von der Validierung auf Seitenebene abgedeckt werden. Hoffentlich in naher Zukunft ausführlicher.
Psql-Abfragetool unterstützt jetzt grundlegende Zweige (if/elif/else)
Im Folgenden wird beispielsweise ein einzelnes Wartungs-/Überwachungsskript mit einem bestimmten Versionszweig (mit unterschiedlichen Spaltennamen für pg_stat*-Ansichten usw.) anstelle vieler versionspezifischer Skripte aktiviert.
SELECT :VERSION_NAME = '10.0' AS is_v10 \gset \if :is_v10 SELECT 'yippee' AS msg; \else SELECT 'time to upgrade!' AS msg; \endif
Das war's dieses Mal! Es gibt natürlich noch viele andere Dinge, die nicht aufgeführt sind, daher würde ich einem dedizierten DBA auf jeden Fall empfehlen, einen umfassenderen Blick auf die Release-Datensätze zu werfen. Vielen Dank an die über 300 Personen, die zu dieser Veröffentlichung beigetragen haben!
Das obige ist der detaillierte Inhalt vonDBA entdeckt neues Problem mit PostgreSQL. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!