Heim >Datenbank >MySQL-Tutorial >Einzelner INSERT mit mehreren Werten im Vergleich zu mehreren Einfügungen: Wann wird die Stapelverarbeitung zum Engpass?
Batch-Einfügung und einzelnes Einfügen mehrerer Werte: Wann wird die Stapelverarbeitung zum Engpass?
Ein überraschender Leistungsvergleich zeigt, dass die alleinige Ausführung von 1000 INSERT-Anweisungen (290 Millisekunden) eine deutlich bessere Leistung erbringt als das Einfügen von 1000 Werten mit einer einzelnen INSERT-Anweisung (2800 Millisekunden). Um dieses unerwartete Ergebnis zu untersuchen, analysieren wir den Ausführungsplan und identifizieren potenzielle Engpässe.
Eine Überprüfung des Ausführungsplans zeigt, dass die einzelne INSERT-Anweisung einen automatischen Parametrisierungsprozess verwendet, um die Analyse-/Kompilierungszeit zu minimieren. Allerdings erhöht sich die Kompilierungszeit einer einzelnen INSERT-Anweisung plötzlich bei etwa 250 Wertklauseln, was dazu führt, dass die Größe des Cache-Plans abnimmt und die Kompilierungszeit zunimmt.
Eine weitere Analyse zeigt, dass SQL Server beim Kompilieren eines Plans für einen bestimmten Literalwert möglicherweise einige Aktivitäten ausführt, die nicht linear skaliert werden, beispielsweise das Sortieren. Auch ohne Sortierung zur Kompilierungszeit zeigt das Hinzufügen eines Clustered-Index zu einer Tabelle einen expliziten Sortierschritt im Plan an.
Während der Kompilierungsphase zeigt der Stack-Trace des SQL Server-Prozesses, dass viel Zeit für den Vergleich von Zeichenfolgen aufgewendet wird. Dies kann mit der Normalisierungsphase (Bindung oder Algebraisierung) der Abfrageverarbeitung zusammenhängen, in der der Ausdrucksanalysebaum in einen algebraischen Ausdrucksbaum umgewandelt wird.
Experimente zur Variation der Länge und Eindeutigkeit eingefügter Zeichenfolgen haben gezeigt, dass längere Zeichenfolgen und weniger Duplikate zu einer schlechteren Leistung bei der Kompilierung führen. Dies weist darauf hin, dass SQL Server während der Kompilierung mehr Zeit mit dem Vergleichen und Identifizieren von Duplikaten verbringt.
In manchen Fällen kann dieses Verhalten ausgenutzt werden, um die Leistung zu verbessern. Beispielsweise kann SQL Server in einer Abfrage, die eine duplikatfreie Spalte als primären Sortierschlüssel verwendet, die Sortierung nach dem sekundären Schlüssel zur Laufzeit überspringen und Fehler durch Division durch Null vermeiden.
Obwohl das Einfügen mehrerer Werte mit einer einzigen INSERT-Anweisung schneller zu sein scheint als mit mehreren INSERT-Anweisungen, kann der Kompilierzeitaufwand, der mit der Verarbeitung einer großen Anzahl unterschiedlicher Werte (insbesondere langer Zeichenfolgen) verbunden ist, zu erheblichen Leistungseinbußen führen Ablehnung von SQL Server.
Das obige ist der detaillierte Inhalt vonEinzelner INSERT mit mehreren Werten im Vergleich zu mehreren Einfügungen: Wann wird die Stapelverarbeitung zum Engpass?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!