Heim >Datenbank >MySQL-Tutorial >Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

零下一度
零下一度Original
2017-04-22 15:44:311155Durchsuche

Da die von Crawlern erfassten Daten weiter zunehmen, wurden die Datenbank- und Abfrageanweisungen in den letzten zwei Tagen kontinuierlich optimiert. Eine der Tabellenstrukturen lautet wie folgt:

CREATE TABLE `newspaper_article` (
  `id` varchar(50) NOT NULL COMMENT '编号',
  `title` varchar(190) NOT NULL COMMENT '标题',
  `author` varchar(255) DEFAULT NULL COMMENT '作者',
  `date` date NULL DEFAULT NULL COMMENT '发表时间',
  `content` longtext COMMENT '正文',
  `status` tinyint(4) DEFAULT '0',
  PRIMARY KEY (`id`),
  KEY `idx_status_date` (`status`,`date`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='文章表';

Entsprechend den Geschäftsanforderungen wurde der idx_status_date-Index hinzugefügt. Es ist besonders zeitaufwändig, das folgende SQL auszuführen:

SELECT id, title, status, date FROM article WHERE status > -2 AND date = '2016-01-07';

Beobachtungen zufolge ist Die Anzahl der täglich hinzugefügten neuen Daten beträgt etwa 2.500. Ich dachte, dass hier ein bestimmtes Datum '2016-01-07' angegeben wurde und die tatsächliche Menge der zu scannenden Daten innerhalb von 2.500 liegen sollte, aber das ist nicht der Fall:
Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index
Es wurden tatsächlich insgesamt 185589 gescannte Daten erhalten, viel mehr als die geschätzten 2500 Teile, und die tatsächliche Ausführungszeit betrug fast 3 Sekunden:

Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

Warum ist das so?

Lösung

Nachdem Sie idx_status_date (status, date) in idx_status (status) geändert haben, sehen Sie sich den MySQL-Ausführungsplan an:

Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

Sie können sehen, dass sich nach der Änderung des mehrspaltigen Index in einen einspaltigen Index keine Änderung an der Gesamtmenge der vom Ausführungsplan zu scannenden Daten ergibt. In Kombination mit der Tatsache, dass mehrspaltige Indizes dem Präfixprinzip ganz links folgen, wird spekuliert, dass die obige Abfrageanweisung nur den Index ganz links idx_status_date von status verwendet.

Ich habe „High Performance MySQL“ durchgeblättert und die folgende Passage gefunden, die meine Idee bestätigt hat:

Wenn es eine Bereichsabfrage für eine bestimmte Spalte in der Abfrage gibt, dann die rechte Seite Alle Spalten können nicht mithilfe der Indexoptimierung nachgeschlagen werden. Beispielsweise gibt es eine Abfrage WHERE last_name = 'Smith' AND first_name LIKE 'J%' AND dob = '1976-12-23'. Diese Abfrage kann nur die ersten beiden Spalten des Index verwenden, da LIKE hier eine Bereichsbedingung ist (der Server kann die restlichen Spalten jedoch für andere Zwecke verwenden). Wenn die Anzahl der Bereichsabfragespaltenwerte begrenzt ist, können Sie die Bereichsbedingung durch die Verwendung mehrerer gleicher Bedingungen ersetzen.

Daher gibt es hier zwei Lösungen:

  • Sie können die Bereichsbedingung durch die Verwendung mehrerer gleicher Bedingungen ersetzen

  • Ändern Sie idx_status_date (status, date), um idx_date_status (date, status) zu indizieren, und erstellen Sie einen neuen idx_status-Index, um den gleichen Effekt zu erzielen.

Optimierter Ausführungsplan:

Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

Tatsächliches Ausführungsergebnis:

Teilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index

Zusammenfassung

Wenn Leute über Indizes sprechen und den Typ nicht angeben, sprechen sie wahrscheinlich von B-Tree-Indizes, die B-Tree-Daten verwenden Struktur zum Speichern von Daten. Wir verwenden den Begriff „B-Tree“, da MySQL dieses Schlüsselwort auch in CREATE TABLE und anderen Anweisungen verwendet. Die zugrunde liegende Speicher-Engine kann jedoch auch andere Speicherstrukturen verwenden. InnoDB verwendet B+Tree.
Angenommen, es gibt die folgende Datentabelle:

CREATE TABLE People (
  last_name  varchar(50)    not null,
  first_name varchar(50)    not null,
  dob        date           not null,
  gender     enum('m', 'f') not null,
  key(last_name, first_name, dob)
);

Der B-Tree-Index ist für die folgenden Arten von Abfragen gültig

  • Vollständige Werteübereinstimmung
    Der vollständige Wertabgleich bedeutet, alle Spalten im Index abzugleichen. Der Index in der obigen Tabelle kann beispielsweise verwendet werden, um Personen mit dem Namen Cuba Allen zu finden, die am 01.01.1960 geboren wurden.

  • Entspricht dem Präfix ganz links
    Der Index in der obigen Tabelle kann verwendet werden, um alle Personen mit dem Nachnamen Allen zu finden, d. h. es wird nur die erste Spalte des Index verwendet .

  • Spaltenpräfix anpassen
    Entspricht nur dem Anfang des Werts einer Spalte. Beispielsweise kann der Index in der obigen Tabelle verwendet werden, um alle Personen zu finden, deren Nachnamen mit J beginnen. Hier wird nur die erste Spalte des Index verwendet.

  • Übereinstimmungsbereichswert
    Der Index in der obigen Tabelle kann beispielsweise verwendet werden, um Personen mit Nachnamen zwischen Allen und Barrymore zu finden. Hier wird nur die erste Spalte des Index verwendet.

  • Genaue Übereinstimmung mit einer bestimmten Spalte und Bereichsübereinstimmung mit einer anderen Spalte
    Der Index in der obigen Tabelle kann auch verwendet werden, um alle Personen zu finden, deren Nachname Allen ist und deren Vorname mit beginnt der Buchstabe K (wie Kim, Karl usw.) Menschen. Das heißt, die erste Spalte „last_name“ stimmt vollständig überein und die zweite Spalte „first_name“ stimmt mit dem Bereich überein.

  • Abfrage, die nur auf den Index zugreift
    B-Tree kann normalerweise „Abfragen, die nur auf den Index zugreifen“ unterstützen, d. h. die Abfrage muss nur auf den Index zugreifen, ohne darauf zuzugreifen Datenzeilen.

Einige Einschränkungen des B-Tree-Index

  • Der Index kann nicht verwendet werden, wenn die Suche nicht in der Spalte ganz links im Index beginnt. Beispielsweise kann der Index in der obigen Tabelle nicht verwendet werden, um eine Person namens Bill zu finden, noch kann er eine Person mit einem bestimmten Geburtstag finden, da keine der beiden Spalten die Datenspalte ganz links ist. Ebenso gibt es keine Möglichkeit, Personen zu finden, deren Nachnamen mit einem bestimmten Buchstaben enden.

  • Spalten im Index können nicht übersprungen werden. Das heißt, der Index in der Tabelle oben kann nicht verwendet werden, um Personen mit dem Nachnamen Smith zu finden, die an einem bestimmten Datum geboren wurden. Wenn Sie keinen Namen (Vorname) angeben, kann MySQL nur die erste Spalte des Index verwenden.

  • Wenn in der Abfrage eine Bereichsabfrage für eine bestimmte Spalte vorhanden ist, können alle Spalten rechts davon nicht mithilfe der Indexoptimierung durchsucht werden. Beispielsweise gibt es eine Abfrage WHERE last_name = 'Smith' AND first_name LIKE 'J%' AND dob = '1976-12-23'. Diese Abfrage kann nur die ersten beiden Spalten des Index verwenden, da LIKE hier eine Bereichsbedingung ist (der Server kann die restlichen Spalten jedoch für andere Zwecke verwenden). Wenn die Anzahl der Bereichsabfragespaltenwerte begrenzt ist, können Sie die Bereichsbedingung durch die Verwendung mehrerer gleicher Bedingungen ersetzen.


Das obige ist der detaillierte Inhalt vonTeilen Sie einen Beispielcode für die Optimierung eines mehrspaltigen MySQL-Index. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn