Gemäß den Alibaba-Spezifikationen müssen Felder mit eindeutigen Merkmalen im Geschäft, auch kombinierte Felder, in einen eindeutigen Index integriert werden.
Zum Beispiel ist die Schülernummer in der Schülertabelle ein eindeutiges Feld. Durch die Erstellung eines eindeutigen Indexes für dieses Feld können die Informationen eines bestimmten Schülers schnell abgefragt werden Namen, wodurch die Abfragegeschwindigkeit verringert wird.
Wenn ein Feld häufig in der Where-Bedingung der Select-Anweisung verwendet wird, ist es notwendig, einen Index für dieses Feld zu erstellen, insbesondere wenn die Datenmenge groß ist Es reicht aus, einen gewöhnlichen Index zu erstellen. Dies kann die Abfrageeffizienz erheblich verbessern.
Zum Beispiel enthält die Testtabelle student_info 1 Million Daten. Wenn kein Index für das Feld student_id erstellt wird, lauten die Abfrageergebnisse wie folgt:
select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花费211ms
After Beim Erstellen eines Indexes für student_id lauten die Abfrageergebnisse wie folgt:
alter table student_info add index idx_sid(student_id); select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花费3ms
Gruppieren Sie beispielsweise die von Studenten ausgewählten Kurse nach student_id, zeigen Sie verschiedene student_id und die Anzahl der Kurse an und zeigen Sie 100 Elemente an. Wenn Sie keinen Index für student_id erstellen, lauten die Abfrageergebnisse wie folgt:
select student_id,count(*) as num from student_info group by student_id limit 100;#花费2.466s
Nach dem Erstellen eines Index für student_id lauten die Abfrageergebnisse wie folgt:
alter table student_info add index idx_sid(student_id); select student_id,count(*) as num from student_info group by student_id limit 100;#花费6msFür Abfrageanweisungen, die beides haben Gruppieren nach und Sortieren nach. Es wird empfohlen, einen gemeinsamen Index zu erstellen und die Felder in der Gruppe nach vor dem Feld Sortieren nach zu platzieren, um das „Prinzip der Übereinstimmung mit dem Präfix ganz links“ zu erfüllen, sodass die Indexauslastungsrate hoch ist Gleichzeitig wird die natürliche Abfrageeffizienz hoch sein. Nach 8.0 unterstützt die Version einen absteigenden Index. Wenn die Felder nach der Reihenfolge in absteigender Reihenfolge sind, können Sie erwägen, direkt einen absteigenden Index zu erstellen, was auch die Abfrageeffizienz verbessert.
4. Die Where-Bedingungsspalte von Aktualisieren und Löschen
Wenn das Namensfeld in der Tabelle „student_info“ beispielsweise sdfasdfas123123 lautet, wird die student_id in 110119 geändert. Ohne Indizierung des Namensfelds ist die Ausführungssituation wie folgt:
update student_info set student_id = 110119 where name = 'sdfasdfas123123';#花费549ms
Nach dem Hinzufügen des Index die Ausführungssituation lautet wie folgt:
rrree5. Distinct-Felder müssen Indizes erstellen
Fragen Sie beispielsweise die verschiedenen student_ids im Kursplan ab. Wenn für student_id kein Index erstellt wird, ist die Ausführungssituation wie folgt:
alter table student_info add index idx_name(name); update student_info set student_id = 110119 where name = 'sdfasdfas123123';#花费2ms
Nach dem Erstellen des Index ist die Ausführungssituation wie folgt:
select distinct(student_id) from student_id;#花费2ms
6. Während des Multi-Table-Join-Verbindungsvorgangs sind beim Erstellen eines Index Dinge zu beachten
Wenn Sie beispielsweise nur einen Index für student_id erstellen, lauten die Abfrageergebnisse wie folgt:
alter table student_info add index idx_sid(student_id); select distinct(student_id) from student_id;#花费0.1ms
Nach dem Erstellen eines Index für das Namensfeld lauten die Abfrageergebnisse wie folgt:
select course_id, name, student_info.student_id,course_name from student_info join course on student_info.course_id = course.course_id where name = 'aAAaAA'; #花费176ms
这里所说的类型小值意思是该类型表示的数据范围的大小。比如在定义表结构的时候要显示的指定列的类型,以整数类型为例,有TINYINT、MEDIUMINT、INT、BIGINT等,他们占用的存储空间依次递增,能表示的数据范围也是一次递增。如果相对某个整数列建立索引的话,在表示的整数范围允许的情况下,尽量让索引列使用较小的类型,例如能使用INT不要使用BIGINT,能使用MEDIUMINT不使用INT,原因如下:
数据类型越小,在查询时进行的比较操作越快
数据类型越小,索引占用的空间就越少,在一个数据页内就可以存下更多的记录,从而减少磁盘I/O带来的性能损耗,也就意味着可以存储更多的数据在数据页中,提高读写效率。
上述对于主键来说很合适,因为在聚簇索引中既存储了数据,也存储了索引,可以很好的减少磁盘I/O;而对于二级索引来说,还需要一次回表操作才能查到完整的数据,也就能加了一次磁盘I/O。
根据Alibaba开发手册,在字符串上建立索引时,必须指定索引长度,没有必要对全字段建立索引。
比如有一张商品表,表中的商品描述字段较长,在描述字段上建立前缀索引如下:
create table product(id int, desc varchar(120) not null); alter table product add index(desc(12));
区分度的计算可以使用count(distinct left(列名, 索引长度))/count(*)来确定。
列的基数值得时某一列中不重复数据的个数,比如说某个列包含值2,5,3,6,2,7,2,虽然有7条记录,但该列的基数却是5,也就是说,在记录行数一定的情况下,列的基数越大,该列中的值就越分散;列的基数越小,该列中的值就越集中。这里列的基数指标非常重要,直接影响是否能有效利用索引。最好为列的基数大的列建立索引,为基数太小的列建立索引效果反而不好。
可以使用公式select count(distinct col)/count(*) from table
来计算区分度,越接近1区分度越好。
这条就是通常说的最左前缀匹配原则。 通俗来讲就是将Where条件后经常使用的条件字段放在索引的最左边,将使用频率相对低的放到右边。
通常索引的建立是有代价的,如果建立索引的字段没有出现在where条件(包括group by、order by)中,建议一开始就不要创建索引或将索引删除,因为索引的存在也会占用空间。
在条件表达式中经常用到的不同值较多的列上建立索引,但字段中如果有大量重复数据,也不用创建索引。比如学生表中的性别字段,只有男和女两种值,因此无需建立索引。如果建立索引,不但不会提高查询效率,反而会严重降低数据更新速度。
4、避免对经常更新的表创建过多的索引
频繁更新的字段不一定要创建索引,因为更新数据的时候,索引也要跟着更新,如果索引太多,更新的时候会造成服务器压力,从而影响效率。
避免对经常更新的表创建过多的索引,并且索引中的列尽可能少。此时虽然提高了查询速度,同时也会降低更新表的速度。
例如身份证、UUID(在索引比较时需要转为ASCII,并且插入时可能造成页分裂)、MD5、HASH、无序长字符串等。
表中的数据被大量更新或者数据的使用方式被改变后,原有的一些索引可能不会被使用到。DBA应定期找出这些索引并将之删除,从而较少无用索引对更新操作的影响。
例如身份证、UUID(在索引比较时需要转为ASCII,并且插入时可能造成页分裂)、MD5、HASH、无序长字符串等。
表中的数据被大量更新或者数据的使用方式被改变后,原有的一些索引可能不会被使用到。DBA应定期找出这些索引并将之删除,从而较少无用索引对更新操作的影响。
Das obige ist der detaillierte Inhalt vonBeispielanalyse der Prinzipien der MySQL-Indexerstellung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!