高性能的MySQL（5）创建高性能的索引一哈希索引-mysql教程-PHP中文网

首页

数据库

mysql教程

高性能的MySQL（5）创建高性能的索引一哈希索引

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 05:38 PM

mysql哈希索引

哈希索引（hashindex）基于哈希表实现，只有精确匹配索引的所有列的查询才有效，对于每一行数据，存储引擎都会对所有索引列计算一个哈希码，不同键值的行计算出

哈希索引（hash index）基于哈希表实现，只有精确匹配索引的所有列的查询才有效，对于每一行数据，存储引擎都会对所有索引列计算一个哈希码，不同键值的行计算出来的哈希码也不一样，哈希码保存在哈希索引中，同时哈希表中保存指向每个数据的指针。

1、Memory引擎支持哈希索引，也支持B-Tree索引，而且支持非唯一的哈希索引，如果多个列的哈希值相同，索引会以链表的方式存放多个记录指针到同一个哈希条目，这个是和特别的。

举例说明：

CREATE TABLE `testhash` ( `fname` varchar(50) NOT NULL, `lname` varchar(50) NOT NULL, KEY `fname` (`fname`) USING HASH ) ENGINE=MEMORY DEFAULT CHARSET=utf8 |

假设索引使用f()生成哈希码如下

f('Arjen') = 2323

f('Baron') = 7437

f('Peter') = 8784

f('Vadim') = 2458

则哈希索引数据结构如下

槽
值

2323
指向第1行指针

2458
指向第4行指针

7437
指向第2行指针

8784
指向第3行指针

注意哈希码是有序的，但是数据行不是。

当执行查询的时候

select * from testhash where fname='Peter'；

先计算哈希码，然后找到第3行指针，最后比较第3行的值是否为‘Peter’，以确定就是要找的行。

2、哈希索引的限制：

a、哈希索引只包含哈希码和行指针，不存储字段值，所以无法用索引中的值来避免去读取行。

b、哈希索引数据并不是按照索引值顺序存储的，所以也就无法用于排序。

c、哈希索引也不支持部分索引列匹配查找，必须利用所有索引列，因为哈希值是通过所有索引列计算的。

d、哈希索引只支持等值比较查询，包括=、in()、(安全比较)比较包含null的时候用。哈希也不支持任何范围查询，比方说where price > 100

e、哈希索引非常快，除非有哈希冲突（不同的索引值会有相同的哈希值），这个时候引擎必须遍历链表中的所有行来匹配。

f、哈希冲突较多的时候，比方列上相同的值比较多的时候，索引维护代价就会比较高。

InnoDB引擎有一个特殊的功能叫做“自适应哈希索引”，由引擎内部实现，也可以关闭。

3、创建自定义哈希索引

如果存储引擎不支持哈希索引，可以在B-Tree基础上创建一个伪哈希索引。这个和真正的哈希索引不是一回事，还是用到B-Tree进行查找，只是利用键值的哈希值而不是键值来进行索引查找，只需要在where中手动指定哈希函数。

举例说明：

如果需要存储大量的URL，并且需要根据URL进行搜索，如果使用B-Tree来索引URL，存储内容会很大。比方说下面的查询

select * from url where url="http://www.baidu.com";

若删除原来的URL列索引，而新增一个被索引的字段url_crc,使用crc32做哈希就可以使用下面的查询了

select * from url where url_crc=crc32("http://www.baidu.com") and url="http://www.baidu.com";

这样性能就会很高。

这样的缺陷是需要维护哈希值。可以使用触发器来实现维护工作。

创建一张表

CREATE TABLE `pseudohash` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `url` varchar(255) NOT NULL, `url_crc` int(10) unsigned NOT NULL DEFAULT '0', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

创建触发器

//插入 delimiter $$ create trigger pseudohash_crc_ins before insert on pseudohash for each row begin set NEW.url_crc=crc32(NEW.url);end;$$ //更新 create trigger pseudohash_crc_upd before update on pseudohash for each row begin set NEW.url_crc=crc32(NEW.url);end;$$ delimiter ;

尽量避免使用太长的哈希函数，会浪费很多空间。除非出现了大量冲突，，可以考虑自己实现一个简单的64位哈希函数，一个简单的方法是使用MD5()返回一部分值。

有一点值得注意：

当使用哈希索引进行查询的时候，必须在where中同时跟上rul的匹配，一旦出现了哈希冲突，这个真正要查询的值才会帮助匹配出真正的行。

本文出自 “phper-每天一点点~” 博客，请务必保留此出处

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

MySQL索引基数如何影响查询性能？Apr 14, 2025 am 12:18 AM

MySQL索引基数对查询性能有显着影响：1.高基数索引能更有效地缩小数据范围，提高查询效率；2.低基数索引可能导致全表扫描，降低查询性能；3.在联合索引中，应将高基数列放在前面以优化查询。

MySQL：新用户的资源和教程Apr 14, 2025 am 12:16 AM

MySQL学习路径包括基础知识、核心概念、使用示例和优化技巧。1)了解表、行、列、SQL查询等基础概念。2)学习MySQL的定义、工作原理和优势。3)掌握基本CRUD操作和高级用法，如索引和存储过程。4)熟悉常见错误调试和性能优化建议，如合理使用索引和优化查询。通过这些步骤，你将全面掌握MySQL的使用和优化。

现实世界Mysql：示例和用例Apr 14, 2025 am 12:15 AM

MySQL在现实世界的应用包括基础数据库设计和复杂查询优化。1)基本用法：用于存储和管理用户数据，如插入、查询、更新和删除用户信息。2)高级用法：处理复杂业务逻辑，如电子商务平台的订单和库存管理。3)性能优化：通过合理使用索引、分区表和查询缓存来提升性能。

MySQL中的SQL命令：实践示例Apr 14, 2025 am 12:09 AM

MySQL中的SQL命令可以分为DDL、DML、DQL、DCL等类别，用于创建、修改、删除数据库和表，插入、更新、删除数据，以及执行复杂的查询操作。1.基本用法包括CREATETABLE创建表、INSERTINTO插入数据和SELECT查询数据。2.高级用法涉及JOIN进行表联接、子查询和GROUPBY进行数据聚合。3.常见错误如语法错误、数据类型不匹配和权限问题可以通过语法检查、数据类型转换和权限管理来调试。4.性能优化建议包括使用索引、避免全表扫描、优化JOIN操作和使用事务来保证数据一致性

InnoDB如何处理酸合规性？Apr 14, 2025 am 12:03 AM

InnoDB通过undolog实现原子性，通过锁机制和MVCC实现一致性和隔离性，通过redolog实现持久性。1）原子性：使用undolog记录原始数据，确保事务可回滚。2）一致性：通过行级锁和MVCC确保数据一致。3）隔离性：支持多种隔离级别，默认使用REPEATABLEREAD。4）持久性：使用redolog记录修改，确保数据持久保存。

MySQL的位置：数据库和编程Apr 13, 2025 am 12:18 AM

MySQL在数据库和编程中的地位非常重要，它是一个开源的关系型数据库管理系统，广泛应用于各种应用场景。1）MySQL提供高效的数据存储、组织和检索功能，支持Web、移动和企业级系统。2）它使用客户端-服务器架构，支持多种存储引擎和索引优化。3）基本用法包括创建表和插入数据，高级用法涉及多表JOIN和复杂查询。4）常见问题如SQL语法错误和性能问题可以通过EXPLAIN命令和慢查询日志调试。5）性能优化方法包括合理使用索引、优化查询和使用缓存，最佳实践包括使用事务和PreparedStatemen