Heim >Datenbank >MySQL-Tutorial >MySQL 请选择合适的列!_MySQL
bitsCN.com 思维导图 点击图片,可查看大图。
选择数据类型 选择正确的数据类型,对于提高性能至关重要。下面给出几种原则,有利于帮助你选择何种类型。 1、更小通常更好。 使用最小的数据类型。——更少的磁盘空间,内存和CPU缓存。而且需要的CPU的周期也更少。 2、简单就好。 整数代价小于字符。——因为字符集和排序规则使字符比较更复杂。 1>mysql内建类型(如timestamp,date)优于使用字符串保存。 2>使用整数保存ip地址。 3、尽量避免NULL——如果计划对列进行索引,尽量避免把列设置为NULL 尽可能把字段定义为NOT NULL。——可以放置一个默认值,如‘’,0,特殊字符串。 原因: (1)MYSQL难以优化NULL列。NULL列会使索引,索引统计和值更加复杂。 (2)NULL列需要更多的存储空间,还需要在MYSQL内部进行特殊处理。 (3)NULL列加索引,每条记录都需要一个额外的字节,还导致MyISAM中固定大小的索引变成可变大小的索引。
决定列的数据类型,我们应该遵循下面两步。
第一步、大致决定数据类型。——判断是数字,字符串还是时间等。这通常很直观。
第二步、确定特定的类型。
很多数据类型能够保存同类型的数据,但是我们要发现,他们在存储的范围,精度和物理空间之间的差别(磁盘或内存空间)。如:datetime和timestamp能保存同样类型的数据:日期和时间。——timestamp使用datetime一半的空间;能保存时区;拥有特殊的自动更新能力。
类型名称 | 占用位数 | 数据范围 |
TINYINT | 8 | -2^7 ~ 2^7-1 |
SMALLINT | 16 | -2^15~2^15-1 |
MEDIUMINT | 24 | -2^23~2^23-1 |
INT | 32 | -2^31~2^23-1 |
BIGINT | 64 | -2^63~2^63-1 |
2、unsigned属性表示不允许负数,并大致把正上限提高了一倍。如TINYINT UNSIGNED保存的范围为0到255而不是-127到128
3、MYSQL对整数类型定义宽度,比如int(1)和int(22)对于存储和计算是一样的。只规定了MYSQL的交互工具(如命令行客户端)用来显示字符的个数。
只分配真正需要的空间
使用varchar(5)和varchar(200)保存'hello'占用空间是一样的。——这里应该指的是磁盘上的空间。
那么使用较短列有何优势?——巨大的优势
较大的列会使用更多的内存,因为MySQL通常会分配固定大小的内存块(如varchar(200)会用200个字符大小的内存空间)来保存值(然后对值进行trim操作,最后放入磁盘)或取值。——这对排序或使用基于内存的临时表尤其不好。
咱们再看看varchar
在对enum列使用order by的时候,是按数字排序的,而不是字符串排序。
日期和时间类型
DATETIME:保存大范围的值。封装格式:YYYYMMDDHHMMSS。——与时区无关,使用8字节存储空间。
TIMESTAMP:保存自1970年1月1日午夜(格林尼治标准时间)以来的秒数。——使用4字节存储空间。
经验交谈 1、我们在为列选择数据类型的时候,不仅要考虑存储类型大小,还要考虑MySQL如何对它们进行计算和比较。例如:MySQL在内部把ENUM和SET类型保存为整数,但是在比较的时候把它们转换为字符串。 2、我们要在相关表中使用同样的类型,类型之间要精确匹配,包括诸如UNSIGNED这样的属性。 3、混合不同的数据类型会导致性能问题,即使没有性能问题,隐式的类型转换也能导致难以察觉的错误。 4、选择最小的数据类型要考虑将来留出的增长空间。如,中国的省份,我们知道不会有成千上万个,因此不必用INT。TINYINT就足够了,它比INT小3字节。 5、整数通常是最佳的数据类型,因为它速度快,并且能使用AUTO_INCREMENT。 6、要尽可能避免字符串做为列的数据类型,因为它们占用了很多空间并且通常必整数类型要慢。MyISAM默认情况下为字符串使用了压缩索引,这使查找更为缓慢。 总结 若有错误,望请大侠指教一、二,不胜感激! 参考文献:《高性能MYSQL》 推荐通常使用TIMESTAMP,它比DATETIME更节约空间。有时人们把Unix的时间戳保存为整数值,但是这通常没有任何好处。——这种格式处理起来不太方便,我们并不推荐它。