搜索
首页数据库mysql教程MySQL优化之分区表_MySQL

当数据库数据量涨到一定数量时,性能就成为我们不能不关注的问题,如何优化呢? 常用的方式不外乎那么几种:

  1、分表,即把一个很大的表达数据分到几个表中,这样每个表数据都不多。

    优点:提高并发量,减小锁的粒度
    缺点:代码维护成本高,相关sql都需要改动

  2、分区,所有的数据还在一个表中,但物理存储数据根据一定的规则存放在不同的文件中,文件也可以放到另外磁盘上

    优点:代码维护量小,基本不用改动,提高IO吞吐量
    缺点:表的并发程度没有增加

  3、拆分业务,这个本质还是分表。

    优点:长期支持更好
    缺点:代码逻辑重构,工作量很大

  当然,每种情况都有合适的应用场景,需要根据具体业务具体选择。由于分表和拆分业务和mysql本身关系不大属于业务层面,我们只说和数据库关系最紧密的方式:表分区。不过使用表分区有个前提就是你的数据库必须支持。那么,怎么知道我的数据库是否支持表分区呢 ? 请执行下面命令  

代码如下:


show plugins;  ---在mysql控制台中执行

据说5.4一下的版本是另外一个命令,不过我没有测试

代码如下:


 show variables like '%part%';


   数据库的表分区一般有两种方式:纵向和横向。纵向就是把表中不同字段分到不同数据文件中。横向是把表中前一部分数据放到一个文件中,另一部分数据放到一个文件中。mysql只支持后后一种方式,横向拆分。

1、创建分区表

   如果要使用表的分区优势,不但要数据库版本支持分区,关键要建分区表,这个表和普通表不一样,并且必须建表的时候就要指定分区,否则无法把普通表改成分区表。那么,如果创建一个分区表呢? 其他很简单,请看下面建表语句

CREATE TABLE `T_part` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) ENGINE = myisam DEFAULT CHARSET = utf8 
PARTITION BY RANGE (f_id)(    -----指定分区方式
  PARTITION p0 VALUES less THAN (10),-- 分了两个区
  PARTITION p1 VALUES less THAN (20)
)

上面语句建了一个“T_part”表,有两个字段f_id和f_name,并且根据RANGE方式把表分成两个区p0、p1,当f_id小于10放入p0分区,当f_id大于0小于20放入分区p1. 那么当f_id大于20的数据放入哪个分区呢? 你猜对了,insert语句会报错。

  看到了吧,创建分区表就这么简单!当然,你随时可以添加删除分区,不过要注意,删除分区的时候会把当前分区下所有数据都删除。

代码如下:


alter table T_part add partition(partition p2 values less than (MAXVALUE));  ---新增分区
alter table T_part DROP partition p2; ----删除分区

2、表分区的几种方式
   mysql支持5种分区方式:RANGE分区、LIST分区、HASH分区、LINEAR HASH分区和KEY分区。每种分区都有自己的使用场景。

  1)RANGE分区:

    RANGE分区的表是通过如下一种方式进行分区的,每个分区包含那些分区表达式的值位于一个给定的连续区间内的行。这些区间要连续且不能相互重叠,使用VALUES LESS THAN操作符来进行定义。

    上面的例子就是RANGE分区.

  2)LIST分区:

    MySQL中的LIST分区在很多方面类似于RANGE分区。和按照RANGE分区一样,每个分区必须明确定义。它们的主要区别在于,LIST分区中每个分区的定义和选择是基于某列的值从属于一个值列表集中的一个值,而RANGE分区是从属于一个连续区间值的集合。LIST分区通过使用“PARTITION BY LIST(expr)”来实现,其中“expr” 是某列值或一个基于某个列值、并返回一个整数值的表达式,然后通过“VALUES IN (value_list)”的方式来定义每个分区,其中“value_list”是一个通过逗号分隔的整数列表。

CREATE TABLE `T_list` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) ENGINE = myisam DEFAULT CHARSET = utf8 
PARTITION by list(f_id)
(
 PARTITION p0 VALUES in(1,2,3), ----区间值不能重复
 PARTITION p1 VALUES in(4,5,6)
);

3)HASH分区:

    HASH分区主要用来确保数据在预先确定数目的分区中平均分布。在RANGE和LIST分区中,必须明确指定一个给定的列值或列值集合应该保存在哪个分区中;而在HASH分区中,MySQL 自动完成这些工作,你所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。要使用HASH分区来分割一个表,要在CREATE TABLE 语句上添加一个“PARTITION BY HASH (expr)”子句,其中“expr”是一个返回一个整数的表达式。它可以仅仅是字段类型为MySQL 整型的一列的名字。此外,你很可能需要在后面再添加一个“PARTITIONS num”子句,其中num 是一个非负的整数,它表示表将要被分割成分区的数量。

CREATE TABLE `T_hash` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) ENGINE = myisam DEFAULT CHARSET = utf8 
PARTITION BY HASH(f_id) ---可以指定多列
PARTITIONS 4;---分区个数

“expr”还可以是MySQL 中有效的任何函数或其他表达式,只要它们返回一个既非常数、也非随机数的整数。(换句话说,它既是变化的但又是确定的)。但是应当记住,每当插入或更新(或者可能删除)一行,这个表达式都要计算一次;这意味着非常复杂的表达式可能会引起性能问题,尤其是在执行同时影响大量行的运算(例如批量插入)的时候。最有效率的哈希函数是只对单个表列进行计算,并且它的值随列值进行一致地增大或减小,因为这考虑了在分区范围上的“修剪”。也就是说,表达式值和它所基于的列的值变化越接近,MySQL就可以越有效地使用该表达式来进行HASH分区。

  4)LINEAR HASH分区:

    MySQL还支持线性哈希功能,它与常规哈希的区别在于,线性哈希功能使用的一个线性的2的幂(powers-oftwo)运算法则,而常规 哈希使用的是求哈希函数值的模数。线性哈希分区和常规哈希分区在语法上的唯一区别在于,在“PARTITION BY” 子句中添加“LINEAR”关键字.

  5)KEY分区:

    按照KEY进行分区类似于按照HASH分区,除了HASH分区使用的用户定义的表达式,而KEY分区的 哈希函数是由MySQL 服务器提供。MySQL 簇(Cluster)使用函数MD5()来实现KEY分区;对于使用其他存储引擎的表,服务器使用其自己内部的 哈希函数,这些函数是基于与PASSWORD()一样的运算法则。

    KEY分区的语法和HASH语法类似,只是把关键字改成KEY。  

CREATE TABLE `T_key` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) ENGINE = myisam DEFAULT CHARSET = utf8 
PARTITION BY LINEAR key(f_id)
PARTITIONS 3;

6)子分区:

    子分区的意思就是在分区的基础上再次分区。且每个分区必须有相同个数的子分区。

CREATE TABLE `T_part` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) 
PARTITION BY RANGE (f_id)
SUBPARTITION BY HASH(F_ID)
SUBPARTITIONS 2
(
  PARTITION p0   VALUES     less THAN (10),
  PARTITION p1  VALUES    less THAN (20)
)

上面语句的意思是,建立两个range分区,每个分区根据hash有分别有两个子分区,实际上整个表分成2×2=4个分区。当然,要详细定义每个分区属性也是可以的

CREATE TABLE `T_part` (
  `f_id` INT DEFAULT NULL,
  `f_name` VARCHAR (20) DEFAULT NULL,
  PRIMARY KEY (`f_id`)
) 
PARTITION BY RANGE (f_id)
SUBPARTITION BY HASH(F_ID)
(
  PARTITION p0   VALUES less THAN (10)
  (
    SUBPARTITION s0 
      DATA DIRECTORY = '/disk0/data' 
      INDEX DIRECTORY = '/disk0/idx',
    SUBPARTITION s1 
      DATA DIRECTORY = '/disk1/data' 
      INDEX DIRECTORY = '/disk1/idx'
  ),
  PARTITION p1  VALUES less THAN (20)
  (
    SUBPARTITION s2
      DATA DIRECTORY = '/disk0/data' 
      INDEX DIRECTORY = '/disk0/idx',
    SUBPARTITION s3 
      DATA DIRECTORY = '/disk1/data' 
      INDEX DIRECTORY = '/disk1/idx'
  )
)

这样可以对每个分区指定具体存储磁盘。前提磁盘是存在的。  

  MySQL 中的分区在禁止空值(NULL)上没有进行处理,无论它是一个列值还是一个用户定义表达式的值。一般而言,在这种情况下MySQL 把NULL视为0。如果你希望回避这种做法,你应该在设计表时不允许空值;最可能的方法是,通过声明列“NOT NULL”来实现这一点。

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
如何通过MySQL对AVG函数优化来提高性能如何通过MySQL对AVG函数优化来提高性能May 11, 2023 am 08:00 AM

如何通过MySQL对AVG函数优化来提高性能MySQL是一款流行的关系型数据库管理系统,其中包含了许多强大的函数以及功能。其中AVG函数被广泛使用在计算平均值的情形,但是由于这个函数需要遍历整个数据集,所以在大规模数据的情况下会导致性能问题。本文将详细介绍如何通过MySQL对AVG函数进行优化,从而提高性能。1.使用索引索引是MySQL优化中最重要的一部分,

如何使用MySQL的分区表优化大数据量的查询操作如何使用MySQL的分区表优化大数据量的查询操作Aug 03, 2023 pm 04:09 PM

如何使用MySQL的分区表优化大数据量的查询操作在处理大数据量时,数据库的性能往往会成为瓶颈。MySQL作为一款流行的关系型数据库管理系统,在处理大数据量的查询操作时也经常面临性能问题。为了优化数据库查询的性能,MySQL提供了分区表的功能,可以把一个表的数据划分成多个部分,分别存储在不同的物理文件中。本文将介绍如何使用MySQL的分区表来优化大数据量的查询

MySQL在电子商务应用中的优化与安全项目经验解析MySQL在电子商务应用中的优化与安全项目经验解析Nov 03, 2023 am 10:42 AM

MySQL是一种广泛应用于电子商务领域的关系型数据库管理系统。在电子商务应用中,对MySQL进行优化和安全工作是至关重要的。本文将解析MySQL在电子商务应用中的优化与安全项目经验。一、性能优化数据库架构设计:在电子商务应用中,数据库的设计是关键。合理的表结构设计和索引设计能够提高数据库的查询性能。同时,使用分表和分区技术可以减少单一表的数据量,提高查询效率

基于TokuDB引擎的MySQL优化:提升写入和压缩性能基于TokuDB引擎的MySQL优化:提升写入和压缩性能Jul 25, 2023 pm 11:45 PM

基于TokuDB引擎的MySQL优化:提升写入和压缩性能引言:MySQL作为一种常用的关系型数据库管理系统,在大数据时代的背景下,面临着越来越高的写入压力和存储需求。为了应对这一挑战,TokuDB引擎应运而生。本文将介绍如何利用TokuDB引擎来提升MySQL的写入性能和压缩性能。一、什么是TokuDB引擎?TokuDB引擎是一种面向大数据的、用于处理高写入

如何优化MySQL连接数管理如何优化MySQL连接数管理Mar 16, 2024 am 08:12 AM

如何优化MySQL连接数管理MySQL是一种流行的关系型数据库管理系统,广泛应用于各种网站和应用程序中。在实际的应用过程中,MySQL连接数管理是一个非常重要的问题,尤其是在高并发情况下,合理管理连接数可以提高系统的性能和稳定性。本文将介绍如何优化MySQL连接数管理,包括详细的代码示例。一、理解连接数管理在MySQL中,连接数是指系统能够同时连

如何实现MySQL底层优化:SQL语句高级优化的技巧和最佳实践如何实现MySQL底层优化:SQL语句高级优化的技巧和最佳实践Nov 08, 2023 pm 04:32 PM

MySQL是一种广泛使用的关系型数据库管理系统,常用于Web应用程序的开发和数据存储。在实际应用中,对MySQL的底层优化尤为重要,其中SQL语句的高级优化是提升数据库性能的关键所在。本文将介绍实现MySQL底层优化的一些技巧和最佳实践,以及具体的代码示例。确定查询条件在编写SQL语句时,首先要明确定义查询条件,避免使用无限制的通配符查询,即避免使用"%"开

如何实现MySQL底层优化:SQL语句优化的常见技巧和原则如何实现MySQL底层优化:SQL语句优化的常见技巧和原则Nov 08, 2023 pm 08:19 PM

MySQL数据库作为一种常见的关系型数据库,随着数据库中数据量的增加和查询需求的变化,底层优化变得尤为重要。在进行MySQL底层优化的过程中,SQL语句优化是一项至关重要的工作。本文将讨论SQL语句优化的常见技巧和原则,并提供具体的代码示例。首先,SQL语句优化需要考虑以下几个方面:索引的优化、查询语句的优化、存储过程和触发器的优化等。在这些方面,我们将从具

如何合理配置和优化MySQL的双写缓冲技术如何合理配置和优化MySQL的双写缓冲技术Jul 25, 2023 pm 01:01 PM

如何合理配置和优化MySQL的双写缓冲技术引言:MySQL的双写缓冲技术是一种提高数据安全性和性能的重要技术。本文将介绍如何合理配置和优化MySQL的双写缓冲技术,以便更好地保护数据,并提升数据库的性能。一、什么是双写缓冲技术双写缓冲技术是MySQL的一种I/O优化技术,它可以大幅减少磁盘I/O操作的次数,提高数据库的写入性能。当MySQL执行写入操作时,先

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

功能强大的PHP集成开发环境

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境