Rumah > Artikel > pangkalan data > MySQL分片高可用集群之Cobar部署使用
Cobar是taobao公司用java开发的分布式MySQL中间件,可以支持数据的分片,且接口与mysql相同,因此可以无缝切换。并且不仅支持Mysql,而且还支持MariaDB哦,对版本的要求也很低,只要5.1以上就可以了。如果公司有较多的java项目,推荐使用。我们就来试试Cobar
Cobar是taobao公司用java开发的分布式MySQL中间件,可以支持数据的分片,且接口与mysql相同,因此可以无缝切换。并且不仅支持Mysql,而且还支持MariaDB哦,对版本的要求也很低,只要5.1以上就可以了。如果公司有较多的java项目,推荐使用。我们就来试试Cobar的集群搭建吧。
第一步:下载Cobar
现在可以从两个官方地址下载,一个是github上:https://github.com/alibaba/cobar 可以下载源码,也可以直接下载编译好的包https://github.com/alibaba/cobar/releases
淘宝现在的开源网站也有:http://code.taobao.org/p/cloud-cobar/src/
两个地方下载的目录结构稍有不同,但目前内容基本一样,且都可以运行,您可以自行选择。本例子所用版本为1.2.7。
第二步:安装多个MySQL数据库
请参考文章http://bangbangba.blog.51cto.com/3180873/1703972 的第二步,不过Cobar不需要gtid支持,因此gtid相关的配置可选,如果是MariaDB,这几行是不需要配的,此处我们使用的是MariaDB-10.1。
我们配置9个数据库用于测试
作用 地址 端口 数据文件路径 配置文件路径
分片1 192.168.1.8 14011 /dev/shm/data/co11 cobra/co11.cnf
分片2 192.168.1.8 14021 /dev/shm/data/co21 cobra/co21.cnf
分片3 192.168.1.8 14031 /dev/shm/data/co31 cobra/co31.cnf
分片4 192.168.1.8 14041 /dev/shm/data/co41 cobra/co41.cnf
备份1 192.168.1.8 14051 /dev/shm/data/co51 cobra/co51.cnf
备份2 192.168.1.8 14061 /dev/shm/data/co61 cobra/co61.cnf
备份3 192.168.1.8 14071 /dev/shm/data/co71 cobra/co71.cnf
备份4 192.168.1.8 14081 /dev/shm/data/co81 cobra/co81.cnf
不分片 192.168.1.8 14091 /dev/shm/data/co91 cobra/co91.cnf
编辑好co11.cnf ~ co91.cnf 这9个配置文件,执行init_start.sh即可全部初始化好并启动。这里之所以配置为ip而不是localhost或127.0.0.1是为了后面集群做准备。
第三步:部署Cobar
Cobar只有配置文件,没有其他的元数据,因此关键就在于配置文件的修改,下载的包里面有一个例子配置文件,我们在此基础上做修改。我们第一次先只使用分片1~4,后面的4个等下再使用。
首先我们修改schema.xml,我的内容如下
<?xml version="1.0" encoding="UTF-8"?> <!-- Copyright 1999-2012 Alibaba Group. 。。。。--> <!DOCTYPE cobar:schema SYSTEM "schema.dtd"> <cobar:schema xmlns:cobar="http://cobar.alibaba.com/"> <!-- schema定义 name="lyw" 意思是对外显示的数据库名是lyw,dataNode="dnG"表示默认的数据节点是dnG --> <schema name="lyw" dataNode="dnG"> <table name="h1" dataNode="dn0,dn1,dn2,dn3" rule="ruleLong" /> </schema> <!-- 数据节点定义,数据节点由数据源和其他一些参数组织而成。ds[0]这样的下标是dataSource中数据数组的序号 --> <dataNode name="dn0"> <property name="dataSource"> <dataSourceRef>ds[0]</dataSourceRef> </property> </dataNode> <dataNode name="dn1"> <property name="dataSource"> <dataSourceRef>ds[1]</dataSourceRef> </property> </dataNode> <dataNode name="dn2"> <property name="dataSource"> <dataSourceRef>ds[2]</dataSourceRef> </property> </dataNode> <dataNode name="dn3"> <property name="dataSource"> <dataSourceRef>ds[3]</dataSourceRef> </property> </dataNode> <!-- 不分片的数据源,跟schema第一个dataNode对应 --> <dataNode name="dnG"> <property name="dataSource"> <dataSourceRef>ds[8]</dataSourceRef> </property> </dataNode> <!-- 数据源定义,数据源是一个具体的后端数据连接的表示。 --> <dataSource name="ds" type="mysql"> <property name="location"> <location>192.168.1.8:14011/lyw</location> <location>192.168.1.8:14021/lyw</location> <location>192.168.1.8:14031/lyw</location> <location>192.168.1.8:14041/lyw</location> <location>192.168.1.8:14051/lyw</location> <location>192.168.1.8:14061/lyw</location> <location>192.168.1.8:14071/lyw</location> <location>192.168.1.8:14081/lyw</location> <location>192.168.1.8:14091/lyw</location> </property> <property name="user">lyw</property> <property name="password">123456</property> <property name="sqlMode">STRICT_TRANS_TABLES</property> </dataSource> </cobar:schema>
配置好schema.xml后,我们可以看到里面有个字段rule="ruleLong",这个ruleLong的具体内容是配置在rule.xml文件中,我们这里的配置如下
<?xml version="1.0" encoding="UTF-8"?> <!-- Copyright 1999-2012 Alibaba Group. 。。。。--> <!DOCTYPE cobar:rule SYSTEM "rule.dtd"> <cobar:rule xmlns:cobar="http://cobar.alibaba.com/"> <!-- 路由规则定义,定义什么表,什么字段,采用什么路由算法 --> <!-- 所有路由规则tableRule都必须在所有函数function前面 --> <tableRule name="ruleLong"> <rule> <columns>id</columns> <algorithm><![CDATA[ funcLong(${id}) ]]></algorithm> </rule> </tableRule> <!-- 路由函数定义,所有函数定义都需要在规则下面 --> <!--- partitionCount * partitionLength必须等于1024 --> <function name="funcLong" class="com.alibaba.cobar.route.function.PartitionByLong"> <property name="partitionCount">4</property> <property name="partitionLength">256</property> </function> </cobar:rule>
可以看到ruleLong规则中用到funcLong函数,funcLong函数在下面定义,注意所有函数定义都需要在规则下面,partitionCount * partitionLength必须等于1024,否则无法启动。
然后是server.xml,这个文件修改下用户名密码就可以了,其他用默认参数。
<?xml version="1.0" encoding="UTF-8"?> <!-- Copyright 1999-2012 Alibaba Group. --> <!DOCTYPE cobar:server SYSTEM "server.dtd"> <cobar:server xmlns:cobar="http://cobar.alibaba.com/"> <!-- 用户访问定义,用户名、密码、schema等信息。 --> <user name="lyw"> <property name="password">123456</property> <property name="schemas">lyw</property> </user> </cobar:server>
另外还有个配置文件log4j.xml,无需修改。
我们的配置文件都已准备好,然后就启动吧
$ bin/startup.sh $ jps 15894 CobarStartup 15946 Jps $ netstat -nlp|grep java tcp6 0 0 :::8066 :::* LISTEN 15894/java tcp6 0 0 :::9066 :::* LISTEN 15894/java
java7下可以直接启动,如果时java8需要注释掉startup.sh中的一行。
# JAVA_OPTS="$JAVA_OPTS -XX:+UseCMSCompactAtFullCollection"
请检查下进程是否启动,如果配置有误是无法启动的。启动后,我们可以看到已经开启了两个端口,8066和9066,其中8066是用于数据读写等操作的,9066是用于cobar自身管理的。我们迫不及待的要去试下了。
第四步:使用Cobar
lyw@lywd:~/db/mariadb-10.1$ bin/mysql -ulyw -p123456 -h127.0.0.1 -P8066 MySQL [(none)]> show databases; +----------+ | DATABASE | +----------+ | lyw | +----------+ 1 row in set (0.04 sec) MySQL [(none)]> use lyw; Database changed MySQL [lyw]> show tables; Empty set (0.00 sec) MySQL [lyw]> create table h1 (id int primary key, v varchar(32)); Query OK, 0 rows affected (0.01 sec) MySQL [lyw]> insert into h1 (id, v) values(1, 'aa'), (2, '2'), (256, 'cc'), (600,'dd'),(900, 'ee'), (1000, 'ff'); Query OK, 6 rows affected (0.02 sec) Records: 2 Duplicates: 0 Warnings: 0 MySQL [lyw]> select * from h1; +------+------+ | id | v | +------+------+ | 256 | cc | | 900 | ee | | 1000 | ff | | 600 | dd | | 1 | aa | | 2 | 2 | +------+------+ 6 rows in set (0.00 sec) MySQL [lyw]> select * from h1 where id = 256; +-----+------+ | id | v | +-----+------+ | 256 | cc | +-----+------+ 1 row in set (0.00 sec) MySQL [lyw]> select * from h1 where id in (256, 900, 901); +-----+------+ | id | v | +-----+------+ | 256 | cc | | 900 | ee | +-----+------+ 2 rows in set (0.00 sec)
最后返回的结果看起来有点乱,并且每次执行这样的select语句,顺序都会不同,这是因为我们插入的这6条数据已经根据ruleLong的规则分散在了4个数据库中,返回的时候cobar只是简单的合并,并没有排序。我们这时候可以到4个库中分别查询,每个库都只包含其中的一部分数据。
注意:前面的insert语句中指定了列名(id, v),这是必须的,否则会将数据插入到所有数据库中去,即插入1条等于插入4条。
select * from h1 where id = 256; 这行查询语句指定了id = 256,因此cobar会计算256这个值是在哪个数据库(第二个)因此这条语句只会在第二个数据库中查找
select * from h1 where id in (256, 900, 901); 这行查询语句指定了两个id,cobar会计算这些id都属于哪个库,然后去对应的库查询,实际上会变成两个语句,
在第二个库执行select * from h1 where id in (256),
在第四个库执行select * from h1 where id in (900, 901),
然后合并数据返回。
我们可以用explain命令查看cobar的拆分情况。这个命令只是语法分析,不会到mysql中执行。
MySQL [lyw]> explain select * from h1 where id in (256, 900, 901); +-----------+-----------------------------------------+ | DATA_NODE | SQL | +-----------+-----------------------------------------+ | dn1 | SELECT * FROM h1 WHERE id IN (256) | | dn3 | SELECT * FROM h1 WHERE id IN (900, 901) | +-----------+-----------------------------------------+ 2 rows in set (0.00 sec)
Cobar是不支持事务的,begin命令就不可以运行,很多操作尽量使用语句内原子操作。比如
update h1 set a=a+1 where id = 2;
而不是先读出数据,再修改。拆成两条就需要事务支持才安全了。
Cobar支持多库同时操作,但只是在多个库分别执行后,一起返回数据而已,我们试下下面的几个语句
MySQL [lyw]> select * from h1 limit 1; +-----+------+ | id | v | +-----+------+ | 600 | dd | | 256 | cc | | 1 | aa | | 900 | ee | +-----+------+
我们是想要得到一条数据,而实际上是得到4条,并且是每个库中一条,因此这样的结果并不符合我们的初衷,所以对于分页这样的操作用cobar并不合适。大家还可以去试下sort, group,join等操作,以及他们的组合操作,都是如此。
那Cobar合适的是什么呢?cobar最合适的就是单行的操作,另外还有in这样的多行操作。或者其他只需要一个库就能搞定的操作。这也是需要我们在设计表结构的时候多下工夫才行。
第五步:多种分片方式配置
前面讲了一个按照数字进行hash分片的例子。cobar自身提供了4种分片方法,分别是PartitionByLong,PartitionByString,PartitionByFileMap,Dimension2PartitionFunction。每种方法需要配置的参数都不同
PartitionByString 按字符串hash分片
我们需要修改rule.xml文件,如下部分,记得所有的tableRule 在所有的function前面
<tableRule name="ruleString"> <rule> <columns>id</columns> <algorithm><![CDATA[ funcString(${id}) ]]></algorithm> </rule> </tableRule> <function name="funcString" class="com.alibaba.cobar.route.function.PartitionByString"> <property name="partitionCount">4</property> <property name="partitionLength">256</property> <property name="hashSlice">:12</property> </function>
其中hashSlice的含义是字符串的哪几个字符进行hash运算,例子中:12表示前面的12个字符进行运算,另外还有负数表示法,表示从后面开始数。
在schema.xml增加一个表格
<table name="h3" dataNode="dn0,dn1,dn2,dn3" rule="ruleString" />
配置好后,我们可以用集群管理的reload方法热更新配置文件。(注意端口是9066)
bin/mysql -ulyw -p123456 -h127.0.0.1 -P 9066 MySQL [(none)]> reload @@config; Query OK, 1 row affected (0.02 sec) Reload config success
PartitionByFileMap 按文件内容分片
我们需要修改rule.xml文件,如下部分,
<tableRule name="ruleFileMap"> <rule> <columns>district </columns> <algorithm><![CDATA[ funcFileMap(${id}) ]]></algorithm> </rule> </tableRule> <function name="funcFileMap" class="com.alibaba.cobar.route.function.PartitionByFileMap"> <property name="fileMapPath">/home/lyw/file_map.txt</property> <property name="defaultNode">0</property> </function>
rule.xml中fileMapPath字段我们指定了一个配置文件/home/lyw/file_map.txt,这个文件内容的格式是k=v结构,k是分片的字符串,v是节点序号(不是hash值)。内容如下,您可自己多写一些。
a=0 b=1 c=2 d=3 。。。。。。
defaultNode 字段表示如果key值不在这个配置文件中,那么将数据存储在这个节点中。
然后我们还要在schema.xml增加一个表格
<table name="h5" dataNode="dn0,dn1,dn2,dn3" rule="ruleFileMap" />
只有字符串完整地属于配置文件中,才算匹配到,不是前缀,如例子中只有a,b,c,d可以找到对应的节点,其他任何值都将放入默认节点。因此这种方式一般不是用于id等主键字段,而是其他种类有限的字段,如国家、省份等。
Dimension2PartitionFunction 二维分片
二维分片有两个维度,都需要配置,因此配置内容较多
rule.xml:
<tableRule name="rule2D"> <rule> <columns>id, id2</columns> <algorithm><![CDATA[ func2D(${id}, ${id2}) ]]></algorithm> </rule> <rule> <columns>id</columns> <algorithm><![CDATA[ func2D(${id}, null) ]]></algorithm> </rule> <rule> <columns>id2</columns> <algorithm><![CDATA[ func2D(null, ${id2}) ]]></algorithm> </rule> </tableRule> <function name="func2D" class="com.alibaba.cobar.route.function.Dimension2PartitionFunction"> <property name="keyTypeX">string</property> <property name="partitionCountX">2</property> <property name="partitionLengthX">512</property> <property name="hashSliceX">:12</property> <property name="keyTypeY">long</property> <property name="partitionCountY">2</property> <property name="partitionLengthY">512</property> </function>
从rule.xml文件中我们看到tableRule配置了三个rule,其中第一个规则是有两个参数的,后两个规则只有一个参数,这3个rule不是必须全配置,但是要实现只匹配一个维度的话,就需要配置,否则当查询语句中只有一个维度的key时会进行所有库的执行,效率不高。
函数需要指定两个维度,字符串和数字都可以,其他类型目前不支持。
同样schema.xml增加一个表格
<table name="d1" dataNode="dn0,dn1,dn2,dn3" rule="rule2D" />
如果需要二维分片,集群规模一般要相当大了,比如8*8=64,否则采用二维分片的意义不大。
第六步:Cobar自身集群配置
前面配置的cobar只是在一台机器上运行,而运行时cobar需要的资源是比较多的,一台cobar可以拖3台左右mysql服务器,而实际上只要用到cobar,mysql数量都在8台以上,所以需要多个cobar支撑,集群相关的内容在server.xml中配置,
<cluster> <node name="cobar1"> <property name="host">192.168.1.8</property> <property name="weight">1</property> </node> <node name="cobar2"> <property name="host">192.168.1.9</property> <property name="weight">1</property> </node> <node name="cobar3"> <property name="host">192.168.1.10</property> <property name="weight">1</property> </node> </cluster>
每增加一台机器就多配置一个node,然后将这个配置文件复制到每台cobar电脑上,并启动。这时我们在任意一台电脑上用下面的命令查看活着的集群(宕机的节点不会显示)
MySQL [lyw]> show cobar_cluster; +--------------+--------+ | HOST | WEIGHT | +--------------+--------+ | 192.168.1.8 | 1 | | 192.168.1.9 | 1 | | 192.168.1.10 | 1 | +--------------+--------+ 3 rows in set (0.00 sec)
此处虽然有host和weight两个值,但是cobar并没有做负载均衡相关的具体事情,只是告诉客户端,cobar集群的运行情况,让客户端自己制定负载均衡策略。
第七步:Cobar自身管理
前面讲的是数据操作,用的是8066端口,cobar提供集群管理功能默认用的是9066端口
bin/mysql -ulyw -p123456 -h127.0.0.1 -P9066 MySQL [(none)]> show @@help;
reload命令会是一个常用命令,当修改了配置文件,就执行下这个命令让配置生效。
MySQL [(none)]> reload @@config; Query OK, 1 row affected (0.01 sec) Reload config success
注意server.xml中的system部分不可以热加载,需要重启生效。
如果加载后发现有误,可以用rollback命令回滚配置,注意只能回滚一次。
假如我们要看下所有服务器的活动情况,我们可以用下面的命令
MySQL [(none)]> show @@heartbeat; +--------+-------+-------------+-------+---------+-------+----------+---------+--------------+---------------------+-------+ | NAME | TYPE | HOST | PORT | RS_CODE | RETRY | STATUS | TIMEOUT | EXECUTE_TIME | LAST_ACTIVE_TIME | STOP | +--------+-------+-------------+-------+---------+-------+----------+---------+--------------+---------------------+-------+ | cobar1 | COBAR | 192.168.1.8 | 8066 | 1 | 0 | idle | 10000 | 0,0,0 | 2015-10-22 10:33:28 | false | | cobar2 | COBAR | 192.168.1.9 | 8066 | -1 | 3 | checking | 10000 | 0,0,0 | 2015-10-22 10:33:27 | false | | cobar3 | COBAR | 192.168.1.10| 8066 | -1 | 1 | checking | 10000 | 0,0,0 | 2015-10-22 10:33:26 | false | | dn0 | MYSQL | 192.168.1.8 | 14011 | 0 | 0 | idle | -1 | 0,0,0 | NULL | false | | dn1 | MYSQL | 192.168.1.8 | 14021 | 0 | 0 | idle | -1 | 0,0,0 | NULL | false | | dn2 | MYSQL | 192.168.1.8 | 14031 | 0 | 0 | idle | -1 | 0,0,0 | NULL | false | | dn3 | MYSQL | 192.168.1.8 | 14041 | 0 | 0 | idle | -1 | 0,0,0 | NULL | false | | dnG | MYSQL | 192.168.1.8 | 14091 | 0 | 0 | idle | -1 | 0,0,0 | NULL | false | +--------+-------+-------------+-------+---------+-------+----------+---------+--------------+---------------------+-------+ 8 rows in set (0.00 sec)
前面3行是cobar自身集群,我这里只启动了一台,所以只有一台的状态是正常的,其他两台都不可用,一直在尝试检查是否活动起来。
下面5台并没有开启心跳,所以timeout是-1,不会进行检查,直接认为是正常的。
其他命令您可以自己尝试,都很好理解。
第八步:dataNode的高可用配置
细心的您一定发现了我们开始的时候部署了9个mysql,但是我们只有用到了5台,另外4台还没有用起来,现在我们要将另外4台也用起来。
我们计划将另外4台和前面4台两两配置为双主(也可以是其他方案,如galera等)
然后修改我们的配置文件schema.xml中dataNode的内容,每个dataNode都增加一台对应的服务器,并且配置上心跳,(实际上心跳最好是写操作的语句)
<!-- 数据节点定义,数据节点由数据源和其他一些参数组织而成。 --> <dataNode name="dn0"> <property name="dataSource"> <dataSourceRef>ds[0]</dataSourceRef> <dataSourceRef>ds[4]</dataSourceRef> </property> <property name="heartbeatSQL">select user()</property> </dataNode> <dataNode name="dn1"> <property name="dataSource"> <dataSourceRef>ds[1]</dataSourceRef> <dataSourceRef>ds[5]</dataSourceRef> </property> <property name="heartbeatSQL">select user()</property> </dataNode> <dataNode name="dn2"> <property name="dataSource"> <dataSourceRef>ds[2]</dataSourceRef> <dataSourceRef>ds[6]</dataSourceRef> </property> <property name="heartbeatSQL">select user()</property> </dataNode> <dataNode name="dn3"> <property name="dataSource"> <dataSourceRef>ds[3]</dataSourceRef> <dataSourceRef>ds[7]</dataSourceRef> </property> <property name="heartbeatSQL">select user()</property> </dataNode>
然后reload配置,在用show @@datanode;命令检查下运行情况
MySQL [(none)]> show @@datanode; +------+-------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+ | NAME | DATASOURCES | INDEX | TYPE | ACTIVE | IDLE | SIZE | EXECUTE | TOTAL_TIME | MAX_TIME | MAX_SQL | RECOVERY_TIME | +------+-------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+ | dn0 | ds[0],ds[4] | 0 | mysql | 0 | 0 | 128 | 0 | 0 | 0 | 0 | -1 | | dn1 | ds[1],ds[5] | 0 | mysql | 0 | 0 | 128 | 0 | 0 | 0 | 0 | -1 | | dn2 | ds[2],ds[6] | 0 | mysql | 0 | 0 | 128 | 0 | 0 | 0 | 0 | -1 | | dn3 | ds[3],ds[7] | 0 | mysql | 0 | 0 | 128 | 0 | 0 | 0 | 0 | -1 | | dnG | ds[8] | 0 | mysql | 0 | 0 | 128 | 0 | 0 | 0 | 0 | -1 | +------+-------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+ 5 rows in set (0.01 sec)
我们发现DATASOURCES中前面4个都有两个节点,INDEX目前都是0,表示连接的是前面这个节点。
这时我们模拟宕机,将ds[0]这个节点kill掉,过几秒钟再用上面这个命令查看时,就会发现第一个INDEX变成了1,也就是说用到的是ds[4]节点。之后的读写都会在ds[4]中操作。
然后我们重新启动ds[0],再查状态,发现还是INDEX还是维持1,cobar不会主动切换回去。假如我们想切换回去,可以用命令switch @@datasource name:index,(序号参数可选)
MySQL [(none)]> switch @@datasource dn0:0; Query OK, 1 row affected (0.03 sec)
注意该功能只会修改当前cobar的配置,其他节点并不会一同修改,因此有一定风险。配置文件的加载也是一样,多个节点间不会同步,因此也有一点风险。
至此Cobar的基本特性就是这样了,更多的高级功能就在逐步的使用中去发现吧。