关于分布式:Mycat作为Mycat核心开发者怎能不来一波Mycat系列文章

写在后面

Mycat是基于阿里开源的Cobar产品而研发，Cobar的稳定性、可靠性、优良的架构和性能以及泛滥成熟的应用案例使得Mycat一开始就领有一个很好的终点，站在伟人的肩膀上，咱们能看到更远。业界优良的开源我的项目和翻新思路被宽泛融入到Mycat的基因中，使得Mycat在很多方面都当先于目前其余一些同类的开源我的项目，甚至超过某些商业产品。——来自Mycat官网。

作为Mycat的外围开发者，怎能不来一波Mycat系列文章呢？

背景介绍

作为Mycat的外围开发者之一，明天，终于安顿到Mycat系列文章了。在Mycat系列文章中，咱们一起从一个利用Mycat实现分库分表的案例作为入门程序。后续会继续更新Mycat原理、架构和底层源码解析的文章。心愿Mycat系列文章可能帮忙小伙伴们彻底把握Mycat。

那么，明天，咱们就先来一波应用Mycat实现MySQL分库分表的文章。

注：案例中的MySQL服务器是装置在CentOS6.8服务器上，Mycat Server是装置在本机的Windows零碎上，装置在什么环境上无所谓，这里，我用的是VMWare虚拟机，装置的CentOS零碎，开启多个虚拟机，电脑切实是吃力，所以将Mycat Server装在了本机的Windows零碎上。

计划布局

如上表所示，在局域网的4台主机中，131——133的主机各装置有一台MySQL实例，130主机，也就是本机装置了Mycat Server。

当初假如零碎的数据库为messagedb，外面只有2张表，一张表为音讯表：message，一张示意消息来源的字典表：source，本案例实现的是按天然月分片的规定，因而上述3个mysql实例各自须要创立4个数据库，即

阐明：如果是刚接触Mycat的小伙伴对分片不太了解，简略地说，对于Mycat，一个分片示意某一个MySQL实例上的某一个数据库，即schema@host，于是当咱们原先的一张大表须要分片的时候，mycat就会依照咱们设定的规定，把这张大表中的数据扩散到各个分片上，即所谓的分表分库，因而咱们须要在每个对应的分片上创立雷同名称的数据库，雷同构造的表。

环境筹备

留神：这里，我就省略了MySQL的装置过程，小伙伴们可自行装置MySQL。我后续也会在MySQL相干的专题中给大家分享企业级MySQL装置、优化与部署过程。

创立数据库并建表导入数据

依据数据库实例和存储的数据库对应关系表创立所有的数据库，并在每个数据库里执行如下脚本：

create table source (
        id int(11) not null auto_increment primary key comment 'pk',
        name varchar(10) default '' comment 'source name'
);
create table message (
        id int(11) not null auto_increment primary key comment 'pk',
        content varchar(255) default '' comment 'message content',
        create_time date default null,
        source_id int(11) not null,
        foreign key(source_id) references source(id)
);
insert into `source`(`id`,`name`) values(1,'weibo');
insert into `source`(`id`,`name`) values(2,'weixin');
insert into `source`(`id`,`name`) values(3,'qq');
insert into `source`(`id`,`name`) values(4,'email');
insert into `source`(`id`,`name`) values(5,'sms');

在message表中，总共有4个字段：

id：主键
content：音讯的内容
create_time：创立工夫，这也是mycat进行分片时的参考字段
source_id：source表的外键

另外，咱们在source表插入了5条记录，用于测试。到这里，后端数据库的环境就搭建实现了。

装置和配置Mycat

装置Mycat

装置Mycat的过程比较简单，在这个地址就能够下载安装包：https://github.com/MyCATApache/Mycat-download/tree/master/1.6-RELEASE。下载完之后，就进行解压到零碎相应目录，这里就不细说了。

Mycat安装包构造

装置完之后，简略地看一下mycat目录构造：

启动Mycat

WIndows下启动须要以管理员身份关上命令行窗口，cd 到Mycat的bin目录下，或者将Mycat的装置目录退出零碎的环境变量path目录里，首先输出命令mycat install进行mycat服务的安装操作，而后输出命令mycat start 启动Mycat Server。

Linux下进入Mycat的bin目录间接输出./mycat start 启动Mycat Server。

Mycat提供了两个端口，其中，9066端口是治理端口，提供查看以后零碎节点的状况，报告心跳状态等相干系统监控的性能，8066是数据端口，相当于数据库的拜访端口。咱们能够应用mysql命令拜访这里两个端口

mysql -h[mycat_host] -u[mycat_user] -p[mycat_passwd] -P [8066|9066]

同时，咱们也能够批改这两个端口。

那么mycat_user和mycat_passwd是如何配置呢，上面就须要介绍mycat中最次要的3个配置文件：server.xml，schema.xml和rule.xml。

server.xml

该配置文件是用于配置mycat的零碎信息，次要有两个标签：system和user。这里的user就是上述拜访mycat服务的用户，不是后端数据库的用户。如果咱们应用默认的配置，server.xml大略是这样的：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
        <system>
                <property name="useSqlStat">0</property>  
                <property name="useGlobleTableCheck">0</property> 
                <property name="sequnceHandlerType">2</property>
                <property name="processorBufferPoolType">0</property>
                <property name="useOffHeapForMerge">1</property>
                <property name="memoryPageSize">1m</property>
                <property name="spillsFileBufferSize">1k</property>
                <property name="useStreamOutput">0</property>
                <property name="systemReserveMemorySize">384m</property>
        </system>
 
        <user name="admin">
                <property name="password">admin123</property>
                <property name="schemas">messagedb</property>
        </user>
</mycat:server>

user标签下schemas属性示意该用户能够拜访的数据库，能够定义多个数据库，用英文逗号隔开。schemas定义的数据库，肯定要配置在前面的schema.xml文件对应的逻辑库，否则会提醒无法访问。

schema.xml

schema配置文件比较复杂，也是最要害的一个配置文件，定义了mycat中的逻辑库、逻辑表，和分片的相干信息。配置如下：

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
 
        <schema name="messagedb" checkSQLschema="false" sqlMaxLimit="100">
                <table name="message" dataNode="dn1,dn2,dn3,dn4,dn5,dn6,dn7,dn8,dn9,dn10,dn11,dn12" rule="sharding-by-month" />
                <table name="source" primaryKey="id" type="global" dataNode="dn1,dn2,dn3,dn4,dn5,dn6,dn7,dn8,dn9,dn10,dn11,dn12" />
        </schema>
        <dataNode name="dn1" dataHost="mysql-01" database="message202001" />
        <dataNode name="dn2" dataHost="mysql-01" database="message202002" />
        <dataNode name="dn3" dataHost="mysql-01" database="message202003" />
        <dataNode name="dn4" dataHost="mysql-01" database="message202004" />
        <dataNode name="dn5" dataHost="mysql-02" database="message202005" />
        <dataNode name="dn6" dataHost="mysql-02" database="message202006" />
        <dataNode name="dn7" dataHost="mysql-02" database="message202007" />
        <dataNode name="dn8" dataHost="mysql-02" database="message202008" />
        <dataNode name="dn9" dataHost="mysql-03" database="message202009" />
        <dataNode name="dn10" dataHost="mysql-03" database="message202010" />
        <dataNode name="dn11" dataHost="mysql-03" database="message202011" />
        <dataNode name="dn12" dataHost="mysql-03" database="message202012" />
 
        <dataHost name="mysql-01" maxCon="1000" minCon="10" balance="0"
                          writeType="0" dbType="mysql" dbDriver="native" switchType="-1">
                <heartbeat>select user()</heartbeat>
                <writeHost host="hostM1" url="192.168.81.131:3306" user="root"
                                   password="root">
                </writeHost>
        </dataHost>
 
        <dataHost name="mysql-02" maxCon="1000" minCon="10" balance="0"
                          writeType="0" dbType="mysql" dbDriver="native" switchType="-1">
                <heartbeat>select user()</heartbeat>
                <writeHost host="hostM2" url="192.168.81.132:3306" user="root"
                                   password="root">
                </writeHost>
        </dataHost>
 
        <dataHost name="mysql-03" maxCon="1000" minCon="10" balance="0"
                          writeType="0" dbType="mysql" dbDriver="native" switchType="-1">
                <heartbeat>select user()</heartbeat>
                <writeHost host="hostM3" url="192.168.81.133:3306" user="root"
                                   password="root">
                </writeHost>
        </dataHost>
</mycat:schema>

这里，有几点要阐明一下：

schema标签定义逻辑库，其下table子标签定义逻辑表，datanode属性定义该逻辑表须要散布到哪几个分片上，rule属性示意应用何种分片规定，这里咱们抉择sharding-by-month，这个规定的名称是自定义的，只有和前面的rule.xml对应起来即可
source表是一张全局表，这里须要应用type=”global”来定义，这样mycat就能够帮咱们在指定的分片上克隆雷同的数据，这对join查问是十分有益处的。
datanode标签定义了分片，datahost是主机名，对应dataHost标签的name属性值，database定义该主机数据库实例上的具体数据库名。
dataHost标签定义数据库实例，其下heartbeart标签示意心跳检测所应用的办法，writeHost标签定义写数据的实例，另外还有readHost标签能够定义读数据的实例，这里不思考读写拆散，仅应用写实例，因而须要把balance属性设置为0
出于标准和平安思考，最好不应用数据库的root用户，而是另外再创立一个用于mycat拜访的用户。

rule.xml

rule.xml中定义了很多分片的规定，具体规定的算法能够参考官网权威指南，这里咱们间接应用默认的就能够了，其中按天然月的分片规定配置如下：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
     <tableRule name="sharding-by-month">
                <rule>
                        <columns>create_time</columns>
                        <algorithm>partbymonth</algorithm>
                </rule>
        </tableRule>
        <function name="partbymonth"
                class="io.mycat.route.function.PartitionByMonth">
                <property name="dateFormat">yyyy-MM-dd</property>
                <property name="sBeginDate">2020-01-01</property>
        </function>
</mycat:rule>

tableRule标签定义分片规定的，其下columns标签示意对数据库表中的哪个字段利用规定，algorithm指定实现算法的名称，对应的是function标签中的name属性值
function标签定义对应的实现类，以及参数，包含dateFormat（日期格局）和sBeginDate（起始日期）

阐明：起始日期是用来计算数据所在的分片地位，例如2020年1月的message就会找到第1个分片，即dn1，2020年12月的message就会找到第12个分片，即dn12，然而如果呈现了2018年1月的message，mycat就会去找第13个分片，然而配置文件中又没有对应的配置，那么就会抛出无奈找到分片的谬误。

综上：server.xml定义了拜访mycat服务的用户，以及该用户受权的数据库（逻辑库），schema.xml定义了具体的逻辑库，逻辑表，以及分片和数据库实例的信息，rule.xml分片规定和实现类

测试

到这里曾经实现了mycat的配置文件，但先不急着往里面灌数据，咱们先拜访治理端口9066，看一下运行状况：

C:\Users\binghe>mysql -uadmin -padmin123 -P9066
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 7
Server version: 5.6.29-mycat-1.6-RELEASE-20161028204710 MyCat Server (monitor)

Copyright (c) 2000, 2019, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> show @@datanode;
+------+------------------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+
| NAME | DATHOST                | INDEX | TYPE  | ACTIVE | IDLE | SIZE | EXECUTE | TOTAL_TIME | MAX_TIME | MAX_SQL | RECOVERY_TIME |
+------+------------------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+
| dn1  | mysql-01/message202001 |     0 | mysql |      0 |    4 | 1000 |     412 |          0 |        0 |       0 |            -1 |
| dn10 | mysql-03/message202010 |     0 | mysql |      0 |    0 | 1000 |      11 |          0 |        0 |       0 |            -1 |
| dn11 | mysql-03/message202011 |     0 | mysql |      0 |    8 | 1000 |      16 |          0 |        0 |       0 |            -1 |
| dn12 | mysql-03/message202012 |     0 | mysql |      0 |    1 | 1000 |     412 |          0 |        0 |       0 |            -1 |
| dn2  | mysql-01/message202002 |     0 | mysql |      0 |    2 | 1000 |       9 |          0 |        0 |       0 |            -1 |
| dn3  | mysql-01/message202003 |     0 | mysql |      0 |    4 | 1000 |      11 |          0 |        0 |       0 |            -1 |
| dn4  | mysql-01/message202004 |     0 | mysql |      0 |    2 | 1000 |       9 |          0 |        0 |       0 |            -1 |
| dn5  | mysql-02/message202005 |     0 | mysql |      0 |    4 | 1000 |     413 |          0 |        0 |       0 |            -1 |
| dn6  | mysql-02/message202006 |     0 | mysql |      0 |    2 | 1000 |       9 |          0 |        0 |       0 |            -1 |
| dn7  | mysql-02/message202007 |     0 | mysql |      0 |    4 | 1000 |      11 |          0 |        0 |       0 |            -1 |
| dn8  | mysql-02/message202008 |     0 | mysql |      0 |    2 | 1000 |       9 |          0 |        0 |       0 |            -1 |
| dn9  | mysql-03/message202009 |     0 | mysql |      0 |    0 | 1000 |      11 |          0 |        0 |       0 |            -1 |
+------+------------------------+-------+-------+--------+------+------+---------+------------+----------+---------+---------------+
12 rows in set (0.00 sec)

mysql> show @@heartbeat;
+--------+-------+----------------+------+---------+-------+--------+---------+--------------+---------------------+-------+
| NAME   | TYPE  | HOST           | PORT | RS_CODE | RETRY | STATUS | TIMEOUT | EXECUTE_TIME | LAST_ACTIVE_TIME    | STOP  |
+--------+-------+----------------+------+---------+-------+--------+---------+--------------+---------------------+-------+
| hostM2 | mysql | 192.168.81.132 | 3306 |       1 |     0 | idle   |       0 | 1,1,1        | 2020-03-04 14:22:59 | false |
| hostM1 | mysql | 192.168.81.131 | 3306 |       1 |     0 | idle   |       0 | 1,1,1        | 2020-03-04 14:22:59 | false |
| hostM3 | mysql | 192.168.81.133 | 3306 |       1 |     0 | idle   |       0 | 2,1,1        | 2020-03-04 14:22:59 | false |
+--------+-------+----------------+------+---------+-------+--------+---------+--------------+---------------------+-------+
3 rows in set (0.00 sec)

mysql>

如果看到各个节点都曾经呈现，并且心跳状态RS_CODE=1，则示意后端数据库连贯失常。

当初咱们用JDBC的形式批量插入1000万数据：

package com.mycat.test;
 
import java.sql.Connection;
import java.sql.Date;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.SQLException;
import java.util.Calendar;
import java.util.Random;
 
import org.junit.Test;
 
/**
 * 测试Mycat
 * @author binghe
 */
public class TestMycat {
    private static final String driver = "com.mysql.jdbc.Driver";
    private static final String url = "jdbc:mysql://127.0.0.1:8066/messagedb?useServerPrepStmts=false&rewriteBatchedStatements=true";
    private static final String username = "admin";
    private static final String password = "admin123";
 
    @Test
    public void test() throws SQLException {
        Calendar calendar = Calendar.getInstance();
        Random random = new Random();
        calendar.set(2020, 0, 1, 0, 0, 0);
    
        Connection connection = null;
        PreparedStatement ps = null;
        try {
            Class.forName(driver);
            connection = (Connection) DriverManager.getConnection(url, username, password);
            connection.setAutoCommit(false);
            String sql = "insert into message(`content`, `create_time`, `source_id`) values(?,?,?)";
            ps = connection.prepareStatement(sql);
            long start = System.currentTimeMillis();
            for (int i = 0; i < 10000000; i++) {
                ps.setString(1, System.currentTimeMillis() + "");
                long randomtime = calendar.getTimeInMillis() + (random.nextInt(365) + 1) * 86400 * 1000l;
                Date date = new Date(randomtime);
                int source_id = random.nextInt(5) + 1;
                ps.setDate(2, date);
                ps.setInt(3, source_id);
                ps.addBatch();
                if (i != 0 && i % 10000 == 0) {
                    System.out.println("execute batch : " + i);
                    ps.executeBatch();
                }
            }
            ps.executeBatch();
            connection.commit();
            System.out.println(System.currentTimeMillis() - start);
        } catch (SQLException | ClassNotFoundException e) {
            e.printStackTrace();
        } finally {
            if (ps != null)
                ps.close();
            if (connection != null)
                connection.close();
        }
    }
 
}

如果运行的时候报错： Multi-statement transaction required more than ‘max_binlog_cache_size’ bytes of storage; 能够适当调大一下my.cnf下的max_binlog_cache_size参数。

验证

最初咱们来测验一下分片的后果，其中message表中的数据依据create_time的值按月进行了分片，而source表作为全局表，则其数据呈现在了每个分片上，上面贴出局部后果

mysql -h192.168.81.131 -uroot -proot -P3306 -e "select min(create_time),max(create_time) from message202002.message;": 
+------------------+------------------+
| min(create_time) | max(create_time) |
+------------------+------------------+
| 2020-02-01       | 2020-02-28       |
+------------------+------------------+
 
mysql -h192.168.81.132 -uroot -proot -P3306 -e "select min(create_time),max(create_time) from message202005.message;": 
+------------------+------------------+
| min(create_time) | max(create_time) |
+------------------+------------------+
| 2020-05-01       | 2020-05-31       |
+------------------+------------------+
 
mysql -h192.168.81.133 -uroot -proot -P3306 -e "select min(create_time),max(create_time) from message202009.message;": 
+------------------+------------------+
| min(create_time) | max(create_time) |
+------------------+------------------+
| 2020-09-01       | 2020-09-30       |
+------------------+------------------+

mysql -h192.168.81.131 -uroot -proot -P3306 -e "select * from message202001.source"
+----+--------+
| id | name   |
+----+--------+
|  1 | weibo  |
|  2 | weixin |
|  3 | qq     |
|  4 | email  |
|  5 | sms    |
+----+--------+
 
mysql -h192.168.81.132 -uroot -proot -P3306 -e "select * from message202007.source"
+----+--------+
| id | name   |
+----+--------+
|  1 | weibo  |
|  2 | weixin |
|  3 | qq     |
|  4 | email  |
|  5 | sms    |
+----+--------+
 
mysql -h192.168.81.133 -uroot -proot -P3306 -e "select * from message202011.source"
+----+--------+
| id | name   |
+----+--------+
|  1 | weibo  |
|  2 | weixin |
|  3 | qq     |
|  4 | email  |
|  5 | sms    |
+----+--------+

总结

本文就mycat分片的个性进行一次实战操作，实现了部署mycat-server以及后端mysql数据库，并以按天然月为分片规定进行了相干的配置，最初做了一个小的测试来验证分片性能的正确性。

好了，明天Mycat系列文章的入门案例就到这儿吧，大家有啥好的意见或倡议都能够在文末留言，我是冰河，咱们下期见！！

重磅福利

微信搜一搜【冰河技术】微信公众号，关注这个有深度的程序员，每天浏览超硬核技术干货，公众号内回复【PDF】有我筹备的一线大厂面试材料和我原创的超硬核PDF技术文档，以及我为大家精心筹备的多套简历模板（不断更新中），心愿大家都能找到心仪的工作，学习是一条时而郁郁寡欢，时而开怀大笑的路，加油。如果你通过致力胜利进入到了心仪的公司，肯定不要懈怠放松，职场成长和新技术学习一样，逆水行舟。如果有幸咱们江湖再见！

另外，我开源的各个PDF，后续我都会继续更新和保护，感激大家长期以来对冰河的反对！！

写在最初

如果你感觉冰河写的还不错，请微信搜寻并关注「 冰河技术 」微信公众号，跟冰河学习高并发、分布式、微服务、大数据、互联网和云原生技术，「 冰河技术 」微信公众号更新了大量技术专题，每一篇技术文章干货满满！不少读者曾经通过浏览「 冰河技术 」微信公众号文章，吊打面试官，胜利跳槽到大厂；也有不少读者实现了技术上的飞跃，成为公司的技术骨干！如果你也想像他们一样晋升本人的能力，实现技术能力的飞跃，进大厂，升职加薪，那就关注「 冰河技术 」微信公众号吧，每天更新超硬核技术干货，让你对如何晋升技术能力不再迷茫！

关于分布式:Mycat作为Mycat核心开发者怎能不来一波Mycat系列文章

写在后面

背景介绍

计划布局

环境筹备

创立数据库并建表导入数据

装置和配置Mycat

装置Mycat

Mycat安装包构造

启动Mycat

server.xml

schema.xml

rule.xml

测试

验证

总结

重磅福利

写在最初

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于分布式:Mycat作为Mycat核心开发者怎能不来一波Mycat系列文章

写在后面

背景介绍

计划布局

环境筹备

创立数据库并建表导入数据

装置和配置Mycat

装置Mycat

Mycat安装包构造

启动Mycat

server.xml

schema.xml

rule.xml

测试

验证

总结

重磅福利

写在最初

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复