一、简介

  • 实现方式:一致性hash分片,利用一个分片节点对应一个或者多个虚拟hash桶的思想,尽可能减少分片扩展时的数据迁移。
  •  
  • 优点:有效解决了分布式数据库的扩容问题;
  • 缺点:在横向扩展的时候,需要迁移部分数据;由于虚拟桶倍数与分片节点数都必须是正整数,而且要服从"虚拟桶倍数×分片节点数 = 设计极限",因此在横向扩容的过程中,增加分片节点并不是一台一台地加上去的,而是以一种因式分解的方式增加,因此有浪费物理计算力的可能性;

二、一致性hash分片

实现步骤:

【a】创建数据库和表

create database hash01;
create table user(id bigint not null primary key,name varchar(20));
create database hash02;
create table user(id bigint not null primary key,name varchar(20));

mysql 一致性hash扩容 mycat 一致性hash_权重

【b】配置server.xml

<user name="root">
        <property name="password">0905</property>
        <property name="schemas">TESTHASH</property>

        <!-- 表级 DML 权限设置 -->
        <!--            
        <privileges check="false">
                <schema name="TESTDB" dml="0110" >
                        <table name="tb01" dml="0000"></table>
                        <table name="tb02" dml="1111"></table>
                </schema>
        </privileges>           
         -->
</user>

<user name="user">
        <property name="password">user</property>
        <property name="schemas">TESTHASH</property>
        <property name="readOnly">true</property>
</user>

【c】配置分片规则rule.xml

<function name="murmur"
        class="io.mycat.route.function.PartitionByMurmurHash">
        <property name="seed">0</property><!-- 默认是0 -->
        <property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
        <property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点,默认是160倍,也就是虚拟节点数是物理节点数的160倍 -->
        <!-- <property name="weightMapFile">weightMapFile</property> 节点的权重,没有指定权重的节点默认是1。以properties文件的格式填写,以从0开始到count-1的整数值也就是节点索引为key,以节点权重值为值。所有权重值必须是正整数,否则以1>代替 -->
        <property name="bucketMapPath">/etc/mycat/bucketMapPath</property>    
        <!--    用于测试时观察各物理节点与虚拟节点的分布情况,如果指定了这个属性,会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件,没有默认值,如果不指定,就不会输出任何东西 -->
</function>


<tableRule name="sharding-by-murmur">
        <rule>
                <columns>id</columns>
                <algorithm>murmur</algorithm>
        </rule>
</tableRule>

【d】schema.xml配置分片表、分片节点等

<schema name="TESTHASH" checkSQLschema="true" sqlMaxLimit="1000">
        <table name="user" dataNode="dn$1-3" primaryKey="id" rule="sharding-by-murmur" />
</schema>

<dataNode name="dn1" dataHost="dataHost01" database="hash01" />
<dataNode name="dn2" dataHost="dataHost01" database="hash02" />
<dataNode name="dn3" dataHost="dataHost01" database="hash01" />

<dataHost name="dataHost01" maxCon="1000" minCon="10" balance="0"
                  writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
        <heartbeat>select user()</heartbeat>
        <writeHost host="hostM1" url="192.168.179.131:3306" user="root" password="0905" />
</dataHost>

mysql 一致性hash扩容 mycat 一致性hash_一致性hash_02

【e】测试插入数据:

重启mycat:

  • cd /bin
  • ./mycat restart
  • mysql -uroot -p0905 -h192.168.179.130 -P8066
insert into user(id,name) values(1111111,database());
insert into user(id,name) values(2222222,database());
insert into user(id,name) values(3333333,database());
insert into user(id,name) values(4444444,database());
insert into user(id,name) values(8960000,database());

 

mysql 一致性hash扩容 mycat 一致性hash_mysql 一致性hash扩容_03

mysql 一致性hash扩容 mycat 一致性hash_权重_04

explain select * from user;

mysql 一致性hash扩容 mycat 一致性hash_权重_05

  • 可见,如果不使用分片字段进行查询,那么sql语句将会发往所有分片。
explain select * from user where id = 1111111;

mysql 一致性hash扩容 mycat 一致性hash_权重_06

可见,如果使用分片字段进行查询,那么sql语句只会发往该条数据对应的分片。

【f】下面我们测试一下指定分片节点的权重

修改rule.xml:

<function name="murmur"
        class="io.mycat.route.function.PartitionByMurmurHash">
        <property name="seed">0</property><!-- 默认是0 -->
        <property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 -->
        <property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点,默认是160倍,也就是虚拟节点数是物理节点数的160倍 -->
        <property name="weightMapFile">murmurhash-mapfile.txt</property><!-- 节点的权重,没有指定权重的节点默认是1。以properties文件的格式填写,以从0开始到count-1的整数值也就是节点索引为key,以节点权重值为值。所有权重值必须是正整数,
否则以1代替 -->
        <property name="bucketMapPath">/etc/mycat/bucketMapPath</property>
        <!--    用于测试时观察各物理节点与虚拟节点的分布情况,如果指定了这个属性,会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件,没有默认值,如果不指定,就不会输出任何东西 -->
</function>

mysql 一致性hash扩容 mycat 一致性hash_一致性hash_07

  • vim murmurhash-mapfile.txt  
  • datanode index = 权重
0=2
1=1

配置dn0即第一个节点的权重稍微大一点,然后测试插入数据:

insert into user(id,name) values(6666666,database());
insert into user(id,name) values(7777777,database());
insert into user(id,name) values(8888888,database());
insert into user(id,name) values(9999999,database());

mysql 一致性hash扩容 mycat 一致性hash_一致性hash_08

可见,配置的权重越高,数据被分配到该节点的几率就越大。

【g】原理图

mysql 一致性hash扩容 mycat 一致性hash_一致性hash_09

节点扩展时:

mysql 一致性hash扩容 mycat 一致性hash_分库分表_10