29MyCat - 分片规则（固定分片hash算法）

原创

阿甘兄_ 2022-03-24 11:22:16 ©著作权

©著作权归作者所有：来自51CTO博客作者阿甘兄_的原创作品，请联系作者获取转载授权，否则将追究法律责任

本条规则类似于十进制的求模运算，区别在于是二进制的操作,是取id的二进制低10位，即id二进制&1111111111。

此算法的优点在于如果按照10进制取模运算，在连续插入1-10时候1-10会被分到1-10个分片，增大了插入的事务控制难度，而此算法根据二进制则可能会分到连续的分片，减少插入事务事务控制难度。

<tableRule name="rule1">
   <rule>
     <columns>user_id</columns>
     <algorithm>func1</algorithm>
   </rule>
</tableRule>
 <function name="func1" class="org.opencloudb.route.function.PartitionByLong">
   <property name="partitionCount">2,1</property>
   <property name="partitionLength">256,512</property>
 </function>

配置说明：

上面columns 标识将要分片的表字段，algorithm 分片函数。

partitionCount 分片个数列表，partitionLength 分片范围列表。

分区长度:默认为最大2^n=1024 ,即最大支持1024分区。

约束：

count,length两个数组的长度必须是一致的。

1024 = sum((count[i]*length[i])). count和length两个向量的点积恒等于1024。

用法例子

本例的分区策略：希望将数据水平分成3份，前两份各占25%，第三份占50%。（故本例非均匀分区）

// |<———————1024————————>|
// |<—-256—>|<—-256—>|<———-512———->|
// | partition0 | partition1 | partition2 |
// | 共2份,故count[0]=2 | 共1份，故count[1]=1 |
int[] count = new int[] { 2, 1 };
int[] length = new int[] { 256, 512 };
PartitionUtil pu = new PartitionUtil(count, length);

// 下面代码演示分别以offerId字段或memberId字段根据上述分区策略拆分的分配结果
 int DEFAULT_STR_HEAD_LEN = 8; // cobar默认会配置为此值
 long offerId = 12345;
 String memberId = "qiushuo";

 // 若根据offerId分配，partNo1将等于0，即按照上述分区策略，offerId为12345时将会被分配到partition0中
 int partNo1 = pu.partition(offerId);

 // 若根据memberId分配，partNo2将等于2，即按照上述分区策略，memberId为qiushuo时将会被分到partition2中
 int partNo2 = pu.partition(memberId, 0, DEFAULT_STR_HEAD_LEN);

如果需要平均分配设置：平均分为4分片，partitionCount*partitionLength=1024

<function name="func1" class="org.opencloudb.route.function.PartitionByLong">
   <property name="partitionCount">4</property>
   <property name="partitionLength">256</property>
 </function>

范围约定

此分片适用于，提前规划好分片字段某个范围属于哪个分片。

start <= range <= end.

range start-end ,data node index

K=1000,M=10000.

<tableRule name="auto-sharding-long">
   <rule>
     <columns>user_id</columns>
     <algorithm>rang-long</algorithm>
   </rule>
 </tableRule>
 
<function name="rang-long" class="org.opencloudb.route.function.AutoPartitionByLong">
   <property name="mapFile">autopartition-long.txt</property>
   <property name="defaultNode">0</property>
 </function>

配置说明：

上面columns 标识将要分片的表字段，algorithm 分片函数

rang-long 函数中mapFile代表配置文件路径

defaultNode 超过范围后的默认节点。

所有的节点配置都是从0开始，及0代表节点1，此配置非常简单，即预先制定可能的id范围到某个分片。

0-500M=0

500M-1000M=1

1000M-1500M=2

或

0-10000000=0

10000001-20000000=1