1.Greenplum分区表简介

在数据库中,分区表,有时候我们也叫分库分表,底层的逻辑基本都是一样的,就是将一个大表在物理上分布在不同数据库上,数据也拆分开,方便查询时进行分区裁剪以减少查询数据量。GPDB中的分区表功能在开发时,参考了Oracle的分区表语法,在GPDB中,可以直接向父表插入数据,也可以直接向子表插入数据,当直接向父表插入数据时,GPDB会自动检测并将数据定位到子表中。

2.如何创建分区表

GPDB中,支持两种分区表,范围分区(range)和列表分区(list),下面展开介绍一下具体的创建语法。

2.1 范围分区(range)

根据分区字段的值范围区间来分区,每一个分区就是一个子表

create table t_partition_range
(
    id int,
    name varchar(64),
    fdate varchar(64)
    ) distributed by (id)
	partition by range(fdate)
    (
        partition p1 start ('2022-01-01') inclusive end ('2022-02-01') exclusive,
        partition p2 start ('2022-02-01') inclusive end ('2022-03-01') exclusive,
        default partition default_p
    );

注意上面分区表我定义的日期,前后是有衔接关系的,如果不衔接起来,可能发生缺少分区的情况:

inclusive :指定包含,例如上面的 start ('2022-01-01') inclusive 则是包含'2022-01-01'
    exclusive : 指定不包含, 例如上面的 end ('2022-02-01') exclusive 则是不包含'2022-02-01'

2.2 快速范围分区(every)

根据选定的范围,跨越基数,快速分区每一个子表

create table t_partition_every_1
(
    id int,
    name varchar(64),
    fdate date
)
distributed by (id)
partition by range (fdate)
(
    partition pn_ start ('2022-01-01'::date) end ('2022-12-31'::date) every ('1 day'::interval),
    default partition default_p
);

every:指定跨越基数

2.3 列表分区(list)

根据值的分组,相同的数据归类到一组,也就一个分区中

create table t_partition_list
(
    id int,
    name varchar(64),
    fdate varchar(10)
)
distributed by (id)
partition by list (fdate)
(
    partition p1 values ('2022-01-01', '2017-01-02'),
    partition p2 values ('2022-01-03'),
    default partition default_p
);

3.分区相关操作

3.1 分区拆分

拆分普通分区:

将分区p2在 '2022-02-20' 左右切分成两块
 alter table t_partition_range split partition p2 at ('2022-02-20') into (partition p2, partition p3);

切割默认分区:

alter table t_partition_range split default partition start ('2022-03-01')  end ('2022-03-31')  into (partition p4, default partition);

3.2 新增分区

如果存在默认分区(default partition),则不能新增(add)分区,只能拆分默认分区(split default partition)

alter table t_partition_range_1 add partition p2 start ('2022-02-01') end ('2022-02-31');

3.3 删除分区

alter table t_partition_range_1 DROP partition p2;

3.4 清空分区数据

清空分区表数据,相当于删除分区,然后再新建一个

alter table t_partition_range_1 truncate partition p1;

或根据rank号去删除对应分区,如下:

alter table sales truncate partition for(rank(1));

4.子分区创建与操作

4.1 子分区创建

在GPDB中,分区是可以嵌套增加的,分区下面可以有子分区,如下:

create table t_partition_range_2
(
    id int,
    name varchar(64),
    fdate varchar(10)
)
distributed by (id)
partition by range(fdate)
subpartition by list(name)
subpartition template
(
    subpartition c1 values ('abcd'),
    subpartition c2 values ('efgh')
)
(
    partition p1 start ('2022-01-01') end ('2022-01-31')
)

上面的分区中,p1会再分两个c1/c2子分区

4.2 truncate 子分区

alter table t_partition_range_2 alter partition p1 truncate partition c2;

4.3 drop 子分区

alter table t_partition_range_2 alter partition p1 drop partition c2;