oracle分区技术

原创

东方之子7366 2013-12-31 10:51:35 博主文章分类：oracle、mysql管理 ©著作权

©著作权归作者所有：来自51CTO博客作者东方之子7366的原创作品，请联系作者获取转载授权，否则将追究法律责任

Oracle 提供了一下几种分区方法：

范围分区
列表分区
哈希分区
复合分区
何时应该对表进行分区

范围分区（range partitioning）依据用户创建分区时设定的分区键值（partition key value）范围将数据映射到不同分区。范围分区是较常用的分区方式，通常针对日期数据使用。例如，用户可以将销售数据按月存储到相应的分区中。
　在采用范围分区时，应注意以下规则：

定义分区时必须使用 VALUES LESS THAN 子句定义分区的开区间上限（noninclusive upper bound）。分区键大于等于此修饰符（literal）的数据将被存储到下一个分区中。
除了第一个分区之外，其他所有分区都有一个隐式的下限（lower bound），此下限是由上一个分区的 VALUES LESS THAN 子句指定的。
用户可以为最大分区定义一个 MAXVALUE 修饰符。MAXVALUE 代表一个无穷大值，用于识别大于所有可能分区键的数据（包括 null）。
CREATE TABLE sales_range (
salesman_id NUMBER(5),
salesman_name VARCHAR2(30),
sales_amount NUMBER(10),
sales_date DATE)
PARTITION BY RANGE(sales_date)(
PARTITION sales_jan2000 VALUES LESS THAN(TO_DATE('02/01/2000','MM/DD/YYYY')),
PARTITION sales_feb2000 VALUES LESS THAN(TO_DATE('03/01/2000','MM/DD/YYYY')),
PARTITION sales_mar2000 VALUES LESS THAN(TO_DATE('04/01/2000','MM/DD/YYYY')),
PARTITION sales_apr2000 VALUES LESS THAN(TO_DATE('05/01/2000','MM/DD/YYYY'))
);
列表分区

用户可以采用列表分区（list partitioning）显示地控制如何将数据行映射到各个分区。用户在各分区的定义中指定一个分区键（partitioning key）离散值的列表，从而实现列表分区。列表分区与范围分区（range partitioning）有所不同，在范围分区中是为每个分区设定一个分区键值的范围；列表分区与哈希分区也有区别，哈希分区是通过一个哈希函数（hash function）控制数据行与分区间的映射关系。用户可以采用列表分区，将无序（unordered）或互不相关（unrelated）的数据进行分组整理。
CREATE TABLE sales_list(
salesman_id NUMBER(5),
salesman_name VARCHAR2(30),
sales_state VARCHAR2(20),
sales_amount NUMBER(10),
sales_date DATE)
PARTITION BY LIST(sales_state)(
PARTITION sales_west VALUES('California', 'Hawaii'),
PARTITION sales_east VALUES ('New York', 'Virginia', 'Florida'),
PARTITION sales_central VALUES('Texas', 'Illinois'),
PARTITION sales_other VALUES(DEFAULT)
);
哈希分区

用户可以采用哈希分区（hash partitioning）将不适于采用范围分区（range partitioning）或列表分区（list partitioning）的数据进行分区。哈希分区的语法（syntax）简单且易于实现。在以下情况时哈希分区比范围分区更适用：
用户无法事先确定一个分区可能存储的数据量
各范围分区的容量可能相差很大，或很难通过人工进行平衡
采用范围分区可能导致数据不正常的集中
应用系统对并行 DML（parallel DML），分区剪除（partition pruning），及基于分区的关联（partition-wise joins）等与性能有关的分区特性要求较高

分割（splitting），移除（dropping ），及融合（merging）等操作不适用于哈希分区。但对哈希分区可以进行添加（add）及接合（coalesce）操作。
CREATE TABLE sales_hash(
salesman_id NUMBER(5),
salesman_name VARCHAR2(30),
sales_amount NUMBER(10),
week_no NUMBER(2))
PARTITION BY HASH(salesman_id)
PARTITIONS 4
STORE IN (ts1, ts2, ts3, ts4);
复合分区
复合分区（composite partitioning）首先根据范围（range）进行分区，再使用哈希或列表方式创建子分区。复合范围-哈希分区既能够发挥范围分区的可管理性优势，也能够发挥哈希分区的数据分布（data placement），条带化（striping），及并行化（parallelism）优势。复合范围-列表分区能够发挥范围分区的可管理性优势，也能利用列表分区的显示控制能力。
　复合分区（composite partitioning）便于用户进行与时间相关的维护操作（historical operation），例如添加新的范围分区等。同时复合分区还能够利用子分区（subpartitioning）实现高度的并行 DML 操作，并对数据分布进行精细的控制。
CREATE TABLE sales_composite (
salesman_id NUMBER(5),
salesman_name VARCHAR2(30),
sales_amount NUMBER(10),
sales_date DATE)
PARTITION BY RANGE(sales_date)
SUBPARTITION BY HASH(salesman_id)
SUBPARTITION TEMPLATE(
SUBPARTITION sp1 TABLESPACE ts1,
SUBPARTITION sp2 TABLESPACE ts2,
SUBPARTITION sp3 TABLESPACE ts3,
SUBPARTITION sp4 TABLESPACE ts4)
(PARTITION sales_jan2000 VALUES LESS THAN(TO_DATE('02/01/2000','MM/DD/YYYY'))
PARTITION sales_feb2000 VALUES LESS THAN(TO_DATE('03/01/2000','MM/DD/YYYY'))
PARTITION sales_mar2000 VALUES LESS THAN(TO_DATE('04/01/2000','MM/DD/YYYY'))
PARTITION sales_apr2000 VALUES LESS THAN(TO_DATE('05/01/2000','MM/DD/YYYY'))
PARTITION sales_may2000 VALUES LESS THAN(TO_DATE('06/01/2000','MM/DD/YYYY')));
以下是关于何时应该对表进行分区的一些建议：
如果表数据量超过 2GB，就应该考虑进行分区。
如果表中包含历史数据，且新数据会被添加到最新的表空间中。典型的例子是一种历史表，其中只有当前月份的数据可以被修改，而其他十一个月的数据为只读。
与分区表类似（partitioned table），分区索引（partitioned index）也能够提高系统的可管理性，可用性，可伸缩性，及系统性能。分区索引既可以与分区表相对独立（全局索引（global index）），也可以采用与分区表相同的分区方式（本地索引（local index））。一般来说，OLTP 系统适合采用全局索引，而数据仓库系统或 DSS 系统适合采用本地索引。此外，用户应尽可能地使用本地索引，因为此种索引更易管理。在选择索引类型时，可以参考以下经验：
如果表的分区键（partitioning column）是索引键（index key）的子集，应使用本地索引。否则继续参考经验 2。
如果索引为唯一索引（unique），应使用全局索引。否则继续参考经验 3。
如果用户对可管理性的要求更高，应使用本地索引。否则继续参考经验 4。
如果应用系统为 OLTP，且对系统的响应时间要求较高，应使用全局索引。如果应用系统为 DSS，且对系统的数据吞吐量要求较高，应使用本地索引。
本地分区索引（local partitioned index）与其他类型分区索引相比较更易管理。本地分区索引适用于 DSS 系统，且具有较高的可用性。这是因为本地分区索引与其所在的分区表采用相同的分区方式：本地分区索引的每个分区都与分区表的一个分区相对应。因此，Oracle 能够自动地确保各个索引分区与相应的表分区同步，且使各个表-索引分区对（table-index pair）相互独立。当一个表分区内的数据发生变化时，只会影响一个索引分区。

本地分区索引可以是唯一索引。但是，为了确保本地分区索引每个分区的唯一性，分区键必须是索引键的子集。通常唯一本地分区索引适用于 OLTP 系统。
Oracle 支持两种全局分区索引（global partitioned index）：范围（range）分区索引及哈希（hash）分区索引。
　全局范围分区索引（global range partitioned index）的灵活性在于其分区度（degree of partitioning）及分区键（partitioning key ）都可以和表的分区方法相独立。此类索引主要用于 OLTP 系统，在存取独立记录时效率较高。
全局范围分区索引的最后一个分区必须使用 MAXVALUE 设置一个分区边界。这能保证所有表数据都能反映到索引中。全局前缀索引（global prefixed index）可以是唯一的或非唯一的。

用户不能向全局范围分区索引中添加分区，因为最后一个分区总是以 MAXVALUE 作为分区边界。如果用户需要添加最高分区，应使用 ALTER INDEX SPLIT PARTITION 语句。如果一个全局索引的某分区已空，用户可以使用 ALTER INDEX DROP PARTITION 显示地将其移除。如果全局索引的某个分区内含有数据，移除此分区将导致下一个分区被标识为不可用。用户不能移除全局索引中的最后一个分区。
对于索引值单调增长的表，创建全局哈希分区索引（lobal hash partitioned index）有助于索引数据分布，从而提升系统性能。索引值单调增长指新索引数据只会在索引的右边界插入。

在一般情况下，对全局索引所在的堆表（heap-organized table）进行以下操作将导致索引被标识为不可用：