java数据库分区设计是什么数据库分区的作用

转载

时光机3号 2024-08-26 10:37:13

文章标签 java数据库分区设计是什么分区表表分区数据库 文章分类 Java 后端开发

一、简介：Oracle 分区功能可以提高许多应用程序的可管理性、性能与可用性。通过分区功能，可以将表、索引和索引组织表进一步细分为段，从而能够更精确地管理和访问这些数据库对象。Oracle 提供了种类繁多的分区方案以满足每种业务要求。而且，因为在 SQL 语句中分区是完全透明的，所以该功能几乎可应用于任何应用程序。
分区功能的优势：分区功能通过改善可管理性、性能和可用性，从而为各式应用程序带来了极大的好处。通常，分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务。通过分区,数据库设计人员和管理员能够解决前沿应用程序带来的一些难题。分区是构建千兆字节数据系统或超高可用性系统的关键工具。

二、分区功能的基本知识：分区功能能够将表、索引或索引组织表进一步细分为段。这些数据库对象的段叫做分区。每个分区有自己的名称，还可以选择自己的存储特性。从数据库管理员的角度来看，一个分区后的对象具有多个段，这些段既可进行集体管理，也可单独管理。这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是，从应用程序的角度来看，分区后的表与非分区表完全相同，使用 SQL DML 命令访问分区后的表时，无需任何修改。表的分区是通过“分区键”来实现的，分区键指的是一些列，这些列决定了某一行所在的分区。Oracle 数据库 10g 提供了几项技术用于对表进行分区：
　　1、范围分区（range）：每个分区都由一个分区键值范围指定（对于一个以日期列作为分区键的表，“2005 年 1 月”分区包含分区键值为从“2005 年 1 月 1 日”到“2005 年 1 月 31 日”的行）。
当使用范围分区时，请考虑以下几个规则：
1)每一个分区都必须有一个VALUES LESS THEN子句，它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
2)所有分区，除了第一个，都会有一个隐式的下限值，这个值就是此分区的前一个分区的上限值。
3）在最高的分区中，MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值，也可以理解为高于任何分区中指定的VALUE LESS THEN的值，同时包括空值。
例一：
假设有一个CUSTOMER表，表中有数据200000行，我们将此表通过CUSTOMER_ID进行分区，每个分区存储100000行，我们将每个分区保存到单独的表空间中，这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码，如下：

CREATE TABLE  CUSTOMER 

(  

   CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,  

   FIRST_NAME  VARCHAR2(30) NOT NULL,  

   LAST_NAME   VARCHAR2(30) NOT NULL,  

   PHONE        VARCHAR2(15) NOT NULL,  

   EMAIL        VARCHAR2(80),  

   STATUS       CHAR(1)  

)  

PARTITION BY RANGE (CUSTOMER_ID)  

(  

   PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,  

   PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02  

) 

例二：按时间划分 

CREATE TABLE ORDER_ACTIVITIES  

(  

   ORDER_ID      NUMBER(7) NOT NULL,  

   ORDER_DATE    DATE,  

   TOTAL_AMOUNT NUMBER,  

   CUSTOTMER_ID NUMBER(7),  

   PAID           CHAR(1)  

)  

PARTITION BY RANGE (ORDER_DATE)  

(  

 PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01, 

 PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02, 

 PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03 

)

例三：MAXVALUE

CREATE TABLE RangeTable 

(  

 idd   INT PRIMARY KEY ,  

 iNAME VARCHAR(10),  

 grade INT   

)  

PARTITION  BY  RANGE (grade)  

(  

     PARTITION  part1 VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb,  

     PARTITION  part2 VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb  

);

2、列表分区（list）：每个分区都由一个分区键值列表指定（对于一个地区列作为分区键的表，“北美”分区可能包含值“加拿大”“美国”和“墨西哥”）。该分区的特点是某列的值只有几个，基于这样的特点我们可以采用列表分区。
例一

CREATE TABLE PROBLEM_TICKETS  

(  

   PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY,  

   DESCRIPTION  VARCHAR2(2000),  

   CUSTOMER_ID  NUMBER(7) NOT NULL,  

   DATE_ENTERED DATE NOT NULL,  

   STATUS       VARCHAR2(20)  

)  

PARTITION BY LIST (STATUS)  

(  

     PARTITION PROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01,  

     PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02

例二

CREATE  TABLE  ListTable 

(  

   id    INT  PRIMARY  KEY ,  

   name  VARCHAR (20),  

   area  VARCHAR (10)  

)  

PARTITION  BY  LIST (area)  

(  

   PARTITION  part1 VALUES ('guangdong','beijing') TABLESPACE  Part1_tb,  

   PARTITION  part2 VALUES ('shanghai','nanjing')  TABLESPACE  Part2_tb  

);  

)

3、散列分区（hash）：将散列算法用于分区键来确定指定行所在的分区。这类分区是在列值上使用散列算法，以确定将行放入哪个分区中。当列的值没有合适的条件时，建议使用散列分区。散列分区为通过指定分区编号来均匀分布数据的一种分区类型，因为通过在I/O设备上进行散列分区，使得这些分区大小一致。
例一：

CREATE TABLE HASH_TABLE  

(  

 COL NUMBER(8),  

 INF VARCHAR2(100)  

)  

PARTITION BY HASH (COL)  

(  

 PARTITION PART01 TABLESPACE HASH_TS01,  

 PARTITION PART02 TABLESPACE HASH_TS02,  

 PARTITION PART03 TABLESPACE HASH_TS03  

)

简写：

CREATE TABLE emp 

( 

   empno NUMBER (4), 

   ename VARCHAR2 (30), 

   sal   NUMBER  

) 

PARTITION BY  HASH (empno) PARTITIONS 8 

STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数，Oracle中如果你要使用hash分区，只需指定分区的数量即可。建议分区的数量采用2的n次方，这样可以使得各个分区间数据分布更加均匀。
4、组合范围散列分区（range-hash）：范围和散列分区技术的组合，通过该组合，首先对表进行范围分区，然后针对每个单独的范围分区再使用散列分区技术进一步细分。索引组织表只能进行范围分区。这种分区是基于范围分区和列表分区，表首先按某列进行范围分区，然后再按某列进行列表分区，分区之中的分区被称为子分区。

CREATE TABLE SALES  

(  

PRODUCT_ID VARCHAR2(5),  

SALES_DATE DATE,  

SALES_COST NUMBER(10), 

STATUS VARCHAR2(20)  

) 

PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)  

( 

  PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009 

         (  

             SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,  

             SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009  

         ),  

  PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009 

         (  

             SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,  

             SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009  

         )  

) 

  

5、组合范围列表分区（range-list）：范围和列表分区技术的组合，通过该组合，首先对表进行范围分区，然后针对每个单独的范围分区再使用列表分区技术进一步细分。索引组织表可以按范围、列表或散列进行分区。这种分区是基于范围分区和散列分区，表首先按某列进行范围分区，然后再按某列进行散列分区。 

create table dinya_test  

(  

transaction_id number primary key,  

item_id number(8) not null,  

item_description varchar2(300),  

transaction_date date  

)  

partition by range(transaction_date)subpartition by hash(transaction_id)  subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) 

(  

    partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)),  

    partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)),  

    partition part_03 values less than(maxvalue)  

);

三、Oracle 数据库 10g 还提供了三种类型的分区索引：
1、本地索引：本地索引是其分区方式与其所在基础表的分区方式一模一样的索引。本地索引的每个分区仅对应于其所在基础表的一个分区。
2、全局分区索引：全局分区索引是使用不同于其所在表的分区键进行分区的索引，其所在表可以是分区表或非分区表。全局分区的索引可以使用范围或散列分区进行分区。例如，某个表可以按月份进行范围分区，因此具有十二个分区，而该表上的索引则可以使用不同的分区键进行范围分区，从而具有不同的分区数量。
3、全局非分区索引：全局非分区索引基本上和非分区表的索引一样。索引结构是不分区的。

四、Oracle 提供了一系列丰富的技术，可用于对表、索引和索引组织表进行分区，因此可以针对任何业务环境中的任何应用程序进行最佳的分区 Oracle 还提供一套完整的 SQL 命令，用于管理分区表。其中包括添加新分区、删除分区、分拆分区以及合并分区的命令。
分区的优点：
1、用分区功能提高可管理性
通过 Oracle 分区功能，可将表和索引分成更多、更小的可管理单元，从而使数据库管理员能以“化整为零，个个击破”的方式管理数据。使用分区功能，维护操作可集中于表的特定部分。例如，数据库管理员可以只对表的一部分做备份，而不必对整个表做备份。对整个数据库对象的维护操作，可以在每个分区的基础上进行，从而将维护工作分解成更容易管理的小块。利用分区功能提高可管理性的一个典型用法是支持数据仓库中的‘滚动视窗’加载进程。假设数据库管理员每周向表中加载新数据。可以对该表进行范围分区，使每个分区包含一周的数据。这样加载进程只是简单地添加新的分区。添加一个分区的操作比修改整个表效率高很多，因为 DBA 不需要修改任何其他分区。
2、用分区功能提高性能
由于限制了所检查或操作的数据数量，同时支持并行任务执行，Oracle 分区功能实现了性能上增益。这些特性包括：
1）分区修整：分区修整是用分区功能提高性能的最简单最有价值的手段。分区修整常常能够将查询性能提高几个数量级。例如，假设某个应用程序包含一个存储订单历史记录的 Orders 表，并且此表已按周分区。查询一周的订单只需访问该订单表的一个分区。如果该订单表包含两年的历史记录，这个查询只需要访问一个分区而不是一百零四个。该查询的执行速度因为分区修整而有可能快一百倍。分区修整能与所有其他 Oracle 性能特性协作。Oracle 能将分区修整功能与任何索引技术、联接技术或并行访问方法结合使用。
2）分区智能联接：分区功能可以通过称为分区智能联接的技术提高多表联接的性能。当两个表要联接在一起，而且每个表都用联接键来分区时，就可以使用分区智能联接。分区智能联接将大型联接分解成较小的发生在各个分区间的联接，从而用较少的时间完成全部联接。这就给串行和并行的执行都能带来显著的性能改善。
3、用分区功能提高可用性
分区的数据库对象具有分区独立性。该分区独立性特点可能是高可用性战略的一个重要部分，例如，如果分区表的一个分区不能用，但该表的所有其他分区仍然保持在线并可用。那么这个应用可以继续针对该分区表执行查询和事务处理，只要不是访问不可用的分区，数据库操作仍然能够成功运行。数据库管理员可以指定各分区存放在不同的表空间里，从而让管理员隔离其它表分区针对单个分区进行备份与恢复操作。还有，分区功能可以减少计划停机时间。由于分区功能改善了性能，使数据库管理员能用相对较少的时间完成大型数据库对象的维护工作。
五、有关表分区的一些维护性操作：
1、添加分区
以下代码给SALES表添加了一个P3分区
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意：以上添加的分区界限应该高于最后一个分区界限。
以下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
2、删除分区
以下代码删除了P3表分区：
ALTER TABLE SALES DROP PARTITION P3;
在以下代码删除了P4SUB1子分区：
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想删除此分区，必须删除表。
3、截断分区
截断某个分区是指删除某个分区中的数据，并不会删除分区，也不会删除其它分区中的数据。当表中即使只有一个分区时，也可以截断该分区。通过以下代码截断分区：
ALTER TABLE SALES TRUNCATE PARTITION P2;
通过以下代码截断子分区：
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
4、合并分区
合并分区是将相邻的分区合并成一个分区，结果分区将采用较高分区的界限，值得注意的是，不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并：
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
5、拆分分区
拆分分区将一个分区拆分两个新分区，拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
6、接合分区(coalesca)
结合分区是将散列分区中的数据接合到其它分区中，当散列分区中的数据比较大时，可以增加散列分区，然后进行接合，值得注意的是，接合分区只能用于散列分区中。通过以下代码进行接合分区：
ALTER TABLE SALES COALESCA PARTITION;
7、重命名表分区
以下代码将P21更改为P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;
8、相关查询
跨分区查询

select sum( *) from  

(select count(*) cn from t_table_SS PARTITION (P200709_1)  

union all  

select count(*) cn from t_table_SS PARTITION (P200709_2) 

);

查询表上有多少分区
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'
查询索引信息

select object_name,object_type,tablespace_name,sum(value)  

from v$segment_statistics  

where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX' 

group by object_name,object_type,tablespace_name  

order by 4 desc  

  

--显示数据库所有分区表的信息：  

select * from DBA_PART_TABLES  

  

--显示当前用户可访问的所有分区表信息:  

select * from ALL_PART_TABLES  

  

--显示当前用户所有分区表的信息：  

select * from USER_PART_TABLES  

  

--显示表分区信息 显示数据库所有分区表的详细分区信息：  

select * from DBA_TAB_PARTITIONS  

  

--显示当前用户可访问的所有分区表的详细分区信息：  

select * from ALL_TAB_PARTITIONS  

  

--显示当前用户所有分区表的详细分区信息：  

select * from USER_TAB_PARTITIONS  

  

--显示子分区信息 显示数据库所有组合分区表的子分区信息：  

select * from DBA_TAB_SUBPARTITIONS  

  

--显示当前用户可访问的所有组合分区表的子分区信息：  

select * from ALL_TAB_SUBPARTITIONS  

  

--显示当前用户所有组合分区表的子分区信息：  

select * from USER_TAB_SUBPARTITIONS  

  

--显示分区列 显示数据库所有分区表的分区列信息：  

select * from DBA_PART_KEY_COLUMNS  

  

--显示当前用户可访问的所有分区表的分区列信息：  

select * from ALL_PART_KEY_COLUMNS  

  

--显示当前用户所有分区表的分区列信息：  

select * from USER_PART_KEY_COLUMNS  

  

--显示子分区列 显示数据库所有分区表的子分区列信息：  

select * from DBA_SUBPART_KEY_COLUMNS  

  

--显示当前用户可访问的所有分区表的子分区列信息：  

select * from ALL_SUBPART_KEY_COLUMNS  

  

--显示当前用户所有分区表的子分区列信息：  

select * from USER_SUBPART_KEY_COLUMNS  

  

--怎样查询出oracle数据库中所有的的分区表  

select * from user_tables a where a.partitioned='YES'  

  

--删除一个表的数据是  

truncate table table_name;  

  

--删除分区表一个分区的数据是  

alter table table_name truncate partition p5;

在Oracle 11g中，组合分区功能这块有所增强，又增加了range-range,list-range,list-list,list-hash，并且 11g里面还支持Interval分区和虚拟列分

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。