PostgreSQL是世界上功能最强大的开源数据库,在国内得到了越来越多机构和开发者的青睐和应用。随着PostgreSQL的应用越来越广泛,Oracle向PostgreSQL数据库的数据迁移需求也越来越多。数据库之间数据迁移的时候,首先遇到的,并且也是最重要的,就是数据类型之间的转换。下面根据自己的理解和测试,写了一些数据类型之间的差异以及迁移时的注意事项的文章,不足之处,尚请多多指教。

其它类型

Oracle的内建数据类型中,还有一些其它的类型。不能够归类到字符、数字、时间和大数据类型等。比如RAW, ROWID, UROWID等。在数据迁移的时候,在PostgreSQL中也有与之相对应的类型。

1、RAW类型

Oracle的RAW类型主要用于不同的系统之间转移数据的时候。用于保存位串,以字节为单位。作为数据库列的数据类型的时候,最大位数为2000(作为变量的时候,最大位数为32767。因为现在谈论的是数据迁移,所以作为变量的情况就不讨论了)。

PostgreSQL中,可以使用bytea来对应RAW类型。

Oracle RAW

SQL> create table o_test(value raw(2000));

表已创建。

SQL> create table o_test2(value raw(2001));
create table o_test2(value raw(2001))
                               *
第 1 行出现错误:
ORA-00910: 指定的长度对于数据类型而言过长

SQL> insert into o_test values(utl_raw.cast_to_raw('Hello! This is John'));

已创建 1 行。

SQL> select * from o_test;

VALUE
--------------------------------------------------------------------------------
48656C6C6F212054686973206973204A6F686E

PostgreSQL bytea

postgres=# create table p_test(value bytea);
CREATE TABLE
postgres=# insert into p_test values(cast('Hello! This is John' as bytea));
INSERT 0 1
postgres=# select * from p_test;
                  value
------------------------------------------
 \x48656c6c6f212054686973206973204a6f686e
(1 行记录)
2、ROWID类型

Oracle的ROWID类型代表一条记录在数据库中的物理地址。使用BASE64编码的字符串表示的物理地址。固定是18位。ROWID是Oracle中的伪列,也可以定义一个ROWID类型的列,但是必须用户自己保证该列的数据有效性。
PostgreSQL中,可以使用char(18)来迁移对象。PostgreSQL中还有一个CTID数据类型, 指的是一条记录位于哪个数据块的哪个位移上面。作用和ROWID类似。但是用的是数字对,数据迁移时,不能够使用它对Oracle的ROWID进行迁移。

Oracle ROWID

SQL> create table o_test(value1 int, value2 rowid);

表已创建。

SQL> insert into o_test values(1, '1234567890ABCDEFAB');

已创建 1 行。

SQL> insert into o_test values(2, '1234567890ABCDEFABC');
insert into o_test values(2, '1234567890ABCDEFABC')
                             *
第 1 行出现错误:
ORA-01410: 无效的 ROWID

SQL> select * from o_test;

    VALUE1 VALUE2
---------- ------------------
         1 B23456AM9AABCDEFAB

SQL> select t.rowid, t.* from o_test t;

ROWID                  VALUE1 VALUE2
------------------ ---------- ------------------
AAASQiAAEAAAAJ8AAA          1 B23456AM9AABCDEFAB

PostgreSQL char(18)

postgres=# create table p_test(value1 int , value2 char(18));
CREATE TABLE
postgres=# insert into p_test values(1, 'B23456AM9AABCDEFAB');
INSERT 0 1
postgres=# insert into p_test values(1, 'AAASQiAAEAAAAJ8AAA');
INSERT 0 1
postgres=# select * from p_test;
 value1 |       value2
--------+--------------------
      1 | B23456AM9AABCDEFAB
      1 | AAASQiAAEAAAAJ8AAA
(2 行记录)
postgres=# select ctid, * from p_test;
 ctid  | value1 |       value2
-------+--------+--------------------
 (0,1) |      1 | B23456AM9AABCDEFAB
 (0,2) |      1 | AAASQiAAEAAAAJ8AAA
(2 行记录)
3、UROWID类型

Oracle的UROWID类型支持Oracle的物理ROWID和逻辑ROWID,在索引组织表(Index Organization Table,简称为IOT)中的ROWID,就是逻辑ROWID。并且支持非Oracle数据库的表的ROWID。也就是支持所有类型的ROWID。最大长度是4000。
PostgreSQL中,可以使用varchar来迁移对象。

Oracle UROWID

SQL> create table o_test(value1 int, value2 urowid);

表已创建。

SQL> insert into o_test values(1,'AAASQiAAEAAAAJ8AAA');

已创建 1 行。

SQL> select value2 from o_test;

VALUE2
--------------------------------------------------------------------------------
AAASQiAAEAAAAJ8AAA

SQL> create  table o_test2(id number primary key) organization index;

表已创建。

SQL> insert into o_test2 values('12345');

已创建 1 行。

SQL> insert into o_test2 values('12345989873827276839302');

已创建 1 行。

SQL> set numw 25
SQL> select t.rowid, t.* from o_test2 t;

ROWID                                                            ID
----------------------------------------- -------------------------
*BAEAAjMEwwIYLv4                                              12345
*BAEAAjMNzAIYLmNjSlNJTVReA/4                12345989873827276839302

PostgreSQL VARCHAR

postgres=# create table p_test(value varchar);
CREATE TABLE
postgres=#  insert into p_test values('AAASQiAAEAAAAJ8AAA');
INSERT 0 1
postgres=#  insert into p_test values('*BAEAAjMEwwIYLv4');
INSERT 0 1
postgres=#  insert into p_test values('*BAEAAjMNzAIYLmNjSlNJTVReA/4');
INSERT 0 1
postgres=# select value,length(value) from p_test;
            value             | length
------------------------------+--------
 AAASQiAAEAAAAJ8AAA           |     18
 *BAEAAjMEwwIYLv4             |     16
 *BAEAAjMNzAIYLmNjSlNJTVReA/4 |     28
(3 行记录)

Oracle的build-in类型里面的这几种特殊的数据类型,在数据迁移中是比较简单的。在向PostgreSQL数据库进行数据迁移的时候只要选对数据类型,应该就可以正确的迁移过来。

参考文档:

PostgreSQL 9.4.4 中文手册:字符类型,二进制类型,对象标识符类型
http://www.postgres.cn/docs/9.4/datatype-binary.html (二进制类型)
http://www.postgres.cn/docs/9.4/datatype-character.html (字符类型)
Database SQL Language Reference:Data Types
http://docs.oracle.com/cd/E11882_01/server.112/e41084/sql_elements001.htm#i45441