Linux中有一种可怕的误操作 —— rm -rf 误删除文件。对于数据库而言,如果误删除了数据文件,而数据库进程还没挂掉的话,可以尝试抢救一下。注意误rm后千万不要去重启数据库。对于其他文件,下面方法也是适用的,也要注意千万不要去重启相关进程。

一、 误删除用户数据文件模拟

高危操作,没事千万不要在生产环境执行。

SQL> select name from v$datafile;

NAME
--------------------------------------------------------------------------------
/data/oradata/ocrl/datafile/system01.dbf
/data/oradata/ocrl/datafile/sysaux01.dbf
/data/oradata/ocrl/datafile/undotbs01.dbf
/data/oradata/ocrl/datafile/users01.dbf
/data/oradata/ocrl/datafile/test.dbf
cd /data/oradata/ocrl/datafile/

ls
sysaux01.dbf  system01.dbf  test.dbf  undotbs01.dbf  users01.dbf

rm -rf test.dbf

ls
sysaux01.dbf  system01.dbf  undotbs01.dbf  users01.dbf

尝试在test表空间中创建表,开始报错

SQL> create table t tablespace test as select * from dual;
create table t tablespace test as select * from dual
                                                *
ERROR at line 1:
ORA-01116: error in opening database file 5
ORA-01110: data file 5: '/data/oradata/ocrl/datafile/test.dbf'
ORA-27041: unable to open file
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3

如果发现了误操作,千万先冷静,千万别想着先重启试试,重启雪上加霜。

二、 通过进程打开的文件句柄进行恢复

恢复的原理是,在Linux中,如果文件从操作系统级别被rm掉,之前打开该文件的进程仍然持有相应的文件句柄,所指向的文件仍然可以读写,并且该文件的文件描述符可以从/proc目录中获得。但是要注意的是,此时如果关闭数据库,则此句柄会消失,那么除了扫描磁盘进行文件恢复之外就没有其它方法了。因此在数据库出现问题的时候,如果不确认情况的复杂程度,千万不要随便关闭数据库。重启数据库往往是没有意义的,甚至是致命的。

1. 检查dbwr的进程PID

ps -ef|grep dbw0

oracle    6121     1  0 Feb07 ?        00:00:32 ora_dbw0_ocrl
oracle   19015 18603  0 11:52 pts/1    00:00:00 grep dbw0

2. 检查dbwr打开的所有文件句柄

dbwr会打开所有数据文件的句柄,在/proc目录中可以查到,目录是进程PID,fd表示文件描述符。

cd /proc/6121/fd

ls -l
#输出
lr-x------ 1 oracle dba 64 Feb  7 10:11 0 -> /dev/null
l-wx------ 1 oracle dba 64 Feb  7 10:11 1 -> /dev/null
l-wx------ 1 oracle dba 64 Feb  7 10:11 2 -> /dev/null
lrwx------ 1 oracle dba 64 Feb  7 10:11 256 -> /data/oradata/ocrl/control/control01.ctl
lrwx------ 1 oracle dba 64 Feb  7 10:11 257 -> /data/oradata/ocrl/control/control02.ctl
lrwx------ 1 oracle dba 64 Feb 10 11:42 258 -> /data/oradata/ocrl/datafile/system01.dbf
lrwx------ 1 oracle dba 64 Feb 10 11:42 259 -> /data/oradata/ocrl/datafile/sysaux01.dbf
lrwx------ 1 oracle dba 64 Feb 10 11:42 260 -> /data/oradata/ocrl/datafile/undotbs01.dbf
lrwx------ 1 oracle dba 64 Feb 10 11:42 261 -> /data/oradata/ocrl/datafile/users01.dbf
lrwx------ 1 oracle dba 64 Feb 10 11:42 262 -> /data/oradata/ocrl/datafile/test.dbf (deleted) <-------- 注意这个
lrwx------ 1 oracle dba 64 Feb 10 11:42 263 -> /data/oradata/ocrl/tempfile/temp01.dbf
lr-x------ 1 oracle dba 64 Feb  7 10:11 3 -> /dev/null
lr-x------ 1 oracle dba 64 Feb  7 10:11 4 -> /u01/app/oracle/product/12.1.0/db_1/rdbms/mesg/oraus.msb
lr-x------ 1 oracle dba 64 Feb  7 10:11 5 -> /proc/6121/fd
lrwx------ 1 oracle dba 64 Feb  7 10:11 6 -> /u01/app/oracle/product/12.1.0/db_1/dbs/hc_ocrl.dat
l-wx------ 1 oracle dba 64 Feb  7 10:11 7 -> /u01/app/oracle/product/12.1.0/db_1/rdbms/mesg/oraus.msb
lrwx------ 1 oracle dba 64 Feb  7 10:11 9 -> /u01/app/oracle/product/12.1.0/db_1/dbs/lkOCRL

注意其中 /data/oradata/ocrl/datafile/test.dbf (deleted) 字样,表示该文件已经被删除

有一个比较简单的找法是利用 lsof 命令

lsof -p dbw进程pid |grep deleted

例如

ps -ef|grep dbw 
oracle    3317     1  0 Jul26 ?        00:01:04 ora_dbw0_ols

lsof -p 3317 |grep deleted

COMMAND    PID   USER   FD   TYPE DEVICE   SIZE/OFF    NODE NAME
ora_dbw0_ 3317 oracle  259uW  REG  254,0 5451030528 1979159 /home/oracle/data/OLS_DATA.dbf (deleted)
ora_dbw0_ 3317 oracle  262uW  REG  254,0  536879104 1979158 /home/oracle/data/OLS_IDX.dbf (deleted)

3. 将该句柄文件名复制回原位置

cp 262 /data/oradata/ocrl/datafile/test.dbf

cd /data/oradata/ocrl/datafile/

ls
sysaux01.dbf  system01.dbf  test.dbf  undotbs01.dbf  users01.dbf

4. 进行数据文件recover

SQL> alter database datafile 5 offline;
Database altered.

SQL> recover datafile 5;
Media recovery complete.

SQL> alter database datafile 5 online;
Database altered.

SQL> select file#,name from v$datafile;
     FILE#   NAME
-----------  ---------------------------------------------------------------------
     1       /data/oradata/ocrl/datafile/system01.dbf
     2       /data/oradata/ocrl/datafile/sysaux01.dbf
     3       /data/oradata/ocrl/datafile/undotbs01.dbf
     4       /data/oradata/ocrl/datafile/users01.dbf
     5       /data/oradata/ocrl/datafile/test.dbf

测试建表

SQL> create table t tablespace test as select * from dual;
Table created.

SQL> select * from t;

D
-
X

至此完成数据文件恢复
 

参考

Oracle linux下 rm 数据文件恢复测试详解_雨丶花丶石的博客

linux平台通过lsof命令恢复被误删的oracle数据文件_killvoon的博客

linux lsof详解_guoguo1980的博客