一 前言
最近发现磁盘空间有3T的性能机器出现了磁盘空间不足的现象,该机器主要部署ORACLE数据库,所以,猜测很可能是表空间数据文件变更导致的。接下来,就需要一步步的排查问题了,最终确认是ORACLE BLOCK_ID惹的祸。
二 定位磁盘空间占用情况
首先需要确定是哪些文件占用空间,使用du -sh * ,果不其然,有个表空间增加了20个数据文件,而且每个数据文件设置30G,Word天,谁这么狠,居然找不到元凶,好吧,那我就任意处置了,不能影响后面的性能测试。
三 删除数据文件
既然发现这么多数据文件,当然想直接drop掉,于是,不以为然的执行alter tablespace TEST drop datafile '/oradata/dat20.dbf';先把最后一个干掉,结果执行报错“ORA-03262: THE FILE IS NON-EMPTY”,呵,居然有数据,直接删不掉。于是,就想查询这个表空间的表,把数据TRUNCATE掉,但又考虑到该表空间TABLE就有上千张,而且不能确定哪张表可删,不能太鲁莽,事实证明,真和数据无关。
四 退而求其次-RESIZE 数据文件释放空间
既然不能drop 数据文件,那就resize它,就不信拿不回空间。于是,先查下可以释放多少空间出来,先执行如下命令:
select d.file_name,d.file_id,d.bytes/1024/1024 as d_byte,sum(f.bytes/1024/1024) as free_byte
from dba_data_files d,dba_free_space f
where d.file_id=f.file_id and d.file_id=67
group by d.file_name,d.file_id,d.bytes/1024/1024;
输出显示67号数据文件可用空间29.9G,看到这里,心里暗骂,是谁这么不靠谱,乱加乱设数据文件。不过,都是小问题,resize成1G就行了。于是,又兴冲冲的赶紧执行ALTER DATABASE DATAFILE '/oradata/hisdat20.dbf' RESIZE 1G; 居然又报错了,
“ORA-03297:file contains used data beyond requested RESIZE value”,看到这个报错,开始意识到可能问题没有这么简单。
五 shrink space降低高水位
既然实际数据很少,resize却不能成功,就表明是某些数据块位于数据文件的末端,那就先降降HWM高水位,对表空间的表进行操作,主要命令如下:
alter table test_table enable row movement;
alter table test_table shrink space; ---降低高水位,释放空间
alter table test_table disable row movement;
当然,这样一个个的执行不显示,需要批量执行,命令如下:
SELECT DISTINCT 'alter table ' || segment_name || ' enable row movement;'||
'alter table ' || segment_name || ' shrink space;'||
'alter table ' || segment_name || ' disable row movement;'
FROM dba_extents
WHERE tablespace_name = 'TEST'
AND segment_type = 'TABLE'
降低HWM后,再次执行RESIZE操作,报错依旧,好吧,既然这样都没搞定,需要认真研究下了。
六 找到真凶和解决方法
通过上述尝试,发现数据文件可用空间充足,但对ORACLE而言,数据文件使用了30G,所以RESIZE到1G会报错失败,尽快进行了降高水位或TRUNCATE操作都无济于事。于是,排查和解决思路是这样的:
1)查询数据文件的最大BLOCK_ID
select max(block_id) from dba_extents where file_id=67;
2)确定该BLOCK_ID与哪个表或索引有关
SELECT OWNER, SEGMENT_NAME, SEGMENT_TYPE, TABLESPACE_NAME, A.PARTITION_NAME FROM DBA_EXTENTS A WHERE FILE_ID = 67 AND block_id = 3839929;
查询后,发现最大的BLOCK_ID都是与分区表或分区索引有关的。
3)针对最大BLOCK_ID出现在分区表的处理方法
对分区表出现最大BLOCK_ID的情况,采用先降分区表高水位,然后MOVE表空间,命令如下:
alter table TEST_TABLE MODIFY PARTITION P101101 shrink space;---注意降低高水位并不能降低数据文件中block_id大小
alter table TEST_TABLE move partition P101101 tablespace TEST;---move操作数据移动表空间最前面的空闲block,注意需要重建索引
4)针对最大BLOCK_ID出现在索引分区的处理方法
对索引分区出现最大BLOCK_ID的情况,重建分区索引即可,命令如下:
ALTER INDEX IDX_TEST_TABLE REBUILD PARTITION P201201
5)处理完后,再次执行RESIZE操作,数据文件大小修改成功。
最后,因为同个文件号上可能出现多个分区表,分区索引需要处理的情况,建议像第五步写成批量执行,提高效率。
关于shrink space降低高水位,可以参考博文Oracle delete操作隐藏着你可能不知道的秘密