Linux系统删除文件后空间并没有释放原因及解决方法

今日收到监控报警,发现一台服务器的磁盘空间不足,需要进行处理,登录后发现可利用率不足1%,进行相关查看和处理工作;但是操作删除了一些备份文件和日志信息后,查看空间仍然不足。

一、现象描述

操作系统:CentOS 6.8 x64

使用 df -h 命令,看见 / 根目录下磁盘空间已满(99%),于是手动清理大日志文件。

 

  1. [root@local ~]#-h
  2. FilesystemSizeUsedAvailUse%Mounted on
  3. /dev/mapper/rootvg-LogVol0059G59G0100%/
  4. /dev/sda1 190M13M168M8%/boot
  5. tmpfs 2.0G02.0G0%/dev/shm

通过 du -sh 命令,找到占用大量空间的日志文件,于是使用 rm -rf 删除了它。

 

  1. [root@local ~]#/var/nginx/logs/
  2. [root@local ~]#-rf t-access.log t-error.log

然后 查看磁盘空间的使用情况,发现 / (根目录)的空间并没有发生变化。但是可以看到 Used 发生了变化。

 

  1. [root@local ~]#-h
  2. FilesystemSizeUsedAvailUse%Mounted on
  3. /dev/mapper/rootvg-LogVol0059G56G0100%/
  4. /dev/sda1 190M13M168M8%/boot
  5. tmpfs 2.0G02.0G0%/dev/shm

这是怎么回事呢?

二、原因分析

未释放磁盘空间的原因:

在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的文件夹结构上解除链接(unlink),然而假设文件是被打开的(有一个进程正在使用),那么进程将仍然能够读取该文件,磁盘空间也一直被占用。而我删除的是nginx的访问日志文件,在删除的时候该文件正在被使用。

三、解决办法

首先获得一个已经被删除的可是仍然被应用程序占用的文件列表。操作如下:

 

  1. [root@local ~]#|grep deleted
  2. nginx 439938w253,01930444810835682/var/nginx/logs/t-access.log (deleted)
  3. nginx 439939w253,0350208010835684/var/nginx/logs/t-error.log (deleted)
  4. nginx 440138w253,01930444810835682/var/nginx/logs/t-access.log (deleted)
  5. nginx 440139w253,0350208010835684/var/nginx/logs/t-error.log (deleted)
  6. nginx 440238w253,01930444810835682/var/nginx/logs/t-access.log (deleted)
  7. nginx 440239w253,0350208010835684/var/nginx/logs/t-error.log (deleted)
  8. nginx 440338w253,01930444810835682/var/nginx/logs/t-access.log (deleted)
  9. nginx 440339w253,0350208010835684/var/nginx/logs/t-error.log (deleted)
  10. nginx 440438w253,01930444810835682/var/nginx/logs/t-access.log (deleted)
  11. nginx 440439w253,0350208010835684/var/nginx/logs/t-error.log (deleted)

从输出的结果可以看到 /var/nginx/logs/t-access.log 和 t-error.log 还在被使用中,所以导致未释放空间。

那么如何让进程释放呢?

方法1:直接 kill 掉相应的进程,或者停掉使用这个文件的应用,让操作系统自己主动回收磁盘空间。

由于还有其他项目正在使用该应用(nginx服务),所以不能停掉nginx服务,于是使用 kill 命令删除相应的进程。

 

  1. [root@local ~]#-94399
  2. [root@local ~]#-94401
  3. [root@local ~]#-94402
  4. [root@local ~]#-94403
  5. [root@local ~]#-94404

再次,查看磁盘空间的使用情况,发现空间已经被回收了。

 

  1. [root@local ~]#-h
  2. FilesystemSizeUsedAvailUse%Mounted on
  3. /dev/mapper/rootvg-LogVol0059G56G095%/
  4. /dev/sda1 190M13M168M8%/boot
  5. tmpfs 2.0G02.0G0%/dev/shm

方法2:以后清理正在被读写的大日志文件时,直接使用 echo "" > xxx.log 命令,即直接将文件置空,并不影响服务的使用,文件大小也被控制下来,磁盘空间也释放了。

说明:

当Linux打开一个文件的时候,Linux内核会为每个进程在/proc/ 『/proc/nnnn/fd/文件夹(nnnn为pid)』建立一个以其pid为名的文件夹用来保存进程的相关信息,而其子文件夹fd保存的是该进程打开的全部文件的fd(fd:file descriptor)。

kill进程是通过截断proc文件系统中的文件能够强制要求系统回收分配给正在使用的的文件。这是一项高级技术,仅到管理员确定不会对执行中的进程造成影响时使用。应用程序对这样的方式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题。

四、删除原理

一般来说,不会出现删除文件后空间不释放的情况,但是也存在例外,比如文件被进程锁定,或者有进程在使用这个文件,例如输出日志文件,要了解这个问题,就需要知道Linux下文件的存储机制和存储结构。

一个文件在文件系统中由两个部分构成:数据和指针。指针位于文件系统的meta-data中,数据被删除后,指针被清除,而数部分还是存储在磁盘中,只不过数据对应的指针被清除后,文件数据部分占用的空间就可以被覆盖了。之所以出现删除大文件后,空间还没有释放,就是因为有进程一直在使用这个文件的指针,日志文件的服务还在运行,导致虽然删除了日志大文件,但文件对应的指针部分由于被进程锁定,并未从meta-data中清除,而由于指针并未被删除,那么系统就认为文件并未被删除,所以使用 df 命令查看还是 100%。