为了更好地说明接下来的文件修改操作,我们有必要先来学习下文件操作的常用方法。

一、文件处理中的常用方法 

#!/usr/bin/env python3
#-*- coding:utf-8 -*-
# write by congcong

# flush() 把文件从内存强制刷新到硬盘
f = open('w_flush.txt',mode='r+')
f.write("这是强制刷新到硬盘的文件!")
f.flush()
print("查看文件:",f.read())
# f.close()


# readable() 判断是否可读
print(f.readable())  #输出:True
f1 = open("w_flush.txt",mode='w') #文件的写操作
f1.write('判断文件是否可读!')
f1.flush()
print(f1.readable()) # 输出:False (表明写操作时文件也是不可读的)


#  readline() 输出一行,碰到\r 或者 \n结束
f = open('w_flush.txt',mode='a',encoding='gbk')
f.write('我是第一行!')
f.write('\n我是第二行!')
f = open('w_flush.txt',mode='r',encoding='gbk')
print(f.readline())#输出:我是第一行!

# tell() 返回光标当前位置,以字节为计算单位
print(f.tell()) #输出 ; 14,因为编码为 gbk ,gbk每个中文字符占两个字节,所以此时光标位于第一行末尾

# seek() 将光标移到指定字节位置,以字节为计数单位
print(f.seek(2)) #输出:2
print(f.readline()) # 输出;是第一行!
print(f.seek(4))  #输出:4
print(f.readline()) #输出:第一行

# seekable() 判断文件能否seek,linux中使用(一切皆文件)

# read() 括号内指定长度时,就从当前位置开始读几个字符;括号内没有指定长度时,就读全部文件,以字符为单位
print(f.tell())
print(f.seek(0))
print(f.read(2)) #输出:我是

# truncate() 按指定长度截断文件,括号内指定长度时,就从文件开头开始截断指定长度;不指定长度时,从当前位置到尾部的内容全部去掉
#此方法必须是在写模式下使用
f = open('w_flush.txt','r+',encoding='gbk')
print(f.seek(4)) #输出;4
print(f.tell())  # 输出;4
print(f.truncate(8)) #输出;8
print(f.seek(0)) #输出 :0

f.close()

 了解了以上的方法,我们就能愉快地进行文件修改操作了。

二、文件修改操作

  当我们以读写(r+)模式打开文件时,,默认会把新增的内容追加到文件最末尾。

  这是为什么呢?那我们如果想要修改中间的内容该怎么办呢?

  还记得我们刚学过一个tell()方法吗,它的单位是字节,当我们读一段内容的时候,光标会跟着移动,文件读完了,光标就会移到末尾,

再接着写,光标自然会跟着移动,写完后,光标就停留在末尾了,我们可以用tell()方法验证一下猜想,打印此时光标位置,

此时,我们再想读文件内容,就没有任何输出了,都是空白的。这就解释了为何我追加的内容为何无法读出来。

  至于为何追加内容会从末尾开始,就容易理解了,当你以追加模式打开文件时,光标会默认移到文件尾部,再开始写。

  而文件修改就要用到另一个方法了,seek()方法,它的作用就是移动光标到指定位置,移动的单位是字节,当我们想修改某个地方,

使用seek()方法将光标移到指定位置就可以再修改了,下面我们可以试一下:

# write.txt的原本内容是 :这是第一个我用Python写的文件!
# 现在我要将‘写’改为‘修改后’

f = open(file='write.txt',mode='r+',encoding='gbk')
print('修改前:\n',f.read(),f.tell()) # 读出修改前的文件内容,并打印当前光标位置
f.seek(20)          # 将光标移到第20个字节后的位置(GBK编码一个汉字占2字节,英文占1字节)
f.write('修改后')     # 写入修改内容
f.seek(0)           # 将光标移到文件开头
print(f.tell())     # 打印当前光标位置
print('修改后:\n',f.read(),f.tell()) # 读出修改后的文件内容,并打印当前光标位置

f.close() # 关闭文件

'''
 这是第一个我用Python写的文件! 29
0
修改后:
 这是第一个我用Python修改后件! 29
'''

  没有报错,正常执行,‘写’ 也的确被改成了 ‘修改后’ ,文件大小也并未改变,但是也有我们不想修改的内容被覆盖了,这就尴尬了。。。

  原因在这里

    这是硬盘的存储原理导致的,当你把文件存到硬盘上,就在硬盘上划了一块空间,存数据,等你下次打开这个文件 ,seek到一个位置,每改一个字,就是把原来的覆盖掉,如果要插入,是不可能的,因为后面的数据在硬盘上不会整体向后移。所以就出现 当前这个情况 ,你想插入,却变成了会把旧内容覆盖掉。

  解决方法呢?

    想修改当然可以,但是不要在硬盘上修改,把内容全部读到内存里,数据在内存里可以随便增删改查,修改之后,把内容再全部写回硬盘,把原来的数据全部覆盖掉。

    例如: 

# -*- coding:utf-8 -*-

import os       # 导入模块

f1 = 'notebook.txt'    # 待修改的文件
f2 = 'note_new.txt'    # 修改后的文件
f_old = open(f1,mode='r',encoding='utf-8')   # 打开待修改的文件
f_new = open(f2,mode='w',encoding='utf-8')    # 写入修改的文件    

old_str = '一'       # 待修改的字符串
new_str = 'one'    # 修改后的字符串
count = 0           # 统计修改次数
for line in f_old:   # 循环读
    if old_str in line:
        newline = line.replace('一','one')    # 替换
        count += 1    #  每修改一次自增1
    else:
        newline = line
    f_new.write(newline)     # 写入修改后的文件
f_old.close()     # 依次关闭
f_new.close()
os.replace('note_new.txt','notebook.txt')    # 用新文件里的内容替换旧文件 
print('修改次数:'count)     # 修改次数:5

 

读书原为修身,正己才能正人正世;不修身不正己而去正人正世者,无一不是盗名欺世;你把念过的书能用上十之一二,就是很了不得的人了。——朱先生