文章目录

  • 读写文本文件
  • 读文本文件
  • 写文本文件
  • 上下文语法
  • 读写二进制文件
  • 读取Python官方解释器文件,计算md5哈希码
  • 将100以内的质数输出到文件中每行一个数。


读写文本文件
读文本文件

在Python中,我们通过open函数来打开文件。使用open函数时,通过指定文件名``操作模式``字符编码等信息,达到怎样打开文件和怎样读写。
完整语法为:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

操作模式

具体含义

'r'

读取 (默认)

'w'

写入(会先截断之前的内容)

'x'

写入,如果文件已经存在会产生异常

'a'

追加,将内容写入到已有文件的末尾

'b'

二进制模式

't'

文本模式(默认)

'+'

更新(既可以读又可以写)

这张表就是操作模式的方法解释,下面我们来看具体例子。

file = open(file='resources/致橡树.txt', mode='r', encoding='utf-8')
data = file.read()
print(data, end='')
file.close()

首先使用open函数创建一个名为file的对象,指定打开文件为file='D:/Python/resources/致橡树.txt',对文件操作模式为mode='r',字符编码为encoding='utf-8'。对file对象使用read()方法,再把读到的内容打印出来。最后再关闭文件。

除了使用文件对象的read方法读取文件之外,还可以使用for-in循环逐行读取或者用readlines方法将文件按行读取到一个列表容器中,代码如下所示。

import time

file = open('resources/致橡树.txt', 'r', encoding='utf-8')
for line in file:
    print(line, end='')
    time.sleep(0.5)
file.close()

file = open('resources/致橡树.txt', 'r', encoding='utf-8')
lines = file.readlines()
for line in lines:
    print(line, end='')
    time.sleep(0.5)
file.close()
写文本文件

如果要向文件中写入内容,可以在打开文件时使用w或者a作为操作模式,w会截断之前的文本内容写入新的内容,a是在原来内容的尾部追加新的内容。

file = open('resources/致橡树.txt', 'a', encoding='utf-8')
file.write('\n标题:《致橡树》')
file.write('\n作者:舒婷')
file.write('\n时间:1977年3月')
file.close()

也可以使用下面的代码来完成相同的操作。

lines = ['标题:《致橡树》', '作者:舒婷', '时间:1977年3月']
file = open('resources/致橡树.txt', 'a', encoding='utf-8')
for line in lines:
    file.write(f'\n{line}')
file.close()
上下文语法

在上面的使用中,我们既需要写打开文件,还需要写关闭文件的代码,这是很麻烦的事情。我们可以使用with上下文语法在文件操作完成后自动执行文件对象的close方法,这样可以让代码变得更加简单。使用方法如下:

with open('resources/小雨康桥的诗.txt', mode='a', encoding='utf-8') as file:
    file.write('我做不成燕子\n')
    file.write('所以我飞不过感情的墙\n')
    file.write('我做不成树\n')
    file.write('因此也撑不破伤心的网\n')
读写二进制文件

读写二进制文件跟读写文本文件的操作类似,但是需要注意,在使用open函数打开文件时,如果要进行读操作,操作模式是'rb',如果要进行写操作,操作模式是'wb'。还有一点,读写文本文件时,read方法的返回值以及write方法的参数是str对象(字符串),而读写二进制文件时,read方法的返回值以及write方法的参数是bytes-like对象(字节串)。下面的代码实现了将当前路径下名为guido.jpg的图片文件复制到吉多.jpg文件中的操作。

with open('resources/guido.jpg', 'rb') as file1:
data = file1.read()
with open('resources/吉多.jpg', 'wb') as file2:
file2.write(data)

如果要复制的图片文件很大,一次将文件内容直接读入内存中可能会造成非常大的内存开销,为了减少对内存的占用,可以为read方法传入size参数来指定每次读取的字节数,通过循环读取和写入的方式来完成上面的操作,代码如下所示。

with open('resources/guido.jpg', 'rb') as file1, open('resources/吉多.jpg', 'wb') as file2:
data = file1.read(512)
while data:
    file2.write(data)
    data = file1.read(512)
读取Python官方解释器文件,计算md5哈希码

下面我们进行练习,读取二进制文件。读取Python官方解释器文件,计算md5哈希码。我们将读出的md5哈希码和官网上的进行比对,这样就知道我们下载的Python官方解释器是否被恶意篡改。

import hashlib

hasher = hashlib.md5()
with open('resources/python-3.9.6-amd64.exe','rb') as file
data = file.read(512)
while data:
    # 更新MD5对象的数据
    hasher.update(data)
    data = file.read(512)
# 获得十六进制形式MD5哈希摘要
print(hasher.hexdigest())  #ac25cf79f710bf31601ed067ccd07deb

通过对比,我们计算出来和官网给出的md5哈希码一致,说明我们的解释器没有问题。

将100以内的质数输出到文件中每行一个数。

代码如下:

with open('resources/100以内的质数.txt', mode='a', encoding='utf-8') as file:
    for num in range(2, 101):
        for i in range(2, num+1):
            if num % i == 0:
                break
        if num == i:
            file.write(f'{str(num)}\n')

python处理文字角度 python文字教程_文本文件