目录
- 一、从文件中读取数据
- 1、读取整个文件
- 2、文件路径
- 3、逐行读取
- 4、创建一个包含文件各行内容的列表
- 5、使用文件的内容
- 二、写入文件
- 1、写入空文件
- 2、写入多行
- 3、附加到文件
- 三、储存数据
- 使用json.dump() 和json.load()
- 四、异常处理
- 1、使用try-except 代码块
- 2、使用异常避免崩溃
- 3、使用 pass
一、从文件中读取数据
要使用文本文件中的信息,首先需要将信息读取到内存中。可以一次性读取文件的全部内容,也可以以每次一行的方式逐步读取。
创建一个文件, 它包含精确到小数点后30位的圆周率值, 且在小数点后每10位处都换行。
pi_digits.txt
3.1415926535
8979323846
2643383279
1、读取整个文件
file_reader.py
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents)
要以任何方式使用文件——哪怕仅仅是打印其内容, 都得先打开文件,这样才能访问它。
函数open() 接受一个参数: 要打开的文件的名称。 Python在当前执行的文件所在的目录中查找指定的文件。 在这个示例中, 当前运行的是file_reader.py, 因此Python在file_reader.py所在的目录中查找pi_digits.txt。 函数open() 返回一个表示文件的对象。 在这里, open(‘pi_digits.txt’) 返回一个表示文件pi_digits.txt 的对象; Python将这个对象存储在我们将在后面使用的变量中。
关键字with 在不再需要访问文件后将其关闭。 在这个程序中, 注意到我们调用了open() , 但没有调用close() ; 你也可以调用open() 和close() 来打开和关闭文件, 但这样做时, 如果程序存在bug, 导致close() 语句未执行, 文件将不会关闭。 这看似微不足道,但未妥善地关闭文件可能会导致数据丢失或受损。 如果在程序中过早地调用close() , 你会发现需要使用文件时它已关闭 (无法访问) ,这会导致更多的错误。 并非在任何情况下都能轻松确定关闭文件的恰当时机, 但通过使用前面所示的结构, 可让Python去确定: 你只管打开文件, 并在需要时使用它, Python自会在合适的时候自动将其关闭。
有了表示pi_digits.txt的文件对象后, 用方法read() 读取这个文件的全部内容, 并将其作为一个长长的字符串存储在变量contents 中。 这样, 通过打印contents 的值, 就可将这个文本文件的全部内容显示出来。
相比于原始文件, 该输出唯一不同的地方是末尾多了一个空行。 为何会多出这个空行呢? 因为read() 到达文件末尾时返回一个空字符串, 而将这个空字符串显示出来时就是一个空行。 要删除多出来的空行, 可在print 语句中使用rstrip() :
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents.rstrip())
2、文件路径
当你将类似pi_digits.txt这样的简单文件名传递给函数open() 时, Python将在当前执行的文件(即.py程序文件) 所在的目录中查找文件。
要让Python打开不与程序文件位于同一个目录中的文件, 需要提供文件路径 , 它让Python到系统的特定位置去查找。
例如, 你可能将程序文件存储在了文件夹python_work中, 而在文件夹python_work中, 有一个名为text_files的文件夹,用于存储程序文件操作的文本文件。
由于文件夹text_files位于文件夹python_work中,因此可使用相对文件路径来打开该文件夹中的文件。相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。
在Linux和OS X中, 你可以这样编写代码:
with open('text_files/filename.txt') as file_object:
在Windows系统中, 在文件路径中使用反斜杠(\ ) 而不是斜杠(/ ) :
with open('text_files\filename.txt') as file_object:
你还可以将文件在计算机中的准确位置告诉Python, 这样就不用关心当前运行的程序存储在什么地方了。 这称为绝对文件路径 。
在Linux和OS X中, 绝对路径类似于下面这样:
file_path = '/home/ehmatthes/other_files/text_files/filename.txt'
with open(file_path) as file_object:
而在Windows系统中, 它们类似于下面这样:
file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt'
with open(file_path) as file_object:
3、逐行读取
读取文件时, 常常需要检查其中的每一行: 你可能要在文件中查找特定的信息, 或者要以某种方式修改文件中的文本。
要以每次一行的方式检查文件, 可对文件对象使用for 循环:
filename = 'pi_digits.txt'
with open(filename) as file_object:
for line in file_object:
print(line.rstrip())
4、创建一个包含文件各行内容的列表
使用关键字with 时,open() 返回的文件对象只在with 代码块内可用。如果要在with 代码块外访问文件的内容,可在with 代码块内将文件的各行存储在一个列表中,并在with 代码块外使用该列表。
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
for line in lines:
print(line.rstrip())
方法readlines() 从文件中读取每一行, 并将其存储在一个列表中; 接下来, 该列表被存储到变量lines 中; 在with 代码块外,我们依然可以使用这个变量。
5、使用文件的内容
将文件读取到内存中后, 就可以以任何方式使用这些数据了。
filename = 'pi_digits.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.rstrip()
print(pi_string)
print(len(pi_string))
3.1415926535 8979323846 2643383279
36
在变量pi_string 存储的字符串中, 包含原来位于每行左边的空格, 为删除这些空格, 可使用strip() 而不是rstrip() :
将pi_string += line.rstrip()
改为 pi_string += line.strip()
这时输出为:
3.141592653589793238462643383279
32
注意:读取文本文件时, Python将其中的所有文本都解读为字符串。 如果你读取的是数字, 并要将其作为数值使用, 就必须使用函数int() 将其转换为整数,或使用函数float() 将其转换为浮点数。
二、写入文件
1、写入空文件
要将文本写入文件, 在调用open() 时需要提供另一个实参, 告诉Python要写入打开的文件。
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.")
在这个示例中, 调用open() 时提供了两个实参。 第一个实参也是要打开的文件的名称; 第二个实参(‘w’ ) 告诉Python, 我们要以写入模式打开这个文件。 打开文件时, 可指定读取模式 (‘r’ ) 、 写入模式 (‘w’ ) 、 附加模式 (‘a’ ) 或让你能够读取和写入文件的模式(‘r+’ ) 。 如果你省略了模式实参, Python将以默认的只读模式打开文件。
如果你要写入的文件不存在, 函数open() 将自动创建它。 然而, 以写入(‘w’ ) 模式打开文件时千万要小心, 因为如果指定的文件已经存在, Python将在返回文件对象前清空该文件。
方法write() 将一个字符串写入文件。
注意:Python只能将字符串写入文本文件。 要将数值数据存储到文本文件中, 必须先使用函数str() 将其转换为字符串格式。
2、写入多行
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.")
file_object.write("I love creating new games.")
函数write() 不会在你写入的文本末尾添加换行符, 因此如果你写入多行时没有指定换行符, 将发现两行内容挤在一起:
I love programming.I love creating new games.
要让每个字符串都单独占一行, 需要在write() 语句中包含换行符:
filename = 'programming.txt'
with open(filename, 'w') as file_object:
file_object.write("I love programming.\n")
file_object.write("I love creating new games.\n")
I love programming.
I love creating new games.
3、附加到文件
如果你要给文件添加内容, 而不是覆盖原有的内容, 可以附加模式打开文件。 你以附加模式打开文件时, Python不会在返回文件对象前清空文件,而你写入到文件的行都将添加到文件末尾。 如果指定的文件不存在, Python将为你创建一个空文件。
filename = 'programming.txt'
with open(filename, 'a') as file_object:
file_object.write("I also love finding meaning in large datasets.\n")
file_object.write("I love creating apps that can run in a browser.\n")
最终的结果是, 文件原来的内容还在, 它们后面是我们刚添加的内容:
I love programming.
I love creating new games.
I also love finding meaning in large datasets.
I love creating apps that can run in a browser.
三、储存数据
模块json 能够将简单的Python数据结构转储到文件中, 并在程序再次运行时加载该文件中的数据。 还可以使用json 在Python程序之间分享数据。 更重要的是,JSON数据格式并非Python专用的, 以JSON格式存储的数据能够与使用其他编程语言的人分享。
使用json.dump() 和json.load()
函数json.dump() 接受两个实参: 要存储的数据以及可用于存储数据的文件对象。
import json
numbers = [2, 3, 5, 7, 11, 13]
filename = 'numbers.json'
with open(filename, 'w') as f_obj:
json.dump(numbers, f_obj)
打开文件numbers.json, 看看其内容
[2, 3, 5, 7, 11, 13]
使用json.load() 将这个列表读取到内存中。
import json
filename = 'numbers.json'
with open(filename) as f_obj:
numbers = json.load(f_obj)
print(numbers)
[2, 3, 5, 7, 11, 13]
四、异常处理
Python使用被称为异常 的特殊对象来管理程序执行期间发生的错误。 每当发生让Python不知所措的错误时, 它都会创建一个异常对象。 如果你编写了处理该异常的代码, 程序将继续运行; 如果你未对异常进行处理, 程序将停止, 并显示一个traceback, 其中包含有关异常的报告。
异常是使用try-except 代码块处理的。 try-except 代码块让Python执行指定的操作, 同时告诉Python发生异常时怎么办。 使用了try-except 代码块时,即便出现异常,程序也将继续运行: 显示你编写的友好的错误消息, 而不是令用户迷惑的traceback。
1、使用try-except 代码块
数字除以0会导致ZeroDivisionError 异常。
将导致错误的代码行print(5/0) 放在一个try 代码块中。 如果try 代码块中的代码运行起来没有问题, Python将跳过except 代码块; 如果try 代码块中的代码导致了错误, Python将查找这样的except 代码块, 并运行其中的代码。如果try-except 代码块后面还有其他代码, 程序将接着运行。
try:
print(5/0)
except ZeroDivisionError:
print("You can't divide by zero!")
You can't divide by zero!
2、使用异常避免崩溃
发生错误时, 如果程序还有工作没有完成, 妥善地处理错误就尤其重要。
下面来创建一个只执行除法运算的简单计算器:
division.py
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
if second_number == 'q':
break
answer = int(first_number) / int(second_number)
print(answer)
这个程序没有采取任何处理错误的措施, 因此让它执行除数为0的除法运算时, 它将崩溃。
通过将可能引发错误的代码放在try-except 代码块中, 可提高这个程序抵御错误的能力。 错误是执行除法运算的代码行导致的,因此需要将它放到try-except 代码块中。
依赖于try 代码块成功执行的代码都放在else 代码块中, 如果除法运算成功, 就使用else 代码块来打印结果。
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
print("You can't divide by 0!")
else:
print(answer)
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 5
Second number: 0
You can't divide by 0!
First number: 5
Second number: 2
2.5
First number: q
3、使用 pass
Python有一个pass 语句, 可在代码块中使用它来让Python 什么都不要做。
pass 语句还充当了占位符, 它提醒你在程序的某个地方什么都没有做, 并且以后也许要在这里做些什么。
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
# print("You can't divide by 0!")
pass
else:
print(answer)
First number: 5
Second number: 0
First number: 5
Second number: 2
2.5
First number: q