读写文件
1.1 文件与文件路径
- windows上文件路径为倒斜杠 , OS X和Linux上为正斜杠 /.
- os.path.join()函数返回一个正确的文件路径字符,可以处理不同系统的路径。 案例:
>>> import os>>> os.path.join('usr', 'bin', 'spam')'usrbinspam'
备注:返回的路径中有两个倒斜杠,是因为每个倒斜杠需要另一个倒斜杠字符来转义,因此上才具备处理每个不同操作系统路径问题的能力。
- 创建文件名称的字符串 案例:
>>> import os>>> myfiles = ['account.txt', 'detail.csv', 'invite.docx']>>> for filename in myfiles: print(os.path.join('D:Python', filename))D:Pythonaccount.txtD:Pythondeyail.csvD:Pythoninvite.docx
1.1.2 当前工作路径
- os.getcwd() 获取当前工作路径
- os.chdir() 修改当前工作路径,如果要更改的当前工作目录不存在,Python 就会显示一个错误FileNotFoundError。
- 案例:
>>> import os>>> os.getcwd()'f:让繁琐工作自动化python'>>> os.chdir('D:Django')>>> os.getcwd()'D:Django'
1.1.3 绝对路径和相对路径
- “绝对路径” 总是从根目录开始 ..
- “相对路径” 他是相对于程序的当前工作目录-- . (可选的)
1.1.4 用 os.makedirs() 创建文件夹
程序可以使用os.makedirs()创建文件夹,并且可以创建内层包含的多重文件夹,保证路径的完整性。
- 案例:
>>> import os>>> os.makedirs('f:eadpythondjanbgo')# 在F盘创建的这样一个路径的文件夹F:eadpythondjanbgo
1.1.5 处理绝对路径和相对路径
- os.path.abspath('.') 将相对路径转换为绝对路径
>>> import os>>> os.path.abspath('.')'f:eadpythondjanbgo'
- os.path.isabs(path) 如果参数是一个绝对路径,就返回 True,如果参数是 一个相对路径,就返回 False。
>>> import os>>> os.path.isabs('djanbgo')True>>> os.path.isabs('djanbgo')False
- os.path.relpath(path, start) 将返回从 start 路径到 path 的相对路径的字符串。 如果没有提供 start,就使用当前工作目录作为开始路径。
>>> import os>>> os.path.relpath('f:ead', 'f:Python')'..ead'>>> os.path.abspath('..ead')'f:ead'
- os.path.basename(path) 返回文件名
- os.path.dirname(path) 返回文件名前斜杠之前的所有内容
>>> import os>>> filepath = os.path.join(os.getcwd(), 'lsits.py')>>> filepath'f:让繁琐工作自动化pythonlsits.py'>>> os.path.basename(filepath)'lsits.py'>>> os.path.dirname(filepath)'f:让繁琐工作自动化python'
- os.path.split(path) 获取文件路径和文件名称的字符串元组
- 接上例
>>> os.path.split(filepath)('f:让繁琐工作自动化python', 'lsits.py')
- os.path.sep() 作为 split() 方法的参数,返回路径的一个列表
>>> filepath.split(os.path.sep)['f:', '让繁琐工作自动化python', 'lsits.py']
1.1.6 查看文件大小和文件夹内容
- os.path.getsize(path) 返回参数中文件的字节数
>>> import os>>> path = os.path.join(os.getcwd(), 'lists.py')>>> os.path.getsize(path)537
- os.listdir(path) 返回文件夹下所有类容名称的列表,这个方法在os模块中
# 接上例:>>> dirname = os.path.dirname(path) # 获取到文件路径>>> dirname'f:让繁琐工作自动化python'>>> os.listdir(dirname) # 获取到刚才获取的文件路径下的所有文件列表['4.7.2字符图实践.py', 'lists.py', 'magbase.py', '井字棋盘建模.py', '列表.py', '列表笔记.md', '奇数偶数.py', '字典.py', '字典和结构化数据.md', '字符串笔记.md', '模块导入.py', '猜数字小游戏.py', '第七章:模式匹配与正则.md', '练习.py', '表格打印.py', '计算水果数量.py', '读写文件.md', '项目-口令保管箱']# 综合运用,求出所有文件大小>>> totalSize = 0>>> for filename in os.listdir(dirname):... totalSize = totalSize + os.path.getsize(os.path.join(dirname, filename))...>>> totalSize38274
1.1.7 检查路径的有效性
- os.path.exists(path) 检查所指的文件或文件夹是否存在,返回布尔值
- os.path.isfile(path) 检查所指的路径存在,并且是一个文件,返回True,反之False
- os.path.isdir(path) 检查所指的路径存在,并且是一个文件夹
>>> import os>>> filepath = os.getcwd()>>> os.path.exists(filepath)True>>> os.path.isfile(filepath)False>>> os.path.isdir(filepath)True>>> filepath'F:Python'
1.2 读写文件的过程
1.2.1 读取文件read()
假设我们有一个与操作文件同级的1.txt文档
with open('pi_digits.txt') as file_object: contents = file_object.read() print(contents)
逐行读取
with open('pi_digits.txt') as file_object: for line in dile_object: print(line, end='') # rstrip()删除末尾多余空白行 with open('1.txt') as objfile: for line in objfile: print(line.rstrip()) # 逐行读取 with open('1.txt') as objfile: lines = objfile.readlines()for line in lines: print(line.rstrip()) # 利用文件内容:with open('E:/python/pythbj/数据库/1.txt') as objfile:lines = objfile.readlines()pi_string = ''for line in lines:pi_string += line.rstrip()print(pi_string)print(len(pi_string))
1.2.2 写入文件write()
写入模式时open()函数提供两个参数,第一个实参是要打开的文件的名称;第二个实参要以那种模式写入并打开这个文件,如果写入的数据包含中文需在open()函数中定义encoding='utf_8'
案例:
file = "1.txt"with open(file, 'w' encoding='utf_8') as objfile: objfile.write("这是我用w模式写入到1.txt文件中的语句")
模式解释备注w写入模式如果文件已经存在,在写入前会打开清空以前的数据,再写入r读取模式默认为只读模式打开,可省略a附加模式附加写入在文件末尾r+读取写入读取并写入文件,也会清空原有数据wb二进制模式存储为二进制数据rb读取二进制数据相对用于wb存储的数据
1.3 存储数据
1.3.1 使用json模块存储数据
JSON(JavaScript Object Notation)格式最初是为JavaScript开发的,但随后成了一种常见格式,被包括Python在内的众多语言采用。这让你能够将以JSON格式存储的数据与使用其他编程语言的人分享。这是一种轻便格式,很有用,也易于学习。
#=>使用 json.dump() 存储数据:
import jsonnames = ['zhangzhen','mayaping', 'zhangyuxi']file = 'namesfile.json'with open(file, 'w') as objfile:json.dump(names, objfile)
备注:函数json.dump() 接受两个实参:要存储的数据以及可用于存储数据的文件对象。
#=> 使用 json.load() 将数据读取到内存中:
import jsonfile = 'namesfile.json'with open (file) as objfile:names = json.load(objfile)print(names)
综合案例: 创建一个存储用户名的文件,并在打开时提示个性化问候
import jsondef get_username(): # 返回用户名 try: with open(filename) as objfile: username = json.load(objfile) except FileNotFoundError: return None else: return usernamedef get_new_username(): # 创建用户 filename = 'username.json' username = input("请输入您的用户名:") with open(filename, 'a') as objfile: json.dump(username, objfile) return username def greet_name(): # 如果已经有存储过用户名执行,否则请用户输入 username = get_username() if username: print("欢迎回来" + username) else: username = get_new_username() print("We'll remember you when you come back, " + username + "!")greet_name()
1.3.2 使用pickle模块存储数据
pickle感觉上比较像XML的表示方式,但是,它是Python专用的 方式井且比较容易编写代码。
案例:
import picklebob = dict(name='bob', age=35, pay=10000, job='IT')sue = dict(name='Sue Jones', age=45, pay=30000, job='工程师')# 字典的字典db = {}db['bob'] = bobdb['sue'] = sue# 存储数据pickle.dump()with open('dbfile', 'wb') as objfile: pickle.dump(db, objfile)# 读取数据pickle.load()with open('dbfile', 'rb') as objfile:db = pickle.load(objfile)db['bob']['pay'] *= 1.25 # 修改数据for key in db:print(key)for name, value in db[key].items():print(name + '=>' + repr(value)) # repr()内置函数,返回一个对象的string格式# 存储为.pkl文件for key, record in [('bob1',bob),('sue1',sue)]:with open(key + '.pkl', 'wb') as objfile:pickle.dump(record, objfile)
用glob模块读取整个数据库:
# 读取整个所有后缀为.pkl的文件import globfor filename in glob.glob('*.pkl'):with open(filename, 'rb') as objfile:record = pickle.load(objfile)print(filename, '=>', record)# 读取其中一个文件with open('bob1.pkl', 'rb') as objfile:record = pickle.load(objfile)print(record['name'])
1.3.3 使用shelve模块创建数据
shelve就像一个存储持久化对象的持久化字典。Python会负责处理内容与文件之 间的映射。 shelve模块 的使用方法与 pickle模块 用法类似,只是增加了一个open() 和close() 函数,在win系统下运行会创建多个文件(.bak .dir .dat)[这就是数据库,不能删除]。
# a数据bob = dict(name='bob', age=35, pay=10000, job='IT')sue = dict(name='Sue Jones', age=45, pay=30000, job='工程师')# shelve存储数据import shelvedb = shelve.open('shelve_file')# 先修改某一条数据(必须在先)sue = db['sue']sue['pay'] *= 1.25# 存储db['bob'] = bobdb['sue'] = suedb.close()# shelve读取数据db = shelve.open('shelve_file')for key in db:print(key, '=>', db[key])print(db['sue']['name'])db.close()