一个完整的程序一般都包括数据的存储和读取;我们在前面写的程序数据都没有进行实 际的存储,因此 python 解释器执行完数据就消失了。实际开发中,我们经常需要从外部存 储介质(硬盘、光盘、U 盘等)读取数据,或者将程序产生的数据存储到文件中,实现“持 久化”保存。
- 文本文件:
文本文件存储的是普通“字符”文本,python 默认为 unicode 字符集(两个字节表示 一个字符,最多可以表示:65536 个),可以使用记事本程序打开。但是,像 word 软件 编辑的文档不是文本文件。 - 二进制文件:
二进制文件把数据内容用“字节”进行存储,无法用记事本打开。必须使用专用的软件 解码。常见的有:MP4 视频文件、MP3 音频文件、JPG 图片、doc 文档等等。
文件操作相关模块概述:
- io 模块:文件流的输入和输出操作 input output
- os模块:基本操作系统功能,包括文件操作
- glob 模块:查找符合特定规则的文件路径名
- fnmatch 模块:使用模式来匹配文件路径名
- fileinput 模块: 处理多个输入文件
- filecmp 模块: 用于文件的比较
- cvs 模块: 用于 csv 文件处理
- pickle 和 cPickle: 用于序列化和反序列化
- xml 包: 用于 XML 数据处理
- bz2、gzip、zipfile、zlib、tarfile: 用于处理压缩和解压缩文件(分别对应不同的算法)