打开文件与读写操作

  • 1 打开文件
  • 2 读操作
  • 3 写操作


在Python中对数据进行数据分析,第一步要先采集数据(爬虫、调查问卷、买),第二步是对数据进行预处理(工具:Python、Excel),第三步是借助算法、模型等对数据进行体系建设,更形象直观地展示出来。进行正确有效的数据分析,能够降低成本、提高收益。

数据持久化:将数据从瞬时状态转换为持久状态。

1 打开文件

使用open(参数1,参数2,参数3,…)打开文件,打开的是一个文件对象。

  1. 参数1:路径和文件名
    (1)一个.表示当前文件夹(可以省略不写)。
    (2)两个.表示返回上一级。
    (3)文件夹和文件夹之间以及文件夹和文件之间需要使用/间隔。
    路径有以下两种
    (1)相对路径:以当前说找参照物,另一个文件相对于参照物的所在位置,应该使用/
    (2)绝对路径:以磁盘为参照物,使用\
  2. 参数2:文件打开的方式
    (1)r、a、w、+文件编辑方式
  1. r:只读,如果文件不存在,报错。
  2. w:只写,文件不存在,先自动创建;文件存在,先清空(如果某个文件夹不存在,不会创建文件夹)。
  3. a:只写,文件不存在报错;文件存在,追加。
  4. +:可读可写,将r、a、w变为可读可写的符号:r+、a+、w+;Python操作文件要么读,要么写,不能同时读写。

(2)t、b文件展示形式

  1. t:表示文本
    r、w、a等价于rt、wt、at,其中t是默认的,可以不写,t和r、w、a可以交换顺序。
  2. b:表示字节
    rb、wb、ab、br、bw、ba,b不能省,b和r、w、a可以交换顺序,表示以字节形式操作文件。
  1. 参数3:文件打开的编码形式:utf-8
f=open('文件路径','r',encoding='utf-8')
f.read()
f.write()

2 读操作

  1. read()从文件对象中读信息,一次性读所有内容,读出结果为字符串。
  2. readline()一次读一行,读出结果为字符串。
  3. readlines()一次读出文件的全部内容,每一行内容作为列表中的一个元素。
    指针:文件操作时指针默认在文件开始位置,指针会随着文件操作不断变化。

3 写操作

write()从文件对象中写信息。

所有文件在内存中都是以二进制形式保存的。

Python操作文件流程:

  1. 新建xx名字的文件open()
  2. 写入内容write()
  3. 读内容read()
  4. 保存关闭close()