文章目录

  • 1. 数据持久化
  • 1.1 计算机存储数据
  • 1.2 数据持久化
  • 2. 文件操作
  • 2.1 打开文件
  • 2.2 文件读写


1. 数据持久化

1.1 计算机存储数据

  • 默认情况下程序中的数据是保存在运行内存中,当程序运行结束,在运行内存中保存的数据会自动销毁;
  • 如果希望在这次运行程序的时候可以使用.上一次运行程序产 生的数据,就必须把数据保存在硬盘(磁盘)中;
  • 硬盘保存数据的最小单位是文件。

1.2 数据持久化

将数据以文件的形式保存在硬盘中
文件操作

  • 1)确定需要持久化的数据
  • 2)创建保存需要持久化数据的文件
  • 3)确定文件初始内容(就是需要持久化的数据的初始值)
  • 4)在程序中需要这个数据的时候从文件中获取这个数据
  • 5)在程序中修改数据后,必须将最新的数据写入到文件中

2. 文件操作

基本流程:打开文件 -> 文件读写 -> 关闭文件

2.1 打开文件

open(file, moode=‘r’, encoding=None)

以指定的方式打开指定文件,返回一个文件对象

  1. 参数1: file - 需要打开的文件路径(文件路径可以写绝对路径,也可以写相对路径)
  • 绝对路径:文件在计算机中的全路径(windows从盘开始写的路径)
  • 相对路径:在写文件路径的时候可以用’.‘开头代表当前目录或者’… ‘开头代表当前目录的上次目录
    (当前目录指定是当前代码文件所在的文件夹)
    注意:如果要使用相对路径,被打开的文件必须放在工程中
    如果路径是以’./'开头的, './'可以省略
  1. 参数2:mode - 文件打开方式,用来决定:打开文件之后能做什么(能读还是能写)、操作文件的时候数据对应的类型(是字符串还是二进制)

给mode赋值的时候需要两组值:

  • 第一组:决定打开后能做什么对应的值
  • r - 只读;打开不存在的文件,会报错!
  • w - 只写;打开的时候会先清空原文件内容;打开不存在的文件不会报错,并且会自动创建这个文件
  • a - 只写;打开的时候不会清空原文件内容;打开不存在的文件不会报错,并且会自动创建这个文件
  • 第二组:决定操作文件的时候数据的类型
  • t - 字符串
  • b - 二进制(bytes)
  • 赋值的时候上面两组值每一组都必须选择一个(如果第二组值不选,就相当于选的是’t’):
  • rt(tr)、rb(br)、r、wt、wb、w、at、ab、a
  1. 参数3:encoding - 文本文件编码方式(只有在以t方式打开文件的时候,才需要设置encoding)
  • 一般赋值为’utf-8’ , 'gbk’也是一种常见的文件编码方式
  • utf-8: 文本数据在存储的时候,ascii表中符号用1个字节来存储,一个中文用3个字节存储。可以对任何符号编码
  • gbk: 文本数据在存储的时候,ascii表中符号用1个字节来存储,一个中文用2个字节存储。除了ascii表和中文以外不能对其他符号进行编码
  • 使用编码值的原则:存储数据的时候使用编码值要和获取数据的时候对应的编码值一致。

2.2 文件读写

  1. 文件读操作:
  • 文件对象.read() - 获取整个文件内容(从读写位置开始,读到文件结束。读写位置默认在文件开头,随着读操作的进行读写位置会不断改变)
  • 文件对象.readline() - 获取一行内容(只能文本文件有效)
  • 文件对象.readlines() - 获取整个文件内容,返回一个列表,列表中的元素是每一行内容(只能文本文件有效)
  1. 文件写操作
  • 文件对象.write(数据)
  • 文件对象.writelines(列表)
# 打开txt文件,创建文件对象
f = open('test.txt', 'a', encoding='utf-8')
# 单个写入
f.write('abc')
# 多个数据写入
f.writelines(['python\n', 'java\n', 'h5\n'])

# 3) 关闭文件
# 文件对象.close()
f.close()