DAY14 - 文件操作

一、数据存储

1.计算机数据存储

计算机内存分为运行内容和硬盘两种:保存运行内存中的数据在程序运行结束后会自动释放,保存在硬盘中的数据会一直存在(除非手动删除或运行损坏)

2.数据持久化 - 以文件为单位,将数据保存在硬盘中
  • 数据持久化又叫数据本地化,指的就是将程序中的数据保存在硬盘中(程序中的数据默认是保存在运行内存中的)
  • 硬盘保存数据的基本单位是文件,所以如果想要把数据保存在硬盘中,就需要将数据保存在文件中
  • 常见的数据持久化:数据库(.db、.sqlite),excel文件、csv文件、txt文件、json文件、plist文件等
3.文件操作 - 操作文件内容

文件操作基本步骤:打开文件 -> 操作文件内容(读操作、写操作) -> 关闭文件

1)打开文件 - open(文件路径,文件打开方式,encoding=文本文件编码方式)

1.文件路径 - 文件在计算机中的位置信息

文件路径分为两种,分别是绝对路径和相对路径:

  • 绝对路径:文件在计算机中的全路径
  • 相对路径

注意:使用相对路径之前需要先将被操作的文件放在目录中

a.在写路径的时候用 . 表示当前目录(当前目录指的是当前写代码的代码文件所在的文件夹)

b.在写路径的时候用 .. 表示当前目录的上层目录

注意:路径是以’./‘开头的时候,’./可以省略’

# 使用绝对路径
open(r'/Users/yuting/Work/授课/Python2301/02语言基础/day14-fileOperation/files/data1.txt')

# 使用相对路径
open(r'./files/data1.txt')
open(r'../day14-fileOperation/files/data1.txt')
2)文件打开方式 - 决定了打开文件后能做什么(是能读还是能写?);还决定操作文件的时候数据的类型(是字符串还是二进制?)

第一组值:r、w、a

r - 只读;如果文件不存在,会直接报错

w - 只写,打开的时候会先清空原文件

a - 只写,打开的时候不会清空原文件

第二组值:t、b

t - 字符串类型(读到的数据,和写入的数据必须是字符串)

b - 二进制类型(bytes;独到的数据,和写入的文件中的数据必须是二进制)

给打开方式赋值的时候必须在两组值中每一组选择一个值,如果第二组不选默认选择t:rt(tr,r),rb(br),wt(tw,w),wb(bw),at(ta,a),ab(ba)

# -----r是只读-----
# f = open('files/data1.txt', 'r')
# f.read()
# # f.write('abc')        # 报错!

# ----a是只写,并且不会清空原文件---
# f = open('files/data1.txt', 'a')
# # f.read()          # 报错!
# f.write('abc')

# ---w是只写,并且会清空源文件
# f = open('files/data1.txt', 'w')
# f.write('abc')
# f.read()          # 报错!


# ----r打开不存在的文件程序报错-----
# f = open('files/data2.txt', 'r')

# ----w 和 a 打开不存在的文件的时候不会报错,并且会自动创建这个文件
# f = open('files/data2.txt', 'w')
# f = open('files/data3.txt', 'a')


# --------------- t - 数据的类型是字符串 ---------------
# f = open('files/data1.txt', 'rt')
# result = f.read()
# print(type(result))     # <class 'str'>

# f = open('files/data1.txt', 'at')
# f.write('abc')
补充:常见计算机内存单位
 位(bit)
 1字节(bytes)=8位
 1kb = 1024字节
 1mb=1024kb
 1G=1024mb
 1T=1024G
3)文本文件编码方式
不同的文本文件编码方式,在保存同一个符号的编码值的时候,采用的字节数不同;常见的文本文件编码方式:utf-8(推荐)、gbk

**utf-8:**一个数字和字母采用一个字节保存;一个中文用3个字节

**gbk:**一个数字和字母采用一个字节保存;一个中文用2个字节

**使用编码方式的要求:**前后一致(存储数据的时候采用编码值必须和获取数据的时候采用编码值一致)

# f = open('files/data4.txt', 'w', encoding='utf-8')
# f.write('hello! 世界')

# f = open('files/data4.txt', 'r', encoding='utf-8')
# print(f.read())     # hello! 世界!

# f = open('files/data4.txt', 'r', encoding='gbk')
# print(f.read())


f = open('files/data4.txt', 'w', encoding='gbk')
f.write('hello!世界!')

# f = open('files/data4.txt', 'r', encoding='gbk')
# print(f.read())

# f = open('files/data4.txt', 'r', encoding='utf-8')
# print(f.read())
4.操作文件
1)文件读操作(获取文件内容)

**a.文件对象.read() ** - 获取整个文件内容(从读写位置开始获取文件结束,读写位置默认文件开头)

b.文件对象.readline() - 从读写位置开始读到一行结束(只针对文本文件有效)

2)文件写操作 (包括增加内容、修改内容、删除内容)

a.文件对象.write(内容) - 将指定内容写入到指定文件中

注意:读操作会改变读写位置

文件对象.seek(0) - 将读写位置移动到文件开头

3.关闭文件 - 文件对象.close()
f = open('files/data1.txt', encoding='utf-8')
result = f.read()
print(result)

print('---------------------------------------华丽的分割线------------------------------------')
f.seek(0)
result = f.read()
print(result)

print('---------------------------------------华丽的分割线------------------------------------')
f.seek(0)
# print(f.readline())
# print(f.readline())
# print(f.readline())
# print(f.readline())
# result = f.readline()       # ''
# print(type(result), len(result))
print('---------------------------------------华丽的分割线------------------------------------')


# 练习:读文件内容,一行一行的读,读完为止
# def get_file_content():
#     f = open('files/data1.txt', encoding='utf-8')
#     while True:
#         result = f.readline()
#         if result == '':
#             break
#         yield result
#
#
# reader = get_file_content()
# print(next(reader))
# print(next(reader))


f = open('files/data2.txt', 'w', encoding='utf-8')
f.write('Python')
f.close()
# f.write('\nJava')

二、数据持续化的应用 - 让这次运行程序产生的数据可以在下一次运行程序的时候使用

第一步:确定需要持久化的数据

第二步:创建文件,并且确定文件初始内容

第三步:做到在程序中需要这个数据的时候,从文件中获取这个数据

第四步:做到这个数据如果发生改变,必须将最新的数据更新到文件中

# 案例1:写程序打印程序运行次数
# 获取上一次的运行次数
f = open('files/RunTime.txt', encoding='utf-8')
count = int(f.read())
f.close()

# 再让次数加1
count += 1

# 打印次数
print(count)

# 更新文件内容
f = open('files/RunTime.txt', 'w', encoding='utf-8')
f.write(str(count))
# 练习1:
"""
请输入需要添加的学生的名字:小明
小明

请输入需要添加的学生的名字:小花
小明 小花

请输入需要添加的学生的名字:张三
小明 小花 张三

....
"""
# 需要持久化的数据:已经添加过的所有的学生的名字
# name = input('请输入学生的名字:')
#
# try:
#     f = open('files/studentName.txt', encoding='utf-8')
#     all_student = f.read()
#     f.close()
# except FileNotFoundError:
#     all_student = ''
#
# all_student += name + ' '
# print(all_student)
#
# f = open('files/studentName.txt', 'w', encoding='utf-8')
# f.write(all_student)
# f.close()
"""
姓名: 小明
性别: 男
年龄: 18
打印: [{'name': '小明', 'gender': '男', 'age': 18}]

姓名: 小花
性别: 女
年龄: 20
打印: [{'name': '小明', 'gender': '男', 'age': 18}, {'name': '小花', 'gender': '女', 'age': 20}]
"""
# 需要持久的数据:所有已经添加的学生信息
name = input('姓名:')
gender = input('性别:')
age = int(input('年龄:'))

# 获取之前添加过的所有的学生
try:
    f = open('files/学生信息.txt', encoding='utf-8')
    all_student = eval(f.read())
    f.close()
except FileNotFoundError:
    all_student = []

all_student.append({'name': name, 'gender':  gender, 'age': age})

print(all_student)

f = open('files/学生信息.txt', 'w', encoding='utf-8')
f.write(str(all_student))
f.close()