Python数据分析系列

第一章 csv文件处理基础第二章 csv文件处理进阶



目录

  • Python数据分析系列
  • CSV文件
  • CSV库
  • 数据处理
  • 原始数据
  • 读取数据
  • 使用`csv.reader`
  • 使用` csv.DictReader `
  • 写入数据
  • 使用`csv.writer`写入数据
  • 使用`csv.DictWriter`写入数据


CSV文件

简单来说CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。

CSV库

Python中集成了专用于处理csv文件的库,名为:csv

csv 库中有4个常用的对象:
csv.reader :以列表的形式返回读取的数据;
csv.writer :以列表的形式写入数据;
csv.DictReader :以字典的形式返回读取的数据;
csv.DictWriter:以字典的形式写入数据;

数据处理

原始数据

文件名为"test.csv"

python处理csv文件 python处理csv文件用什么库_打开文件

读取数据

使用csv.reader

# 导入 csv 库
import csv

def reader():
	# 打开csv文件 此处的delimiter指定了分隔符,不用此参数的话,分隔符默认为逗号
	with open("test.csv", mode='rt',encoding="utf-8-sig") as f_in:
		reader = csv.reader(f_in,delimiter=',')
		
		# 获取第一行的header
	    # header[0] = "name"
	    # header[1] = "sex"
	    # header[2] = "age"
	    # header[3] = "score"
	    header = next(reader)
	    
	    # 逐行获取数据,并处理
		for line in reader:
			print(type(line))

此时得到的line是一个list类型

python处理csv文件 python处理csv文件用什么库_python处理csv文件_02

使用csv.DictReader

# 导入 csv 库
import csv

def dict_reader():
	# 打开文件
	with open("test.csv", mode='rt',encoding="utf-8-sig") as f_in:
	    # 基于打开的文件,创建csv.DictReader实例
	    reader = csv.DictReader(f_in)
	    # 逐行获取数据,并处理
	    for line in reader:
	        print(type(line))

此时的line就是一个dict类型

python处理csv文件 python处理csv文件用什么库_python处理csv文件_03

写入数据

注意:

在打开文件时,需要添加newline = “”。否则,会在每2行有效内容之间添加一行空白。
如果要保存的内容有中文,而且之后需要用Excel打开文件,那么需要选用utf-8-sig编码。如果使用utf-8编码,会导致使用Excel查看文件时中文乱码。

使用csv.writer写入数据

# 导入 csv 库
import csv
def writer():
	# 创建列表,保存header内容
    header_list = ["name", "sex", "age", "score"]

    # 创建列表,保存数据
    data_list = [
        ["aaa", "fm", 20, 80],
        ["bbb", "fm", 19, 90],
        ["ccc", "fm", 21, 95]
    ]

    # 以写方式打开文件。注意添加 newline="",否则会在两行数据之间都插入一行空白。
    with open("new_data.csv", mode="w", encoding="utf-8-sig", newline="") as f_out:
        
        # 基于打开的文件,创建 csv.writer 实例
        writer = csv.writer(f_out)

        # 写入 header。
        # writerow() 一次只能写入一行。
        writer.writerow(header_list)

        # 写入数据。
        # writerows() 一次写入多行。
        writer.writerows(data_list)

输出结果为:

python处理csv文件 python处理csv文件用什么库_python处理csv文件_04

使用csv.DictWriter写入数据

# 导入 csv 库
import csv
def dict_writer():
	# 创建列表,保存header内容
    header_list = ["name", "sex", "age", "score"]

    # 创建列表,保存数据
    data_list = [
        {"name":"a", "sex":"m", "age":20, "score":80},
        {"name":"bb", "sex":"fm", "age":19, "score":90},
        {"name":"ccc", "sex":"fm", "age":21, "score":95},
    ]

    # 以写方式打开文件。注意添加 newline="",否则会在两行数据之间都插入一行空白。
    with open("dict_new_data.csv", mode="w", encoding="utf-8-sig", newline="") as f_out:
        
        # 基于打开的文件,创建 csv.DictWriter 实例,将 header 列表作为参数传入。
        writer = csv.DictWriter(f_out, header_list)

        # 写入 header
        writer.writeheader()

        # 写入数据
        writer.writerows(data_list)

输出结果为:

python处理csv文件 python处理csv文件用什么库_python处理csv文件_05