一、前言
Excel
文件是我们常用的一种文件,在工作中使用非常频繁。Excel
中有许多强大工具,因此用Excel
来处理文件会给我们带来很多便捷。但是有时候我们拿到了文件不是Excel
文件,而且我们又想用Excel
中的工具,这个时候我们就可以想办法把这个文件转换成Excel
文件了。今天我们就来实现一下,需要注意我们只能把有规律的文件转换成Excel,而且今天的内容也不是普遍通用的。只提供一种思路。
二、openpyxl模块
openpyxl
模块是用来操作Excel
文件的一个模块,还有很多模块可以做同样的事情,这里就不介绍了。
1、安装
安装只需要执行下面语句即可:
pip install openpyxl
然后在代码中导入工作簿:
from openpyxl import Workbook
这样我们就可以开始操作了。
2、简单操作
我们来看一些简单的操作:
from openpyxl import Workbook
# 创建工作簿
wb = Workbook()
# 激活
ws = wb.active
# 设置指定格的数据
ws['A1'] = 41
# 在下一行添加数据
ws.append([1, 2, 3])
# 保存
wb.save("1.xlsx")
这里前面两步是基本操作,首先创建Workbook对象,然后调用active函数激活。然后我们通过下标的方式给指定坐标的位置添加数据。最后调用save方法保存文件。
三、文本文件转excel文件
上面的几个操作就足够我们今天的操作了,下面我们来看看如何将文本文件转换成Excel
文件。
1、寻找规律
在文章开头说了,我们只能将有规律的文本文件转换成Excel
,不然没有太多意义。所以我们第一步就是找规律。比如我们下面这个文件:
姓名,性别,年龄
zack,男,21
rudy,男,22
alice,女,20
atom,男, 23
我们来看一下上面的数据,其中第一行是数据的字段。而后面几行就是真实数据了。而单个数据的属性值又由逗号隔开。这种规律非常明显,很适合我们今天的内容。不管仔细观察可以看到,逗号有中文的也有英文的,而且有的里面还包含了空格。知道这些后我们在转换的时候就需要针对性的处理一下了。
2、开始转换
首先我们要处理文本,然后再写入Excel
,具体代码如下:
from openpyxl import Workbook
wb = Workbook()
ws = wb.active
# 处理文件
with open("test.txt", "r", encoding="utf-8") as f:
# 把逗号替换成统一的\t
content = f.read().replace(",", "\t").replace(",", "\t")
# 根据换行拆分内容
lines = content.split("\n")
# 提取标题
titles = lines[0].split("\t")
titles.insert(0, "")
# 标题写入excel
ws.append(titles)
# 写入内容
for i, line in enumerate(lines[1:]):
item = line.split("\t")
item.insert(0, i)
ws.append(item)
wb.save("1.xlsx")
经过上面的处理,我们就成功将文本转换成excel了,下面是结果图:
效果正是我们想要的,大家可以根据不同需求不同文件来修改处理的代码。