PDF格式的好处是一旦编辑完成,无论是任何操作系统、任何尺寸和分辨率的显示屏,也无论是怎么打印,排版格式都不会乱,所以经常把文档转换成PDF格式。Excel表格同样也有这种需求,并且为了安全性、防止修改的考虑,也会转换成PDF格式的发出去。
可是接收文档的人,却很发愁,拿着一个PDF格式的表格,我该如何着手去分析?包括在各种资源网站上下载的数据,也有不少是PDF格式的,所以如何将PDF格式的表格转换成Excel,对很多人是一大难题。
这篇文章就给你介绍两个转换秘籍,满足你的各种需求。
(只针对由表格直接转换的PDF文件,如果是扫描生成的PDF,可能并不适用)
使用smallpdf在线转换
网址:https://smallpdf.com/
这个网站绝对是个神器,可以进行PDF、PPT、WORD、EXCEL格式的互相转换,也可以对PDF文件进行合并、拆分、翻转等各种操作。这篇文章只说PDF转Excel,其他功能可自行研究使用。
转换步骤如下:
点击PDF 转 Excel,
选择需要转换的PDF文件,点击转换,片刻之后,转换完成,
点击下载,一个Excel格式的文件就得到了。
使用smallpdf的优点:
-
小巧灵活,方便快捷
-
在线使用,用完即走
当然它也有几个缺点:
-
免费版每天只能转换两次(我不会告诉你,换个浏览器还可以接着使用的);
-
转换后,每页PDF转换为一个sheet,需要进一步合并;
-
无法转换较大的文件,比如上百页的PDF。
正是因为smallpdf有这几个限制,所以下面这种方式才是推荐的重点。
使用PowerBI获取PDF数据
PowerBI可以从多种数据格式、多种来源获取数据,PDF格式的数据文件也不例外。
下面来看看操作步骤。
假设有一个PDF文件,128页,
打开PowerBI Desktop,点击获取数据,选择PDF格式,
点击确认后,连接本地PDF文件,
可以看到有128个表格,每页PDF就是一张表格,这里随便选择一个文件,点击编辑,进入查询编辑器,
其实到此处,数据都已经导入到PowerBI中了,剩下的就是整理的过程,把128页文件合并到一张表中,和合并128个excel文件的步骤是一样的,
↑删除"源"之后的步骤
↑Kind列只筛选“Table”
↑Data列展开所有列
↑删除多于的列
↑提升标题
↑合并完成
合并后的数据可以加载,直接进行数据分析,如果就是想导入到Excel中,也十分简单,有几种方式可以把PowerBI中的数据导入到Excel中,参考这篇文章:PowerBI中的数据如何导出到Excel?
以上的步骤看起来挺多,其实只是点点鼠标的事,无需任何代码,一两分钟即可完成128页的PDF数据的转换,并合并为一个Excel文件。
这就是PowerBI的强大!
总结
数据文件较小,页数很少,可使用smallpdf在线转换;
数据文件很大,页数很多,需要合并时,使用PowerBI转换。
以上PowerBI获取PDF数据的步骤,都是PQ的基本操作,简单易学,操作一两遍就会了,另外下面这几篇文章或许会对你有所帮助。
01 | 使用Power Query是一种什么体验?
02 | 数据获取,PQ就是这么任性!
03 | 数据清洗中最常使用的十三招