大家好啊,还记得之前我写过怎么通过Excel爬取网页的表格数据吗?
这是上次的分享:利用Excel爬取数据
其实,利用Power Query工具插件也可以爬取相同的数据,并且Power Query还有更多强大的功能。
Power Query:数据获取的神器,是Excel的插件工具,也是Power BI的一个组件。
如果你是用office 2010和 office 2013版本的Excel,需要去官网下载 Power Query 插件进行安装,或者文章下面获取资源包直接安装。
如果你是office 2016,不需要另外安装 Power Query 插件,因为它已经安装在office中, 无需下载安装。
在Excel的数据下的【获取和转换】里面:
使用Power Query工具,可以让我们省略很多的麻烦,提高工作效率。并且操作简单,即使是小白,无需掌握复杂的函数即可处理大部分数据处理工作
比如,我们把多个工作簿上的数据合并到一个表格内,一般人可能会选择一个个地复制粘贴。
那么我们可以用这个工具,合并多个工作簿的数据内容。
我们选择【新建一个查询】,然后选择【文件里】,再选择【从工作簿】
然后把两个Excel工作簿里面的数据合并到一个表格
而且还支持文本,文件夹数据导入,
比如我想把下面这个文件夹的电子书名全部导入Excel表格内
我们选择新建一个查询,然后选择【从文件】,再选择【从文件夹】
然后选择放在桌面的电子书【文件夹】
然后就把所有文件夹内的电子书名称全部爬取到Excel表格内了
我们可以从文本内提取数据,从数据库导入
支持的数据库类型有:SQL数据库,MS Access数据库,Oracle数据库,MySQL数据库等,PostgreSQL等。
还有更多的数据导入来源我就不说了,这里再说一个:【自网站】
上次也说过这个,不过上次那个不是利用这个Power Query的
同样我们从网站内导入数据,选择【自网站】,然后输入数据爬取的网页链接
我这个链接爬取的是广州实时pm2.5的数据,打开数据的网页,复制这个网页的链接,粘贴到上面的输入框
,
点击确定后,选择从网页的t【Table】,右边可以预览看到数据
然后就可以导入数据到Excel表格内了
每次数据源更新后刷新即可,无需重复操作,你也可以设置好自动更新数据