小勤:大海,我这个从ERP导出来的数据用Power Query汇总,怎么是一堆乱码啊?


批量汇总ERP系统数据有乱码!咋整?_自定义


大海:你这ERP怎么是html文件?

小勤:是网页形式的一个表。你看,用网页打开是这样子的,没有问题哦,但是用PQ的Web.Page函数一解析就乱码了!


批量汇总ERP系统数据有乱码!咋整?_数据_02


大海:嗯。你在网页里通过右键菜单看一下编码?

小勤:啊,是这样的:


批量汇总ERP系统数据有乱码!咋整?_编码转换_03


大海:看到了吗?这是中文的GBK编码,所以Power Query里直接读取的时候会出现乱码。

小勤:那怎么办?

大海:将编码转换一下就好了。

小勤:但是,Web.Page函数好像不支持编码转换啊。

大海:没有关系,我们可以用其他函数进行编码转换。比如你现在已经通过按文件夹的方式导入了数据:


批量汇总ERP系统数据有乱码!咋整?_数据_04


添加自定义列:


批量汇总ERP系统数据有乱码!咋整?_编码转换_05


小勤:先用Text.FromBinary函数将原文件的二进制内容进行转码成文本?

大海:对的,通过在转成文本的过程中进行编码的转换,然后再用Web.Page函数就可以正确读取了。你看:


批量汇总ERP系统数据有乱码!咋整?_编码转换_06


小勤:原来这样。