主要想给自己做一个笔记,以便下次碰到的时候忘记操作步骤

问题:两个50w数据的表格对比重复的记录

使用到微软的 Office 软件

新建一个 比对两个文件是否重复.xlsx 文件名随意但一定要以 xlsx 结尾的类型

接下来使用 Excel 打开刚新建的文件

打开第一个文件

使用Power Query 来比对两个大文件是否重复数据_Microsoft office

使用Power Query 来比对两个大文件是否重复数据_pwoer query_02

继续打开第二个文件

使用Power Query 来比对两个大文件是否重复数据_excel_03

新建组合查询,每个文件里可把不要的字段删除掉,仅保留用来做比对的字段

使用Power Query 来比对两个大文件是否重复数据_Microsoft office_04

选中需要比对的文件,由于是查出重复项,所以联接种类选择了“内部(仅限匹配行)”

使用Power Query 来比对两个大文件是否重复数据_Microsoft office_05

关闭并上载至

使用Power Query 来比对两个大文件是否重复数据_Microsoft office_06

这步需选择“仅创建连接”(如果不是xlsx结尾的文件可能这里无法选择)

使用Power Query 来比对两个大文件是否重复数据_excel_07

使用Power Query 来比对两个大文件是否重复数据_excel_08

使用Power Query 来比对两个大文件是否重复数据_pwoer query_09

至此等待比对结果即可了,如果有重复项就会列出来.