Excel文件合并工具使用说明

此工具主要用于多个Excel(xls或xlsx)文件的合并,若有N个Excel文件需要合并,但有些列是我们不需要的,且每个表展现的数据是不规律,如下图所示:

多个文件合并后上传hdfs 多文件合并工具_下载地址

每个表的结构如下图所示:

多个文件合并后上传hdfs 多文件合并工具_文件合并_02

多个文件合并后上传hdfs 多文件合并工具_文件合并_03

假如我们要实现如下图所示的效果:

多个文件合并后上传hdfs 多文件合并工具_数据_04

实现的方式可以有多种,如手动一个文件一个文件的打开、复制、粘贴;还可以用Power Query来完成(收费)等等,下面主要介绍这个工具如何来实现。

第一步:启动软件。双击软件图标启动软件,启动后软件界面如下所示:

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_05

软件中有“文件合并”、“非空数据提取”、“日志查看”三个菜单,“文件合并”主要用来合并Excel工作薄中的表数据,“非空数据提取”主要用来去除表数据中的空数据,“日志查看”主要是用于软件使用过程中产生的日志查看。

第二步:根据“文件合并”界面由上而下设置好相关参数。

多个文件合并后上传hdfs 多文件合并工具_Java_06

单击上图中“选择文件目录”按钮选择Excel文件所在的目录

多个文件合并后上传hdfs 多文件合并工具_文件合并_07

选择好后如图所示

多个文件合并后上传hdfs 多文件合并工具_下载地址_08

后设置标题行位置,如下图所示

多个文件合并后上传hdfs 多文件合并工具_文件合并_09

多个文件合并后上传hdfs 多文件合并工具_数据_10

这里的“2”是表格的标题在第二行

接着输入需要合并的字段名称

多个文件合并后上传hdfs 多文件合并工具_下载地址_11

然后单击“选择存放路径”设置合并后的文件存在哪里

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_12

 

多个文件合并后上传hdfs 多文件合并工具_数据_13

设置好后如图所示

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_14

第三步:单击“运行”按钮进行合并

多个文件合并后上传hdfs 多文件合并工具_Java_15

 

多个文件合并后上传hdfs 多文件合并工具_文件合并_16

根据合并数据量耗时不同,根据测试合并5万条数据耗时大约为20秒,合并完成后提示如下所示

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_17

第四步:打开之前设置的存放路径,查看结果(合并文件名为merge.xlsx)

多个文件合并后上传hdfs 多文件合并工具_数据_18

图中“merge_nonBlank.xlsx”为以“身份证”为关键字提取出来的非空数据,合并后“merge.xlsx”文件如下所示

多个文件合并后上传hdfs 多文件合并工具_数据_19

以“身份证”为关键字提取的非空数据“merge_nonBlank.xlsx”文件如下图所示:

多个文件合并后上传hdfs 多文件合并工具_下载地址_20

至此,数据合并工作全部完成!“非空数据提取”使用方法与此类似,只需从上至下设置好参数即可。

数据合并完成后,请核对数据总量是否一致!

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_21

我这里有58个工作薄,每个工作薄中有3张表,每张表有38条数据,所总数为:58*3*38=6612条数据,与合并后数据量一致。

若字段没有时会有如下提示

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_22

若字段重复时会有如下提示

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_23

多个文件合并后上传hdfs 多文件合并工具_多个文件合并后上传hdfs_24

百度网盘下载
Excel文件合并工具64位下载地址: https://pan.baidu.com/s/1MNNsS75xIpP-vAD7xFvPEA 提取码: 65wk 
Excel文件合并工具32位下载地址: https://pan.baidu.com/s/1fLgKV1GTwIYlqMb1pADQhg 提取码: jjtq