java对比两个Timestamp java对比两个csv

转载

数据解码者 2023-12-19 09:06:36

文章标签 java接收多个文件 文章分类 Java 后端开发

csv文件存储数据时在结构上基本和一个数据库表相当，不过因为读写方便，所以使用频率很高，例如输出一些临时结果，或者持续记录类似日志形式的数据。不过，当需要对这些数据进一步处理时，如果还要先导入数据库，那么csv本身的便利性也就没有了。

事实上，通过集算器，可以直接对csv文件进行处理，而且还可以进行一些“高级”操作，就像本文要介绍的比较两个csv文件的差异。

假设在一个简单的销售系统中，前端系统只负责录入，包括新增、修改和删除订单，同时，每天会把数据文件做一次备份归档。在后期分析中，需要查看某个时间段内的新增、取消和修改的订单。下面就是不使用数据库，直接比较csv文件的操作。

例子中使用了2015年3月的两个文件，早一点的是old.csv，晚一点的是new.csv。文件中的逻辑主键是userName和date，需要分别找出新增的、删除的、修改的数据行。源文件如下：

java对比两个Timestamp java对比两个csv_java接收多个文件

直接观察数据，可以看到new.csv中的第2、3行是新增的记录，第4行是修改的记录，old.csv中第3行是删除的记录。

集算器代码如下：

java对比两个Timestamp java对比两个csv_java接收多个文件_02

A1,B1：以逗号为分隔符读入文件。

A2,B2：将数据按照关键字排序。因为后面使用merge函数要求数据有序。

A3：函数merge可进行多数据集归并，使用选项@d表示归并时找出差集。类似地还有并集选项@u，交集选项@i。新增记录实际上就是较新的数据和较旧数据按关键字的差集，计算结果如下：

java对比两个Timestamp java对比两个csv_java接收多个文件_03

A4：同样的，较旧数据和较新数据按关键字的差集就是删除的记录，计算结果如下：

java对比两个Timestamp java对比两个csv_java接收多个文件_04

A5：将关键字作为普通字段计算差集，找到修改过的所有记录。计算结果如下：

java对比两个Timestamp java对比两个csv_java接收多个文件_05

A6：要计算更新的记录，把A5作为中间计算结果，计算A5和“新增”记录之间的差集。计算结果如下：

java对比两个Timestamp java对比两个csv_java接收多个文件_06

B6：将A6返回给JAVA或报表工具。

//建立esProc jdbc连接
 Class.forName("com.esproc.jdbc.InternalDriver");
 con= DriverManager.getConnection("jdbc:esproc:local://");
 //调用esProc，其中test是脚本文件名，可接收参数
 st =(com.esproc.jdbc.InternalCStatement)con.prepareCall("call test()"); com.esproc.jdbc.InternalCStatement st = (com.esproc.jdbc.InternalCStatement)con.prepareCall("call test()");
 st.execute();//执行esProc存储过程
 ResultSet set = st.getResultSet();//获得计算结果

而如果要将多个数据集返回给JAVA，可以将B6的代码改为：return new,delete,update。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。