集算器助力 ireport

原创

raqsoft 2019-09-16 09:25:49 博主文章分类：集算器 ©著作权

文章标签 Jasper IReport 多数据源集成性能优化 文章分类 大数据

©著作权归作者所有：来自51CTO博客作者raqsoft的原创作品，请联系作者获取转载授权，否则将追究法律责任

在使用 Jasper 报表工具制作报表时，常常会遇到数据来自多个数据源的情况，通常的做法是使用主子报表或者使用javabean作为数据源。使用主子报表通常会增加报表设计的复杂度，而使用javabean做数据源，则需要一个javabean类来支持，并且为了在设计报表时能够看到数据，还要为ireport提供一个静态方法，该方法用于返回上面定义javabean的一个结果集。

显然，上面这两种办法都不太方便，本文将提供一种更加简便的方法，那就是通过集算器来解决ireport中的多数据源问题，并进一步提高ireport的性能。我们将以JasperReport5.6.0 开发环境为例进行介绍。

ireport 中如何使用多数据源

报表项目中，常常会出现报表源数据来自不同数据库的情况，例如同一应用系统的数据库负载太大，不得已分成多个数据库，就像是最常见的销售系统数据分成当前库和历史库，一部分数据存于数据库一部分数据存于文件等。

在多数据源的数据库类型方面，报表工具可能连接同样类型的数据库，比如都是mysql或者 oracle；也可能是不同的类型，如txt、csv或者Excel等。

我们的例子中，报表数据一部分来自mysql数据库，一部分来自文本文件。

其中，mysql数据库的employee表存储EID为1-100000的数据，内容如下：

集算器助力 ireport_IReport

而data.txt文件中存储EID为100001-101000的数据，内容如下：

集算器助力 ireport_IReport_02

我们的任务是在ireport中制作一张报表，查看employee表和emp.txt文件合并后的所有数据。这一需求通过集算器协助 ireport可以轻松实现。集算器使用我们称之为结构化处理语言（Structured Process Language，简称SPL），具体的SPL代码如下：

	A
1	=connect("mysql")
2	=A1.query@x("select * from employee")
3	=file("F:\\files\\emp.txt").import@t()
4	=[A2,A3].conj()
5	return A4

A1：创建数据源连接，连接mysql数据源。

A2：在mysql数据源中查询employee表中的数据，并返回查询结果。

集算器助力 ireport_多数据源_03

A3：读取文件emp.txt的内容。

集算器助力 ireport_多数据源_04

A4：合并A2和A3数据。

集算器助力 ireport_IReport_05

A4：将A4合并后的结果返回给报表。

为了在报表中呈现计算结果，我们需要将以上 SPL 代码存为文件 employee.dfx，然后就可以利用集算器对外提供的 JDBC 接口调用这个脚本了。

在报表工具中通过建立 JDBC 数据源引入集算器脚本的方法和调用存储过程一样，在 Jasper 的 SQL 设计器中可以用call employee()来调用。具体步骤在《JasperReport 调用 SPL 脚本》一文中有详细的描述。

然后，我们可以在ireport 中设计一个最简单的报表employee.jrxml，模板如下：

集算器助力 ireport_IReport_06

预览后可以直接看到报表结果了：

集算器助力 ireport_多数据源_07

显然，这个过程相比传统的主子报表或者javabean方法要简单不少，更重要的是，计算逻辑非常清晰，集成方式也几乎没有任何学习成本。

性能优化

在解决了基本的功能需求后，我们还可以进一步将焦点关注到性能方面。报表项目中，常常需要将多个表连接查询，在这些被连接的表中，可能会包含海量的数据。例如：将雇员表和订单表通过共有字段员工编号连接起来，以便查看某些订单的销售人员的信息。显然，订单表会随着时间的推移不断增长，最终带来严重的系统负担。

下面例子中的报表数据一部分来自mysql数据库的employee表，一部分来自mysql数据库的sales表。

其中，employee表存储EID为1-3000000的雇员数据，内容如下：

集算器助力 ireport_集成_08

而订单数据sales表则存储了76万条数据，而且持续增加。其中的数据内容样例如下：

集算器助力 ireport_性能优化_09

为了实现连接查询，我们在ireport 中设计一个最简单的报表mysql_join.jrxml，模板如下：

集算器助力 ireport_Jasper_10

首先我们看一下传统做法的表现。我们需要查询早于2015-04-01，由EID小于1000001的雇员产生的销售数据，SQL 语句如下：

select sales.OID,sales.Date,sales.EID,sales.Amount,employee.Name from sales join employee on sales.EID=employee.EID where sales.Date<'2015-04-01'and employee.EID<1000001select sales.OID,sales.Date,sales.EID,sales.Amount,employee.Name from sales join employee on sales.EID=employee.EID where sales.Date<'2015-04-01'and employee.EID<1000001

点击预览，在我们的测试环境下，101s后展现计算结果：

集算器助力 ireport_Jasper_11

接下来，我们看看用集算器jdbc的运行效果。将上边的报表另存为esproc_join.jrxml。

然后编写如下的SPL代码：

	A
1	=connect("mysql")
2	=A1.cursor("select * from sales where Date<'2015-04-01'")
3	=A1.query("select EID,Name from employee where EID<1000001").keys(EID)
4	=A2.join@i(EID,A3:EID,Name)
5	return A4.fetch()

A1：创建数据源连接，连接mysql数据源。

A2：查询sales表中Date早于2015-04-01的数据，将结果返回成游标。

A3：查询employee表中EID小于1000001的EID列和Name列的数据。

集算器助力 ireport_性能优化_12

A4：游标A2与序表A3外键式连接。

A5：将游标的结果返回给报表。

接下来和前一个例子一样，将以上 SPL 代码存为文件esproc_join.dfx，并在数据源中定义SQL：

call esproc_join()call esproc_join()

现在，我们点击预览，在同样的测试环境下，14s后就得到了完全相同的计算结果。

可见，使用集算器在简化了ireport访问多数据源的同时，还可以大大提高ireport的性能。本文中的例子只是集算器中一些简单的应用。事实上，基于集算器的灵活性，使用集算器提高性能的办法有很多，包括并行取数、可控缓存、控制SQL执行路径、减少隐藏格、引入数据计算层等等。更多更高级的使用快来乾学院看看吧！