最近在做一个DB2的项目,遇到分页处理的设计时开始犯难。以前一直采用MySQL作为项目数据库,其中的Limit关键字非常人性化,MySQL把分页的处理逻辑封装到了数据库的核心中,使得做查询设计时,根本不用过多的考虑分页的问题。



 



可是DB2却把这个难题推到了我们面前。其实不止DB2如此,很多大型的数据库例如MS SQL Server也不支持分页关键字。当然,DB2中提供了RowNumber函数,同Oracle有一些类似。有很多解决方案都是由此关键字得来的。



 



为了解决这个问题,互联网上提供了如下几个解决方案:



 



方案一:利用JDBC2的数据集。JDBC2数据集中提供了absolute方法,用来在查询的结果集中进行定位,数据集保存在内存中,你必须告诉JDBC你想定位的绝对位置,这个位置由你来计算。对于海量的数据集,这种方式效率并不高。



 



方案二:利用DB2自带的函数 ROWNUMBER() OVER(ORDER BY sort-key),这里的RowNumber函数是通过排序计算出来的行的顺序号。根据这个原理,可以先SELECT满足WHERE条件的所有记录,然后用ORDER BY排序,在行号的基础上,结合子查询的组合得出查询结果。例如:



rownumber() over(order by foo.bar, foo.baz)



 



方案三:这个解决方案准确的说是从MSSQL阵营中获得的。参考以下链接: 。早先有人给出了如何从数据库中取出从M到N的记录的解决方案,后来有人写成了存储过程,并不断得到改进和优化。我很欣赏这种不断钻研的精神,只有这样技术才能不断的得到进步。



 



第三种方案的实现原理其实很简单。先用一个子查询从数据库中选出(Page-1)*PageSize个记录来,然后用max/min关键字(更加排序的方式)取出子查询中的最大或最小值。外查询再取出所有满足大于/小于这个值的前PageSize个记录。就这么简洁。



 



早一些的实现使用了NOT IN/NOT EXIST等关键字,后来被MAX/MIN方案所取缔,主要是考虑到效率问题。实现者表现出了对于数据库的精湛技术的同时,也为我们提供了一个优雅的解决方案。



 



方案比较:



 



三种方案各有所长。



 



第一种方案可以算得上是一种独立的解决方案,不需要任何特殊的数据库技术支持,只要使用JDBC2.0就可以。但在处理大规模的数据查询时,需要耗费大量的数据库游标移动所带来的性能损耗。



 



第二种方案是DB2和Oracle采用的解决方案,相比前一种,性能上要好很多。但同第一种相类似,仍然要把所有满足条件的记录放到内存中,通过内部的游标查询来实现分页。在特定于数据库的方案中,这种方案是一种可取的方案。另外,在对分组查询(Group BY)进行分组时,如果采用第三种方案,每一次分页都将会进行两次分组查询,非常的低效,这个时候,采用第一、二中方案就比较理想。



 



第三种方案是我比较欣赏的风格:优雅。之所以这么说,是因为该方案封装在存储过程中,利用了存储过程编译后运行的高效性;同时方案本身采用了优雅的通用数据库技术,通用性和效率都能得到保证。



 



具体采用什么样的方案,一般应该根据自己的项目实际情况来定。如果数据量比较小,建议采用第一种方案;如果数据量中等,采用第二种;反之,第三种是在处理大容量数据分页查询下的理想方案。