Oracle在2014年3月19日,如期发布了Java 8。Java 8版本被认为是具有里程碑意义的一个版本,Oracle在该版本的中添加了许多新特性,包括Lambda表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易的使用Lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

 

聚合操作与Java 8中的Lambda表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。


集合类的层次结构

集合类是Java语言提供的辅助类,是一种较为通用的数据结构,如Map、Set、List等。Java中集合类层次关系如下:


JAVA_OPTIONS在哪个文件中 java operations_Aggregate Operations

图1

如上图,Collection是主要集合类的接口,其子接口(具化接口)有Deque、Queue、Set、List等。

Map是另一种类型的集合,以Key、Value的键值对存储数据集。



在Java 8中,在java.util.Collection接口中添加了如下方法:

default Stream<E> stream() {
   return StreamSupport.stream(spliterator(), false);
}



Stream()方法的可见性修饰符为default,这又是Java 8的新特性。在接口中(Collection为interface),本不需要(也不能)写方法实现,但引入default修饰后,就不同了。开发者不但可以写方法的实现,而且还不用考虑向后兼容的问题。关于Default Method的详细解释,读者可以参考Java 8的官方文档。

 

正是stream方法引出了集合类的聚合操作。

[注意]

Map接口中并没有stream()方法,但是Map的values()和keySet()均返回集合对象,在集合对象上当然是可以使用stream()方法的。

 

聚合操作实例

 

为说明聚合操作的使用,首先定义一个数据元素类Person,如下:


import java.time.LocalDate;

public class Person {
		String name;
		LocalDate birthday;
		Sex gender;
		String emailAddress;

		public int getAge() {
			return LocalDate.now().getYear() - birthday.getYear();
		}
		
		public void setBirthday(LocalDate birthday){
			this.birthday = birthday;
		}

		public void setGender(Sex sex){
			this.gender = sex;
		}
		
		public void printPerson() {
			System.out.println("The name is " + name);
		}
		
		public Sex getGender(){
			return gender;
		}

		public enum Sex {
			MALE, FEMALE
		}
	}



在Java 8以前的版本中,对Person集合的遍历往往采用以下方式:


Set<Person> persons = new HashSet<Person>();
//传统遍历方式
for (Person person : persons) {
	if (person.getAge() > 18) {
	    System.out.println(person.name + " is elder than 18.");
	}
}



同样的功能,在Java 8中使用聚合操作,可以实现如下:


//使用聚合操作
	persons.stream().filter(new Predicate<Person>() {
	   @Override
		public boolean test(Person person) {
			if (person.getAge() > 18) {
				return true;
			} else {
				return false;
			}
		}
	}).forEach(new Consumer<Person>() {
		@Override
		public void accept(Person person) {
			System.out.println(person.name + " is elder than 18.");
		}
	});

首先,在集合对象persons上调用stream()方法(聚合操作),取得person对象的数据集(elements),然后调用聚合操作filter()对集合中的元素进行过滤,再调用forEach()完成对符合条件的person的打印。

 

Predicate和Consumer为Java 8中定义的函数接口(FunctionalInterface),在java.util.function包下面,函数接口也是Java 8的新特性。在上述代码中,使用了两个内隐类分别对Predicate和Consumer进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

 

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用Lambda表达式实现,如下:

// 使用聚合操作及Lambda
	persons.stream()
		.filter(p -> p.getAge() >= 18)
		.forEach(p -> System.out.println(p.name + " is elder than 18."));



因为filter()、forEach()的参数均为函数接口,所以可以替换为Lambda表达式的方式。简单来理解,Lambda表达式就是允许开发者将代码逻辑作为参数进行传递,关于Lambda表达式的详细内容,请参Java的官方文档。

 

聚合操作的使用

 

聚合操作是Java8针对集合类,使编程更为便利的方式,可以与Lambda表达式一起使用,达到更加简洁的目的。

 

前面例子中,对聚合操作的使用可以归结为3个部分:

1.        数据源部分:通过stream()方法,取得集合对象的数据集。

2.        通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用filter()方法来对数据集进行过滤。

3.        通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用forEach()完成对过滤后元素的打印。

 

中间方法除了filter()外,还有distinct()、sorted()、map()等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

 

最终方法往往是完成对数据集中数据的处理,如forEach(),还有allMatch()、anyMatch()

、findAny()、findFirst(),数值计算类的方法有sum、max、min、average等等。最终方法也可以是对集合的处理,如reduce()、collect()等等。reduce()方法的处理方式一般是每次都产生新的数据集,而collect()方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

 

 

从上面的例子中可以看出,通过stream()方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但它们也不完全相同:

 

1.        迭代器提供next()、hasNext()等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;

2.        stream()方法返回的数据集没有next()等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如parallelStream()方法。并行的方式在一些情况下,可以大幅提升处理的效率。

 

除上述介绍的聚合操作外,Java 8中还提供了其它更为丰富的聚合操作,读者可以参考Java 8的开发参考,了解更多内容。

 

总结

 

Java 8提供的聚合操作,以及一起使用的Lambda表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。

 

毕竟,任何事物都有两面性,技术在不断的发展,Java也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。