Java8实战之Stream
前言
在前面一个小节中,我们已经学习了行为参数化以及Lambda表达式,通过Lambda表达式,可以使得代码更加简洁,尤其是当一个方法只需要使用一次的时候,然而,如果Java8中只有Lambda表达式的话,那还是不足以让人感到兴奋的,个人感觉,Java8中最有意思,也是最方便的功能,莫过于Stream了
Stream初窥
Stream可以翻译为流,实际上其操作也是,流操作是Java8中引入的新功能,提供了更加强大的数据迭代处理方式,通过流式写法,提供了简洁的语法,主要注意的是Stream需要配合Lambda表达式来使用,这更加体现了行为参数化的思想,Java8通过将既定的操作封装好,同时,将对应的具体行为留给用户,极大地提高了操作的效率。
Stream的出现,可以说是用于替代传统的容器操作的,在传统的容器操作中,当需要对容器中的某些元素进行操作的时候,我们需要迭代容器,然后筛选出合适的对象,然后再将其存放到另外的容器中,从上面的描述中,可以看到,其中的很大一部分操作:迭代容器,筛选对象,重新存放基本都是固定的,而每次都进行手动操作,显然是比较繁琐的,Stream则提供了更加便捷的操作,只需要通过对应的操作模式,然后给出对应的条件,即可实现对既定元素的操作。
为了下面的操作方便,我们先构造需要的元素
// User对象class User { private Integer id; private String name; private Integer age; // 省略set,get,toString方法}// 构造数据public static List generateUserData() {
Random random = new Random();
List users = new ArrayList<>(); for (int i = 0; i
users.add(new User(i, "user" + i, random.nextInt(100)));
} return users;
}
假设现在有一个场景,我们需要从上面的列表中选取年龄大于20岁的对象,在传统的容器操作中,一般我们会这样操作
public List getUserOlderThan20() {
List users = generateUserData();
List result = new ArrayList<>(); for (User user : users) { if (user.getAge() > 20 ) {
result.add(user);
}
} return result;
}
而在Java8中,我们可以用更加简洁的方式来实现上面的操作
public List getUserOlderThan20() {
List users = generateUserData();
List result = users.stream()
.filter(user -> user.getAge() > 20)
.collect(Collectors.toList()); return result;
}
或者上面的案例看上去并没有那么有优势,那么我们来看下下面的案例,根据年龄对用户进行分组,年龄在1-30为年轻人,31-60为中年人,60以上为老年人(例子例子,没有实际价值)
传统的操作,我们需要如下操作
public void groupUser() {
List users = generateUserData();
Map> userGroup = new HashMap<>(); for (User user : users) { if (user.getAge() > 0 && user.getAge() <= 30) {
List young = userGroup.get("young"); if (young == null) {
young = new ArrayList<>();
userGroup.put("young", young);
}
userGroup.get("young").add(user);
}else if (user.getAge() <= 60) {
List middle = userGroup.get("middle"); if (middle == null) {
middle = new ArrayList<>();
userGroup.put("middle", middle);
}
userGroup.get("middle").add(user);
}else {
List old = userGroup.get("old"); if (old == null) {
old = new ArrayList<>();
userGroup.put("old", old);
}
userGroup.get("old").add(user);
}
}
System.out.println(userGroup);
}
可以看到,上面的操作还是挺繁琐的,而且比较容易出错,而在Java8中,我们则可以采用如下操作
public void testStream() {
List users = generateUserData();
Map> result = users.stream()
.collect(Collectors.groupingBy(
user -> { if (user.getAge() > 0 && user.getAge() <= 30) { return "young";
} else if (user.getAge() <= 60) { return "middle";
} else { return "old";
}}
));
System.out.println(result);
}
可以看到,代码量以及自描述性的对比还是挺明显的,Stream配合Lambda表达式,可以使得之前比较繁琐的容器操作,变得非常简单,而且,代码本身的自解释性也更强
Stream操作
在前面我们已经见识到了Stream本身的特点--流式操作以及方便性,接下来我们来详细学习Stream的用法。
Stream的操作可以分为两种,一种是中间操作,例如前面的filter()操作,一种是结束操作,例如前面的collect()操作,每一个中间操作,都返回一个Stream,经过本次处理之后的Stream,结束操作则产生终结,其结果要么是数字,要么是字符串,要么是集合等等,总之就不再是Stream,也就是说,一个Stream可以有多个中间操作,但只能有一个结束操作
中间操作
比较常用的几种中间操作列举如下,更多的内容参考API即可filter(),过滤操作,入参为Predicate super T> predicate
limit(),限制操作,入参为long maxSize
skip(),跳过操作,入参为long n
distinct(),去重操作,没有入参,底层使用的是Set进行去重
sorted(),排序操作,可以传入自定义的比较器Comparator super T> comparator
peek(),检查操作,用于调试操作,入参Consumer super T> action
map(),将Stream中的元素映射为其他元素,入参Function super T, ? extends R> mappermapToDouble(),将Stream转为DoubleStream,避免装箱机制所带来的开销
mapToLong(),将Stream转为LongStream,避免装箱机制所带来的开销
mapToInt(),将Stream转为IntStream,避免装箱机制所带来的开销
flatMap(),将多个Stream转为一个,注意与map()的区别,入参Function super T, ? extends Stream extends R>> mapper
结束操作
比较常用的几个结束操作列举如下,更多的内容参考API即可count(),统计元素个数
forEach(),对每个元素执行操作,入参Consumer super T> action
findFirst(),获取第一个元素
findAny(),获取任意一个元素
anyMatch(),检查元素是否至少有一个匹配,入参Predicate super T> predicate
allMatch(),检查所有元素是否都匹配,入参Predicate super T> predicate
collect(),将所有内容收集起来,入参Collector super T, A, R> collector,JDK中提供了众多的Collector的实现,所以,基本上不用自己实现groupingBy(Function super T, ? extends K> classifier),仅能进行一次分组
groupingBy(Function super T, ? extends K> classifier, Collector super T, A, D> downstream),注意第二个参数可以是另一个Collector,也就是说,可以通过多次的复合,达到多次分组,或者分组后再进行其他的操作
groupingBy(Function super T, ? extends K> classifier,Supplier mapFactory, Collector super T, A, D> downstream),自己提供一个容器,而不是使用默认的容器groupingBy(),将内容进行分组,有三个不同的版本
counting(),等价于前面的Stream.count()
partitioningBy()精简版的groupingBy(),仅能支持true、false两种分组
joining(),字符串连接,需要注意,如果Stream的内容本身不是字符串流,则需要先map()操作一下,将其转为字符串流,可以指定分隔符,前缀,后缀
toList(),将结果合并为List
toSet(),将结果合并为Set
toMap(),将结果转为Map
toConcurrentMap(),将结果转为并发Map
reduce(),根据条件合并结果,可以说,上面的所有结束操作,基本上都可以通过reduce()来实现,reduce有三个不同形式的参数,当JDK所提供的合并操作不满足需求时,可以通过reduce来实现自定义的合并操作T reduce(T identity, BinaryOperator accumulator)
Optional reduce(BinaryOperator accumulator)
U reduce(U identity, BiFunction accumulator, BinaryOperator combiner)
Stream操作实例
为了更好地理解上面的内容,我们通过几个小例子来实际操作一下// 打印出年龄在30岁以上的所有用户
users.stream()
.filter(user -> user.getAge() > 30)
.forEach(System.out::println); // 如果换成 .count(),则是统计用户的个数
// 分组并且统计各个分组的人数
Map collect = users.stream()
.collect(groupingBy(user -> { if (user.getAge() <= 30) { return "young";
} else if (user.getAge() <= 60) { return "middle";
} else { return "old";
}
}, counting()));
// 分组并且去重
Map> collect = users.stream()
.collect(groupingBy(user -> { if (user.getAge() <= 30) { return "young";
} else if (user.getAge() <= 60) { return "middle";
} else { return "old";
}
}, toSet()));
关于Stream的介绍,大致就到这里了,为了更好地掌握Stream,需要在实际使用中多加练习,多加研究才是
作者:颜洛滨