一、场景

在编写代码时,想用jdk8的stream替换以前的for循环,代码如下:

//for方法
Set<String> keys = Sets.newHashSetWithExpectedSize(list.size());

for (T data : list) {
keys.add(getWrapRedisKey(data));
}

//stream方法
Set<String> keys = list.stream().map(this::getWrapRedisKey).collect(Collectors.toSet());

二、 问题

​stream​​​可以非常优雅的一行代码就解决,而​​for​​则需要三行代码,生产力大大提高。

但是​​for​​​循环可以实现初始化容量,这在频繁​​add​​​触发​​rehash​​​、​​链表转红黑树​​​时,能大大提高性能,那么​​stream​​​的​​api​​​的​​Collectors.toSet​​方法有没有设置初始化容量。

查看源码:

JDK8 Stream性能问题_JDK

三、测试

​Talking is cheap,show me the code​

简单写了一个测试代码

public static void main(String[] args) {
int expectSize = 100000;
List<String> source = generateData(expectSize);

long start = System.currentTimeMillis();

testFor(source);
//testStream(source);

System.out.println(System.currentTimeMillis() - start);
}

private static void testFor(List<String> source) {

Set<String> sets = Sets.newHashSetWithExpectedSize(source.size());

for (String s : source) {
sets.add(s);
}
}

private static void testStream(List<String> source) {
source.stream().collect(Collectors.toSet());
}

private static List<String> generateData(int size) {

List list = Lists.newArrayListWithCapacity(size);
for(int i = 1; i <= size; i++) {
list.add(UUIDUtils.generateId());
}
return list;
}

结果是10w数据是,for比stream快2-3倍...

四、 结果

在数据量比较大,同时要求相应时间场景下,应该还是使用for或者在使用stream前预设集合容量。