Java8-Stream性能如何及评测工具推荐

36次阅读

共计 3038 个字符,预计需要花费 8 分钟才能阅读完成。

作为技术人员,学习新知识是基本功课。有些知识是不得不学,有些知识是学了之后如虎添翼,Java8 的 Stream 就是兼具两者的知识。不学看不懂,学了写起代码来如虎添翼。

在上篇《Java8 Stream 新特性详解及实战》中我们介绍了 Java8 Stream 的基本使用方法,尝试一下是不是感觉很爽?当只用一行代码就搞定最终结果时,是不是再也不想用 for 循环一遍遍去迭代了。

同时,你是否又看到类似《Java8 Lambda 表达式和流操作如何让你的代码变慢 5 倍》这样的文章,那么今天就带大家通过编写测试程序来一探究竟,看看 Stream 的性能到底如何。同时,带大家认识一个非常不错的性能测试工具 junitperf。

测试环境

先同步一下测试环境及工具信息:

  • JDK 版本:1.8.0_151。
  • 电脑配置:MacBook Pro i7,16G 内存。
  • Java 测试工具:junitperf 及 Junit。
  • IDE:intellij IDEA。

在测试的过程中电脑中还开了其他很多应用,但基本上都没进行操作。

实验一:基本类型迭代

基本测试方案,先初始化一个 int 数组,5 亿个随机数。然后从这个数组中找到最小的一个数。

采用三个单元测试方法来对照参考:

  • testIntFor:测试 for 循环执行时间;
  • testIntStream:测试串行 Stream 执行时间;
  • testIntParallelStream:测试并行 Stream 执行时间;

测试程序相关代码:

public class StreamTest {public static int[] arr;

    @BeforeAll
    public static void init() {arr = new int[500000000];
        randomInt(arr);
    }

    @JunitPerfConfig(duration = 10000, warmUp = 1000, reporter = {HtmlReporter.class})
    public void testIntFor() {minIntFor(arr);
    }

    @JunitPerfConfig(duration = 10000, warmUp = 1000, reporter = {HtmlReporter.class})
    public void testIntParallelStream() {minIntParallelStream(arr);
    }

    @JunitPerfConfig(duration = 10000, warmUp = 1000, reporter = {HtmlReporter.class})
    public void testIntStream() {minIntStream(arr);
    }

    private int minIntStream(int[] arr) {return Arrays.stream(arr).min().getAsInt();
    }

    private int minIntParallelStream(int[] arr) {return Arrays.stream(arr).parallel().min().getAsInt();}

    private int minIntFor(int[] arr) {
        int min = Integer.MAX_VALUE;
        for (int anArr : arr) {if (anArr < min) {min = anArr;}
        }
        return min;
    }

    private static void randomInt(int[] arr) {Random r = new Random();
        for (int i = 0; i < arr.length; i++) {arr[i] = r.nextInt();}
    }
}

基本操作流程:通过 @BeforeAll 注解的 init 方法对数组进行随机初始化,然后再统一执行上面三个测试方法。

在单元测试的方法上都有下面的注解:

@JunitPerfConfig(duration = 10000, warmUp = 1000, reporter = {HtmlReporter.class})

该注释为 junitperf 提供的注解,其中 duration 为持续执行这段代码的时间,单位毫秒;warmUp 预热时间,这里预热 1 秒;reporter 输出报表格式,这里采用 HTML 展示,可以更直观看到效果。

好上面的一切都准备好了,剩下的就是统一执行单元测试。执行结果如下三个图。

针对基础类型(int)操作,结果分析:

  • 串行 Stream 的执行的确不如 for 循环性能高,耗时大概是 for 循环的 2 倍。
  • 并行 Stream 的执行性能要优于 for 循环,耗时大概是 for 循环的一半。
  • 这里没有用不同核数的机器测试,但并行 Stream 随着服务器核数的增加,必然更快。

实验二:对象迭代

生成一个 List 列表,列表中随机生成 10000000 个字符串,然后分别通过不同的方式计算获得最小的字符串。

基本操作与实验一相同,不再贴出代码,直接看测试的效果图。

针对对象(String)操作,结果分析:

  • Stream 的性能与 for 循环已经相差不大了,耗时大概是 for 循环的 1.25 倍左右。
  • 并行 Stream 执行的性能要优于 for 循环,而且比基础类型的优势更高,耗时已经低于 for 循环的一半。
  • 针对不同服务器核数,Stream 效率同样会更加高。

实验三:复杂对象归约

生成一个 List 列表,列表里面存放着 1 百万个 User 对象。每个对象中都包含用户名和用户某次运动的距离,同一用户可在 List 里包含多条运动记录。现在通过不同的方式来统计用户的总共运动了多远距离。

基本测试思路一致,这里只贴出基于 Stream 的算法的代码,以便大家了解 Stream 的复杂对象归约如何使用。

// 串行写法
users.stream().collect(
                Collectors.groupingBy(User::getUserName,
                        Collectors.summingDouble(User::getMeters)));
// 并行写法                        
users.parallelStream().collect(
                Collectors.groupingBy(User::getUserName,
                        Collectors.summingDouble(User::getMeters)));

下面看测试结果的数据:

复杂对象归约操作,结果分析:

  • 基于 Stream 的操作明显都高于 for 循环的效率,而且并行的效果更加明显。
  • 同样,随着服务器核数的增加,并行 Stream 的效率会更高。

最后推荐一下这款用起来还不错的 Java 性能测试工具,GitHub 地址:https://github.com/houbb/juni…。上面有详细的使用说明。唯一缺少的就是数据预初始化的示例,而本篇文章的示例中已经补上了这部分缺失。

小结

通过上面的几组实验对比,我们可以看到如下结论:

  • 针对简单的操作,比如基础类型的遍历,使用 for 循环性能要明显高于串行 Stream 操作。但 Stream 的并行操作随着服务器的核数增加,会优于 for 循环。
  • 针对复杂操作,串行 Stream 性能与 for 循环不差上下,但并行 Stream 的性能已经是无法匹敌了。
  • 特别是针对一个集合进行多层过滤并归约操作,无论从写法上或性能上都要明显优于 for 循环。

用一句话来说就是:简单操作 for 循环即可,复杂操作首推 Stream。

现在的 Stream 书写简单,性能不错,如果未来 JDK 针对其进行优化,便同时享受了便捷和性能,何乐而不为呢。

原文链接《Java8 Stream 性能如何及评测工具推荐》

本文由博客一文多发平台 OpenWrite 发布!

正文完
 0