关于java:求求你们了别再乱用-parallelStream-了速度竟然比-Stream-还要慢

44次阅读

共计 4069 个字符,预计需要花费 11 分钟才能阅读完成。

parallelStream 肯定更快吗?

大家都晓得 Stream 分为程序流和并行流:

  • stream(程序流)
  • parallelStream(并行流)

它们最大的区别就是 parallelStream 反对并行化解决,所以效率较 stream(程序流)必定是要更快的。这篇不会介绍 Stream 根底,Stream 系列我之前写过一个专题了,不懂的关注公众号 Java 技术栈,而后在公众号 Java 教程菜单中浏览。

然而你确定 parallelStream 肯定要更快吗?

栈长写了一段排序的示例,别离用 stream 和 parallelStream,对 100 ~ 10000000 条数据的汇合进行排序,来看下执行效率到底如何!

程序流排序:

/**
 * 程序流排序
 * @author: 栈长
 * @from: 公众号 Java 技术栈
 */
private static void streamSort() {long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.stream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

    System.out.println("\nList size:" + list.size() + "Stream.sorted:" + (System.currentTimeMillis() - start));
}

并行流排序:

/**
 * 并行流排序
 * @author: 栈长
 * @from: 公众号 Java 技术栈
 */
private static void parallelStreamSort() {long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.parallelStream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

    System.out.println("List size:" + list.size() + "ParallelStream.sorted:" + (System.currentTimeMillis() - start));
}

本文所有残缺示例源代码曾经上传:

https://github.com/javastacks…

执行后果如下:

List size: 10000000 Stream.sorted: 202
List size: 10000000 ParallelStream.sorted: 402

List size: 1000000 Stream.sorted: 53
List size: 1000000 ParallelStream.sorted: 15

List size: 100000 Stream.sorted: 1
List size: 100000 ParallelStream.sorted: 2

List size: 10000 Stream.sorted: 0
List size: 10000 ParallelStream.sorted: 1

List size: 1000 Stream.sorted: 0
List size: 1000 ParallelStream.sorted: 1

List size: 100 Stream.sorted: 0
List size: 100 ParallelStream.sorted: 0

在 100000 以下是没什么区别的;

在 1000000 左右 ParallelStream 尽管当先 Stream,但也不是相对每次都当先,通过一直测试,这个数据量区间的测试两者会相互当先;

在 10000000 左右就很稳固了,ParallelStream 简直比 Stream 慢了 2 倍!

当初你可能会有疑难了,为什么会这样?

栈长起初也有疑难,并行流(ParallelStream)怎么会比程序流(Stream)还要慢。。

其实我前面想想也就明确了,并行流(ParallelStream)的背地其实是 Java7 开始反对的 Fork/Join,即把一个大工作拆分成 N 个小工作,而后最终合并各个子工作的后果,所以对于子工作线程的拆分、创立、后果合并等操作都须要不少的开销,特地是线程的创立。

所以这种不耗时的简略排序操作事实上是不适用于并行流(ParallelStream)的,它所带来的线程创立的损耗可能还会比程序流(Stream)还要更慢。

最新 Java 8+ 面试题也都整顿好了,点击 Java 面试库小程序在线刷题。

什么时候用 ParallelStream?

既然应用 Fork/Join 是会有损耗的,那对于单条数据的解决的工夫最好是实践上要超过用并行流(ParallelStream)自身的损耗,这种状况下就比拟适合。

也就是说,如果对于流中的每条数据的解决比拟费时间,并且没有程序要求,这种场景下用并行流(ParallelStream)会更快,更适合。

来看上面这个示例:

程序流数据处理:

/**
 * 程序流数据处理
 * @author: 栈长
 * @from: 公众号 Java 技术栈
 */
private static void streamProcess() {long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.stream().map(StreamSpeedTest::process).collect(Collectors.toList());

    System.out.println("\nList size:" + list.size() + "Stream process:" + (System.currentTimeMillis() - start));
}

并行流数据处理:

/**
 * 并行流数据处理
 * @author: 栈长
 * @from: 公众号 Java 技术栈
 */
private static void parallelStreamProcess() {long start = System.currentTimeMillis();
    List<SortTest.User> list = new ArrayList<>(LIST);

    list.parallelStream().map(StreamSpeedTest::process).collect(Collectors.toList());

    System.out.println("List size:" + list.size() + "ParallelStream process:" + (System.currentTimeMillis() - start));
}

数据处理:

/**
 * 数据处理
 * @author: 栈长
 * @from: 公众号 Java 技术栈
 */
private static SortTest.User process(SortTest.User user) {
    try {user.setName(user.getName() + ": process");
        Thread.sleep(5);
    } catch (InterruptedException e) {e.printStackTrace();
    }
    return user;
}

留神: 这里加了个休眠 5 毫秒,为了体现实在的解决数据耗时。

本文所有残缺示例源代码曾经上传:

https://github.com/javastacks…

并行流排序:

List size: 1000 Stream process: 5750
List size: 1000 ParallelStream process: 745

List size: 100 Stream process: 566
List size: 100 ParallelStream process: 77

后果很显著了,不论测试多少次,并行流(ParallelStream)的处理速度都要比程序流(Stream)要快几倍!!我这里只测试了 100 和 1000 条数据,因为 10000 条以上的数据用程序流(Stream)可能要等十分久。

而且我程序中的解决逻辑只休眠了 5 毫秒,如果理论解决单条数据的耗时要比这个更长,那并行流(ParallelStream)的解决效率还会更显著。

总结

略微总结下:

  • stream: 实用于防止线程平安问题、要求程序执行、数据处理简略不耗时的工作;
  • parallelStream: 实用于不存在线程平安问题、不须要程序性执行、数据处理比拟耗时的工作;

所以,你学废了吗?连忙发给身边的共事看看吧,别再乱用 parallelStream 了!用的不好,存在线程平安问题不说,效率上可能还会事与愿违。

大家如果对 Java 8 新增的知识点(Lambda、Stream、函数式接口等)还不会用的能够关注公众号:Java 技术栈,在 Java 教程菜单中浏览,Java 8+ 系列教程我都写了一堆了。

本文所有残缺示例源代码曾经上传:

https://github.com/javastacks…

欢送 Star 学习,前面 Java 示例都会在这下面提供!

好了,明天的分享就到这里了,前面栈长会分享更多好玩的 Java 技术和最新的技术资讯,关注公众号 Java 技术栈第一工夫推送,我也将支流 Java 面试题和参考答案都整顿好了,在公众号后盾回复关键字 “ 面试 ” 进行刷题。

最初,感觉我的文章对你用播种的话,动动小手,给个在看、转发,原创不易,栈长须要你的激励。

版权申明: 本文系公众号 “Java 技术栈 ” 原创,转载、援用本文内容请注明出处,剽窃、洗稿一律投诉侵权,后果自负,并保留追究其法律责任的权力。

近期热文举荐:

1.1,000+ 道 Java 面试题及答案整顿 (2022 最新版)

2. 劲爆!Java 协程要来了。。。

3.Spring Boot 2.x 教程,太全了!

4. 别再写满屏的爆爆爆炸类了,试试装璜器模式,这才是优雅的形式!!

5.《Java 开发手册(嵩山版)》最新公布,速速下载!

感觉不错,别忘了顺手点赞 + 转发哦!

正文完
 0