你使用过Java8中的parallelStream

前言

并行编程势不可挡，Java从1.7开始就提供了Fork/Join 支持并行处理。java1.8 进一步加强。

并行处理就是将任务拆分子任务，分发给多个处理器同时处理，之后合并。

Stream API

Java 8 引入了许多特性，Stream API是其中重要的一部分。区别 InputStream OutputStream，Stream API 是处理对象流而不是字节流。

执行原理如下，流分串行和并行两种执行方式

// 串行执行流
stream().filter(e -> e > 10).count();
// 并行执行流
.parallelStream().filter(e -> e > 10).count()

ParallelStreams执行原理

并行执行时，java将流划分为多个子流，分散在不同CPU并行处理，然后进行合并。

并行一定比串行更快吗？这不一定，取决于两方面条件：

处理器核心数量，并行处理核心数越多自然处理效率会更高。
处理的数据量越大，优势越强。这也很好理解，比如十个人干一个人就能完成的活儿会比它自己干更便宜？

ParallelStreams注意事项

使用并行流时，不要使用collectors.groupingBy,collectors.toMap，替代为

collectors.groupingByConcurrent , collectors.toConcurrentMap，或直接使用串行流。

原因，并行流执行时，通过操作Key来合并多个map的操作比较昂贵。详细大家可以查看官网介绍。

https://docs.oracle.com/javas…

Map<String, List<Person>> byGender = 
  roster
      .stream()
      .collect(Collectors.groupingBy(Person::getGender));

ConcurrentMap<String, List<Person>> byGender =         
  roster
      .parallelStream()
      .collect(Collectors.groupingByConcurrent(Person::getGender));

ParallelStreams 默认使用 ForkJoinPool.commonPool()线程池。

注意：默认情况下，你写的 ParallelStreams 都是通过该线程池调度执行，整个应用程序都共享这个线程池。

看一个例子，我们查询一批新闻数据，可以利用并行化来处理远程新闻下载。


public List<News> queryNews(Stream<String> ids) {
     return ids.parallel()
            .map(this::getNews) // 网络操作，新闻下载
            .collect(toList());
}

因为是网络操作，存在很多不确定性，假如某个任务运行时间较长，导致线程池资源占据，阻塞其它线程，这样就阻止了其他的并行流任务正常进行。

如果解决这个问题的其中一种方式，进行线程池隔离。那么如何自定义并行流的线程池呢？

ForkJoinPool 构造参数我们默认设置为CPU核心数。

ForkJoinPool customThreadPool = new ForkJoinPool(4);
long actualTotal = customThreadPool
  .submit(() -> roster.parallelStream().reduce(0, Integer::sum)).get();

针对 Stream API 一些局限性，Github上有个开源库做了补充。

https://github.com/pivovarit/…

总结

Java 1.8 提供的Stream API简化了代码，很好用。不过在使用过程中应该注意以上问题。

欢迎大家留言交流，一起学习分享！！！

你使用过Java8中的parallelStream

前言

Stream API

ParallelStreams执行原理

ParallelStreams注意事项

总结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

你使用过Java8中的parallelStream

前言

Stream API

ParallelStreams执行原理

ParallelStreams注意事项

总结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复