简介

Stream 流解决，首先要廓清的是 java8 中的 Stream 与 I/O 流 InputStream 和 OutputStream 是齐全不同的概念。
Stream 机制是针对汇合迭代器的加强。流容许你用申明式的形式解决数据汇合（通过查问语句来表白，而不是长期编写一个实现）。
本文后半局部将拿 Stream 中查问语句与咱们相熟的 SQL 查问语句做一些类别，不便大家的了解和记忆。

创建对象流

创建对象流的三种形式：

由汇合对象创立流。对反对流解决的对象调用 stream()。反对流解决的对象包含 Collection 汇合及其子类

List<Integer> list = Arrays.asList(1,2,3);
Stream<Integer> stream = list.stream();

由数组创立流。通过静态方法 Arrays.stream() 将数组转化为流（Stream）

IntStream stream = Arrays.stream(new int[]{3, 2, 1});

通过静态方法 Stream.of() ，然而底层其实还是调用 Arrays.stream()

Stream<Integer> stream = Stream.of(1, 2, 3);

留神：
还有两种比拟非凡的流

空流：Stream.empty()
有限流：Stream.generate() 和 Stream.iterate()。能够配合 limit() 应用能够限度一下数量

// 承受一个 Supplier 作为参数
Stream.generate(Math::random).limit(10).forEach(System.out::println);
// 初始值是 0，新值是前一个元素值 + 2
Stream.iterate(0, n -> n + 2).limit(10).forEach(System.out::println);

流解决的个性

不存储数据
不会扭转数据源
不能够重复使用

为了体现流的个性，我筹备了一组对应的测试用例：

public class StreamFeaturesTest {

    /**
     * 流的简略例子
     */
    @Test
    public void test1() {
        List<Integer> list =  Stream.of(1, 2, 5, 9, 7, 3).filter(val-> val> 2).sorted().collect(Collectors.toList());
        for (Integer item : list) {
            System.out.println(item);
        }
    }
    /**
     * 流不会扭转数据源
     */
    @Test
    public void test2() {
        List<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);
        list.add(3);
        list.add(1);
        Assert.assertEquals(3, list.stream().distinct().count());
        Assert.assertEquals(4, list.size());
    }

    /**
     * 流不能够重复使用
     */
    @Test(expected = IllegalStateException.class)
    public void test3() {
        Stream<Integer> integerStream = Stream.of(1, 2, 3);
        Stream<Integer> newStream = integerStream.filter(val -> val > 2);
        integerStream.skip(1);
    }
}

首先，test1() 向咱们展现了流的个别用法，由下图可见，源数据流经管道，最初输入后果数据。

而后，咱们先看 test3()，源数组产生的流对象 integerStream 在调用 filter() 之后，数据立刻流向了 newStream。
正因为流“不保留数据”的个性，所以反复利用 integerStream 再次调用 skip(1) 办法，会抛出一个 IllegalStateException 的异样：

java.lang.IllegalStateException: stream has already been operated upon or closed

所以说流不存储数据，且流不能够重复使用。

最初，咱们来看 test2()，只管咱们对 list 对象生成的流 list.stream() 做了去重操作 distinct() ，然而并不影响源数据对象 list。

流解决的操作类型

Stream 的所有操作连起来组合成了管道，管道有两种操作：
第一种，两头操作（intermediate）。调用两头操作方法返回的是一个新的流对象。
第二种，终值操作（terminal）。在调用该办法后，将执行之前所有的两头操作，并返回后果。

流解决的执行程序

为了更好地演示成果，咱们首先要理解一下 Stream.peek() 办法，这个办法和 Stream.forEach() 应用办法相似，都承受 Consumer 作为参数。

流操作方法

流操作类型

peek()

两头操作

forEach()

终值操作

所以，咱们能够用 peek 来证实流的执行程序。
咱们定义一个 Apple 对象：

public class Apple {
    private int id;            // 编号
    private String color;      // 色彩
    private int weight;        // 分量
    private String birthplace; // 产地

    public Apple(int id, String color, int weight, String birthplace) {
        this.id = id;
        this.color = color;
        this.weight = weight;
        this.birthplace = birthplace;
    }

    // getter/setter 省略
}

而后创立多个苹果放到 appleStore 中

public class StreamTest {

    private static final List<Apple> appleStore = Arrays.asList(
            new Apple(1, "red", 500, "湖南"),
            new Apple(2, "red", 100, "天津"),
            new Apple(3, "green", 300, "湖南"),
            new Apple(4, "green", 200, "天津"),
            new Apple(5, "green", 100, "湖南")
    );
    public static void main(String[] args) {
        appleStore.stream().filter(apple -> apple.getWeight() > 100)
                .peek(apple -> System.out.println("通过第1层筛选 " + apple))
                .filter(apple -> "green".equals(apple.getColor()))
                .peek(apple -> System.out.println("通过第2层筛选 " + apple))
                .filter(apple -> "湖南".equals(apple.getBirthplace()))
                .peek(apple -> System.out.println("通过第3层筛选 " + apple))
                .collect(Collectors.toList());
    }
}

测试后果如下：

以上测试例子的执行程序示意图：

总之，执行程序会走一个“之”字形。

留神：
如果咱们正文掉 .collect(Collectors.toList())，咱们会发现一行语句也不会打印进去。
这刚好证实了：

通过间断执行多个操作倒便就组成了 Stream 中的执行管道（pipeline）。须要留神的是这些管道被增加后并不会真正执行，只有等到调用终值操作之后才会执行。

用流收集数据与 SQL 统计函数

Collector 被指定和四个函数一起工作，并实现累加 entries 到一个可变的后果容器，并可抉择执行该后果的最终变换。这四个函数就是：

接口函数

作用

返回值

supplier()

创立并返回一个新的可变后果容器

Supplier

accumulator()

把输出值退出到可变后果容器

BiConsumer

combiner()

将两个后果容器组合成一个

BinaryOperator

finisher()

转换两头后果为终值后果

Function

Collectors 则是重要的工具类，提供给我一些 Collector 实现。
Stream 接口中 collect() 就是应用 Collector 做参数的。
其中，collect(Supplier<R> supplier, BiConsumer<R, ? super T> accumulator, BiConsumer<R, R> combiner) 无非就是比 Collector 少一个 finisher，实质上是一样的！

遍历在传统的 javaEE 我的项目中数据源比拟繁多而且集中，像这类的需要都咱们可能通过关系数据库中进行获取计算。
当初的互联网我的项目数据源成多样化有：关系数据库、NoSQL、Redis、mongodb、ElasticSearch、Cloud Server 等。这时就需咱们从各数据源中汇聚数据并进行统计。
Stream + Lambda的组合就是为了让 Java 语句更像查问语句，取代繁冗的 for 循环。

咱们设计一下建表语句

CREATE TABLE `applestore` (
  `id` INT NOT NULL AUTO_INCREMENT COMMENT '编号',
  `color` VARCHAR (50) COMMENT '色彩',
  `weight` INT COMMENT '分量',
  `birthplace` VARCHAR (50) COMMENT '产地',
  PRIMARY KEY (`id`)
) COMMENT = '水果商店';

另外还有数据初始化语句

INSERT INTO applestore VALUES (1, "red", 500,"湖南");
INSERT INTO applestore VALUES (2, "red", 100,"湖南");
INSERT INTO applestore VALUES (3, "green", 300, "湖南");
INSERT INTO applestore VALUES (4, "green", 200, "天津");
INSERT INTO applestore VALUES (5, "green", 100, "湖南");

测试用例：

public class StreamStatisticsTest {
    List<Apple> appleStore;
    @Before
    public void initData() {
        appleStore = Arrays.asList(
                new Apple(1, "red", 500, "湖南"),
                new Apple(2, "red", 100, "天津"),
                new Apple(3, "green", 300, "湖南"),
                new Apple(4, "green", 200, "天津"),
                new Apple(5, "green", 100, "湖南")
        );
    }

    @Test
    public void test1() {
        Integer weight1 = appleStore.stream().collect(Collectors.summingInt(apple -> apple.getWeight()));
        System.out.println(weight1);
        Integer weight2 = appleStore.stream().collect(Collectors.summingInt(Apple::getWeight));
        System.out.println(weight2);
    }
}

求和

Collectors.summingInt()
Collectors.summingLong()
Collectors.summingDouble()

通过援用 import static java.util.stream.Collectors.summingInt; 就能够间接调用 summingInt()
Apple::getWeight() 能够写为 apple -> apple.getWeight()，求和函数的参数是后果转换函数 Function

求平均值

Collectors.averagingInt()
Collectors.averagingKLong()
Collectors.averagingDouble()

归约

Collectors.reducing()

@Test
public void reduce() {
    Integer sum = appleStore.stream().collect(reducing(0, Apple::getWeight, (a, b) -> a + b));
    System.out.println(sum);
}

归约就是为了遍历数据容器，将每个元素对象转换为特定的值，通过累积函数，失去一个最终值。
转换函数，函数输出参数的对象类型是跟 Stream<T> 中的 T 一样的对象类型，输入的对象类型的是和初始值一样的对象类型
累积函数，就是把转换函数的后果与上一次累积的后果进行一次合并，如果是第一次累积，那么取初始值来计算
累积函数还能够作用于两个 Stream<T> 合并时的累积，这个能够联合 groupingBy 来了解
初始值的对象类型，和每一次累积函数输入值的对象类型是雷同的，这样能力始终进行累积函数的运算。
归约不仅仅能够反对加法，还能够反对比方乘法以及其余更高级的累积公式。

计数只是归约的一种非凡模式

Collectors.counting(): 初始值为 0，转换函数 f(x)=1（x 就是 Stream<T> 的 T 类型），累积函数就是“做加法”

分组

Collectors.groupingBy()
分组就和 SQL 中的 GROUP BY 非常相似，所以 groupingBy() 的所有参数中有一个参数是 Collector接口，这样就可能和求和/求平均值/归约一起应用。
传入参数的接口是 Function 接口，实现这个接口能够是实现从 A 类型到 B 类型的转换
其中有一个办法能够传入参数 Supplier mapFactory,这个能够通过自定义 Map工厂，来创立自定义的分组 Map

分区只是分组的一种非凡模式

Collectors.partitioningBy() 传入参数的是 Predicate 接口，
分区相当于把流中的数据，分组分成了“正反两个营垒”

数值流

咱们之前在求和时用到的例子，appleStore.stream().collect(summingInt(Apple::getWeight))，我就被 IDEA 揭示：
appleStore.stream().collect(summingInt(Apple::getWeight))

The ‘collect(summingInt())’ can be replaced with ‘mapToInt().sum()’

这就通知咱们能够先转化为数值流，而后再用 IntStream 做求和。

Java8引入了三个原始类型特化流接口：IntStream，LongStream，DoubleStream，别离将流中的元素特化为 int，long，double。
一般对象流和原始类型特化流之间能够互相转化

其中 IntStream 和 LongStream 能够调用 asDoubleStream 变为 DoubleStream，然而这是单向的转化办法。
IntStream#boxed() 能够失去 Stream<Integer> ,这个也是一个单向办法，反对数值流转换回对象流，LongStream 和 DoubleStream 也有相似的办法。

生成一个数值流

IntStream.range(int startInclusive, int endExclusive)
IntStream.rangeClosed(int startInclusive, int endInclusive)
range 和 rangeClosed 的区别在于数值流是否蕴含 end 这个值。range 代表的区间是 [start, end) , rangeClosed 代表的区间是 [start, end]
LongStream 也有 range 和 rangeClosed 办法，然而 DoubleStream 没有！

flatMap

Stream.flatMap 就是流中的每个对象，转换产生一个对象流。
Stream.flatMapToInt 指定流中的每个对象，转换产生一个 IntStream 数值流；相似的，还有 flatMapToLong，flatMapToDouble
IntStream.flatMap 数值流中的每个对象，转换产生一个数值流

flatMap 能够代替一些嵌套循环来开展业务：
比方咱们要求勾股数（即 a_a+b_b=c*c 的一组数中的 a，b，c），且咱们要求 a 和 b 的范畴是 [1,100],咱们在 Java8之前会这样写：

@Test
public void testJava() {
    List<int[]> resultList = new ArrayList<>();
    for (int a = 1; a <= 100; a++) {
        for (int b = a; b <= 100; b++) {
            double c = Math.sqrt(a * a + b * b);
            if (c % 1 == 0) {
                resultList.add(new int[]{a, b, (int) c});
            }
        }
    }

    int size = resultList.size();
    for (int i = 0; i < size && i < 5; i++) {
        int[] a = resultList.get(i);
        System.out.println(a[0] + " " + a[1] + " " + a[2]);
    }
}

Java8之后，咱们能够用上 flatMap：

@Test
public void flatMap() {
    Stream<int[]> stream = IntStream.rangeClosed(1, 100)
        .boxed()
        .flatMap(a -> IntStream.rangeClosed(a, 100)
                 .filter(b -> Math.sqrt(a * a + b * b) % 1 == 0)
                 .mapToObj(b -> new int[]{a, b, (int) Math.sqrt(a * a + b * b)})
    );
    stream.limit(5).forEach(a -> System.out.println(a[0] + " " + a[1] + " " + a[2]));
}

创立一个从 1 到 100 的数值范畴来创立 a 的值。对每个给定的 a 值，创立一个三元数流。
flatMap 办法在做映射的同时，还会把所有生成的三元数流扁平化成一个流。

总结

Stream 次要包含对象流和数值流两大类
Stream.of() , Arrays.stream() , Collection#stream() , Stream.generate() , Stream.iterate() 办法创建对象流
IntStream.range() 和 IntStream.rangeClosed() 能够创立数值流，对象流和数值流能够互相转换
Collector 收集器接口，能够实现归约，统计函数（求和，求平均值，最大值，最小值），分组等性能
流的执行，须要调用终值操作。流中每个元素执行到不能继续执行上来，才会转到另一个元素执行。而不是分阶段迭代数据容器中的所有元素！
flatMap 能够给流中的每个元素生成一个对应的流，并且扁平化为一个流

关于java:Java8Stream

简介

创建对象流

创建对象流的三种形式：

流解决的个性

流解决的操作类型

流解决的执行程序

用流收集数据与 SQL 统计函数

求和

求平均值

归约

分组

数值流

生成一个数值流

flatMap

总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:Java8Stream

简介

创建对象流

创建对象流的三种形式：

流解决的个性

流解决的操作类型

流解决的执行程序

用流收集数据与 SQL 统计函数

求和

求平均值

归约

分组

数值流

生成一个数值流

flatMap

总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复