使用Stream-API优化代码

44次阅读

共计 7157 个字符,预计需要花费 18 分钟才能阅读完成。

Java8 的新特性主要是 Lambda 表达式和流,当流和 Lambda 表达式结合起来一起使用时,因为流申明式处理数据集合的特点,可以让代码变得简洁易读

放大招,流如何简化代码

如果有一个需求,需要对数据库查询到的菜肴进行一个处理:

  • 筛选出卡路里小于 400 的菜肴
  • 对筛选出的菜肴进行一个排序
  • 获取排序后菜肴的名字
菜肴:Dish.java
public class Dish {
    private String name;
    private boolean vegetarian;
    private int calories;
    private Type type;

    // getter and setter
}
Java8 以前的实现方式
private List<String> beforeJava7(List<Dish> dishList) {List<Dish> lowCaloricDishes = new ArrayList<>();
        
        //1. 筛选出卡路里小于 400 的菜肴
        for (Dish dish : dishList) {if (dish.getCalories() < 400) {lowCaloricDishes.add(dish);
            }
        }
        
        //2. 对筛选出的菜肴进行排序
        Collections.sort(lowCaloricDishes, new Comparator<Dish>() {
            @Override
            public int compare(Dish o1, Dish o2) {return Integer.compare(o1.getCalories(), o2.getCalories());
            }
        });
        
        //3. 获取排序后菜肴的名字
        List<String> lowCaloricDishesName = new ArrayList<>();
        for (Dish d : lowCaloricDishes) {lowCaloricDishesName.add(d.getName());
        }
        
        return lowCaloricDishesName;
    }
Java8 之后的实现方式
 private List<String> afterJava8(List<Dish> dishList) {return dishList.stream()
                .filter(d -> d.getCalories() < 400)  // 筛选出卡路里小于 400 的菜肴
                .sorted(comparing(Dish::getCalories))  // 根据卡路里进行排序
                .map(Dish::getName)  // 提取菜肴名称
                .collect(Collectors.toList()); // 转换为 List
    }

不拖泥带水,一气呵成,原来需要写 24 代码实现的功能现在只需 5 行就可以完成了

高高兴兴写完需求这时候又有新需求了,新需求如下:

  • 对数据库查询到的菜肴根据菜肴种类进行分类,返回一个 Map<Type, List<Dish>> 的结果

这要是放在 jdk8 之前肯定会头皮发麻

Java8 以前的实现方式
private static Map<Type, List<Dish>> beforeJdk8(List<Dish> dishList) {Map<Type, List<Dish>> result = new HashMap<>();

    for (Dish dish : dishList) {
        // 不存在则初始化
        if (result.get(dish.getType())==null) {List<Dish> dishes = new ArrayList<>();
            dishes.add(dish);
            result.put(dish.getType(), dishes);
        } else {
            // 存在则追加
            result.get(dish.getType()).add(dish);
        }
    }

    return result;
}

还好 jdk8 有 Stream,再也不用担心复杂集合处理需求

Java8 以后的实现方式
private static Map<Type, List<Dish>> afterJdk8(List<Dish> dishList) {return dishList.stream().collect(groupingBy(Dish::getType));
}

又是一行代码解决了需求,忍不住大喊 Stream API 牛批
看到流的强大功能了吧,接下来将详细介绍流

什么是流

流是从支持数据处理操作的源生成的元素序列,源可以是数组、文件、集合、函数。流不是集合元素,它不是数据结构并不保存数据,它的主要目的在于计算

如何生成流

生成流的方式主要有五种

  • 通过集合生成,应用中最常用的一种
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Stream<Integer> stream = integerList.stream();

通过集合的 stream 方法生成流

  • 通过数组生成
int[] intArr = new int[]{1, 2, 3, 4, 5};
IntStream stream = Arrays.stream(intArr);

通过 Arrays.stream 方法生成流,并且该方法生成的流是数值流【即 IntStream】而不是Stream<Integer>。补充一点使用数值流可以避免计算过程中拆箱装箱,提高性能。Stream API 提供了 mapToIntmapToDoublemapToLong 三种方式将对象流【即 Stream<T>】转换成对应的数值流,同时提供了boxed 方法将数值流转换为对象流

  • 通过值生成
Stream<Integer> stream = Stream.of(1, 2, 3, 4, 5);

通过 Streamof方法生成流,通过 Streamempty方法可以生成一个空流

  • 通过文件生成
Stream<String> lines = Files.lines(Paths.get("data.txt"), Charset.defaultCharset())

通过 Files.line 方法得到一个流,并且得到的每个流是给定文件中的一行

  • 通过函数生成

提供了 iterategenerate两个静态方法从函数中生成流

  • iterator

    Stream<Integer> stream = Stream.iterate(0, n -> n + 2).limit(5);

iterate方法接受两个参数,第一个为初始化值,第二个为进行的函数操作,因为 iterator 生成的流为无限流,通过 limit 方法对流进行了截断,只生成 5 个偶数

  • generator

    Stream<Double> stream = Stream.generate(Math::random).limit(5);

generate方法接受一个参数,方法参数类型为 Supplier<T> ,由它为流提供值。generate 生成的流也是无限流,因此通过 limit 对流进行了截断

流的操作类型

流的操作类型主要分为两种

  • 中间操作
    一个流可以后面跟随零个或多个中间操作。其目的主要是打开流,做出某种程度的数据映射 / 过滤,然后返回一个新的流,交给下一个操作使用。这类操作都是惰性化的,仅仅调用到这类方法,并没有真正开始流的遍历,真正的遍历需等到终端操作时,常见的中间操作有下面即将介绍的 filtermap
  • 终端操作

一个流有且只能有一个终端操作,当这个操作执行后,流就被关闭了,无法再被操作,因此一个流只能被遍历一次,若想在遍历需要通过源数据在生成流。终端操作的执行,才会真正开始流的遍历。如下面即将介绍的 countcollect

流使用

count 计算流中元素个数
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
System.out.println(integerList.stream().count());

通过使用 count 方法计算出流中元素个数

filter 筛选
 List<Integer> integerList = Arrays.asList(1, 1, 2, 3, 4, 5);
 integerList.stream().filter(i -> i > 3).forEach(System.out::println);

通过使用 filter 方法进行条件筛选,filter的方法参数为一个条件

distinct 去除重复元素
List<Integer> integerList = Arrays.asList(1, 1, 2, 3, 4, 5);
integerList.stream().distinct().forEach(System.out::println);

通过 distinct 方法快速去除重复的元素

limit 返回指定流个数
List<Integer> integerList = Arrays.asList(1, 1, 2, 3, 4, 5);
integerList.stream().limit(3).forEach(System.out::println);

通过 limit 方法指定返回流的个数,limit的参数值必须>=0,否则将会抛出异常

skip 跳过流中的元素
 List<Integer> integerList = Arrays.asList(1, 1, 2, 3, 4, 5);
 integerList.stream().skip(2).forEach(System.out::println);

通过 skip 方法跳过流中的元素,上述例子跳过前两个元素,所以打印结果为 2,3,4,5skip 的参数值必须>=0,否则将会抛出异常

map 流映射

所谓流映射就是将接受的元素映射成另外一个元素

List<String> stringList = Arrays.asList("Java 8", "Lambdas",  "In", "Action");
stringList.stream().map(String::length).forEach(System.out::println);

通过 map 方法可以完成映射,该例子完成中 String -> Integer 的映射,之前上面的例子通过 map 方法完成了 Dish->String 的映射

flatMap 流转换

将一个流中的每个值都转换为另一个流

List<String> stringList = Arrays.asList("Hello", "World");
List<Stream<String>> str = stringList.stream()
        .map(world -> world.split(" "))
        .flatMap(Arrays::stream)
        .distinct()
        .collect(Collectors.toList());

map(world -> world.split(" "))的返回值为 Stream<String[]>,我们想获得的结果为Stream<String>,可以通过flatMap 方法完成 Stream<String[]> ->Stream<String> 的转换

元素匹配

提供了三种匹配方式

  • allMatch 匹配所有
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().allMatch(i -> i > 3)) {System.out.println("值都大于 3");
}

通过 allMatch 方法实现

  • anyMatch 匹配其中一个
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().anyMatch(i -> i > 3)) {System.out.println("存在大于 3 的值");
}

等同于

for (Integer i : integerList) {if (i > 3) {System.out.println("存在大于 3 的值");
        break;
    }
}

存在大于 3 的值则打印,java8中通过 anyMatch 方法实现这个功能

  • noneMatch 全部不匹配
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().noneMatch(i -> i > 3)) {System.out.println("值都小于 3");
}

通过 noneMatch 方法实现

查找

提供了两种查找方式

  • findFirst 查找第一个
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
System.out.println(integerList.stream().filter(i -> i > 3).findFirst());

通过 findFirst 方法查找到第一个大于三的元素并打印

  • findAny 随机查找一个
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
System.out.println(integerList.stream().filter(i -> i > 3).findAny());

通过 findAny 方法查找到其中一个大于三的元素并打印,因为内部进行优化的原因,当找到第一个满足大于三的元素时就结束,该方法结果和 findFirst 方法结果一样。提供 findAny 方法是为了更好的利用并行流,findFirst方法在并行上限制更多【本篇文章将不介绍并行流】

min/max 获取流中最小最大值
List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> min = integerList.stream().min(Integer::compareTo);
Optional<Integer> max = integerList.stream().max(Integer::compareTo);

min获取流中最小值,max获取流中最大值,方法参数为Comparator<? super T> comparator

reduce 将流中的元素组合起来

假设我们对一个集合中的值进行求和

  • jdk8 之前
int sum = 0;
for (int i : integerList) {sum += i;}
  • jdk8 之后通过 reduce 进行处理
int sum = integerList.stream().reduce(0, (a, b) -> (a + b));

一行就可以完成,还可以使用方法引用简写成:

int sum = integerList.stream().reduce(0, Integer::sum);

reduce接受两个参数,一个初始值这里是 0,一个BinaryOperator<T> accumulator
来将两个元素结合起来产生一个新值
另外 reduce 方法还有一个没有初始化值的重载方法,通过 reduce 我们还可以进行求最大值和最小值

Optional<Integer> min = integerList.stream().reduce(Integer::min);
Optional<Integer> max = integerList.stream().reduce(Integer::max);
进阶通过 groupingBy 进行分组
Map<Type, List<Dish>> result = dishList.stream().collect(groupingBy(Dish::getType));

collect 方法中传入 groupingBy 进行分组,其中 groupingBy 的方法参数为分类函数。还可以通过嵌套使用 groupingBy 进行多级分类

Map<Type, List<Dish>> result = menu.stream().collect(groupingBy(Dish::getType,
        groupingBy(dish -> {if (dish.getCalories() <= 400) return CaloricLevel.DIET;
                else if (dish.getCalories() <= 700) return CaloricLevel.NORMAL;
                else return CaloricLevel.FAT;
        })));
进阶通过 partitioningBy 进行分区

分区是特殊的分组,它分类依据是 true 和 false,所以返回的结果最多可以分为两组

Map<Boolean, List<Dish>> result = menu.stream().collect(partitioningBy(Dish :: isVegetarian))

等同于

Map<Boolean, List<Dish>> result = menu.stream().collect(groupingBy(Dish :: isVegetarian))

这个例子可能并不能看出分区和分类的区别,甚至觉得分区根本没有必要,换个明显一点的例子:

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Map<Boolean, List<Integer>> result = integerList.stream().collect(partitioningBy(i -> i < 3));

返回值的键仍然是布尔类型,但是它的分类是根据范围进行分类的,分区比较适合处理根据范围进行分类

总结

通过使用 Stream API 可以简化代码,同时提高了代码可读性,赶紧在项目里用起来。讲道理在没学 Stream API 之前,谁要是给我在应用里写很多 LambdaStream API,飞起就想给他一脚。我想,我现在可能爱上他了【嘻嘻】。同时使用的时候注意不要将声明式和命令式编程混合使用,前几天刷segment 刷到一条:

imango老哥说的很对,别用声明式编程的语法干命令式编程的勾

正文完
 0