关于java:如何高效的遍历Map你常用的不一定是最快的

27次阅读

共计 4458 个字符,预计需要花费 12 分钟才能阅读完成。

微信公众号:大黄奔跑
关注我,可理解更多乏味的面试相干问题。

写在之前

如文章题目所言,遍历 Map 是开发过程中比拟常见的行为,实现的形式也有多种形式,本文率领大家一起看看更加高效的遍历 Map

『茴』的十种写法

首先一起来看看,有哪些遍历 Map 的形式

1. 利用 iterator 和 Map.Entry

long i = 0;
Iterator<Map.Entry<Integer, Integer>> 
  it = map.entrySet().iterator();
while (it.hasNext()) {Map.Entry<Integer, Integer> pair = it.next();
    i += pair.getKey() + pair.getValue();
}

2. 利用 foreach 和 Map.Entry

long i = 0;
for (Map.Entry<Integer, Integer> pair 
     : map.entrySet()) {i += pair.getKey() + pair.getValue();}

3. 利用 Java 8 中的 foreach

这种应该算是比拟常见的应用形式,也是比拟容易了解的

final long[] i = {0};
map.forEach((k, v) -> i[0] += k + v);

4. 利用keySetforeach

keySet:获取 map 中所有的 key,而后顺次遍历每个 key

long i = 0;
for (Integer key : map.keySet()) {i += key + map.get(key);
}

5. 利用keySet and iterator

long i = 0;
Iterator<Integer> itr2 = map.keySet().iterator();
while (itr2.hasNext()) {Integer key = itr2.next();
    i += key + map.get(key);
}

6. 利用 for 循环和Map.Entry

long i = 0;
for (Iterator<Map.Entry<Integer, Integer>> 
     entries = map.entrySet().iterator(); entries.hasNext();) {Map.Entry<Integer, Integer> entry = entries.next();
    i += entry.getKey() + entry.getValue();
}

7. 利用 Java8 的Stream API

这种是我平时开发中用的最多的形式,简略通俗易懂。

然而其性能如何呢?后续待揭秘。

final long[] i = {0};
map.entrySet().stream()
  .forEach(e -> i[0] += e.getKey() 
           + e.getValue());

8. 利用 Java8 中的 Stream API parallel

不晓得有多少人用过 Java8 中的 parallel 模式,实质是一种并行处理形式。

性能如何?稍后揭晓。

final long[] i = {0};
map.entrySet().stream().parallel()
  .forEach(e -> i[0] += e.getKey() + e.getValue());

9. 利用 Apache 包的 IterableMap of

不行就找找外援试试?

long i = 0;
MapIterator<Integer, Integer> it 
  = iterableMap.mapIterator();
while (it.hasNext()) {i += it.next() + it.getValue();}

10. 利用 Eclipse (CS) collections 中的MutableMap

final long[] i = {0};
mutableMap.forEachKeyValue((key, value) 
           -> {i[0] += key + value;
});

性能测试

测试环境如下:Intel i7-4790 3.60 GHz, 16 GB

场景 1:小数据集

测试集为小的 Map 汇合(大概 100 个元素),各个办法耗时如下:

Benchmark                          Mode  Cnt  Score    Error  Units
test3_UsingForEachAndJava8         avgt  10   0.308 ±  0.021  µs/op
test10_UsingEclipseMap             avgt  10   0.309 ±  0.009  µs/op
test1_UsingWhileAndMapEntry        avgt  10   0.380 ±  0.014  µs/op
test6_UsingForAndIterator          avgt  10   0.387 ±  0.016  µs/op
test2_UsingForEachAndMapEntry      avgt  10   0.391 ±  0.023  µs/op
test7_UsingJava8StreamApi          avgt  10   0.510 ±  0.014  µs/op
test9_UsingApacheIterableMap       avgt  10   0.524 ±  0.008  µs/op
test4_UsingKeySetAndForEach        avgt  10   0.816 ±  0.026  µs/op
test5_UsingKeySetAndIterator       avgt  10   0.863 ±  0.025  µs/op
test8_UsingJava8StreamApiParallel  avgt  10   5.552 ±  0.185  µs/op

从后果看出,在数据量比拟小时,利用 Java 8 中的 foreach 临时当先。

场景 2:中等数据集

测试集为元素数据量 1000Map 汇合,测试后果如下:

Benchmark                           Mode   Cnt  Score      Error   Units
test10_UsingEclipseMap              avgt   10    37.606 ±   0.790  µs/op
test3_UsingForEachAndJava8          avgt   10    50.368 ±   0.887  µs/op
test6_UsingForAndIterator           avgt   10    50.332 ±   0.507  µs/op
test2_UsingForEachAndMapEntry       avgt   10    51.406 ±   1.032  µs/op
test1_UsingWhileAndMapEntry         avgt   10    52.538 ±   2.431  µs/op
test7_UsingJava8StreamApi           avgt   10    54.464 ±   0.712  µs/op
test4_UsingKeySetAndForEach         avgt   10    79.016 ±  25.345  µs/op
test5_UsingKeySetAndIterator        avgt   10    91.105 ±  10.220  µs/op
test8_UsingJava8StreamApiParallel   avgt   10   112.511 ±   0.365  µs/op
test9_UsingApacheIterableMap        avgt   10   125.714 ±   1.935  µs/op

从后果汇合看,在中等数据量状况下,外援 Eclipse (CS) collections 中的 MutableMap 体现最为优异,勇得第一。

其次为 Java 8中的 foreach,位列第二。

场景 3:大数据集

测试集为元素数据量 100000(十万级别)的 Map 汇合,测试后果如下:

Benchmark                          Mode   Cnt  Score        Error    Units
test1_UsingWhileAndMapEntry        avgt   10   1184.767 ±   332.968  µs/op
test10_UsingEclipseMap             avgt   10   1191.735 ±   304.273  µs/op
test2_UsingForEachAndMapEntry      avgt   10   1205.815 ±   366.043  µs/op
test6_UsingForAndIterator          avgt   10   1206.873 ±   367.272  µs/op
test8_UsingJava8StreamApiParallel  avgt   10   1485.895 ±   233.143  µs/op
test5_UsingKeySetAndIterator       avgt   10   1540.281 ±   357.497  µs/op
test4_UsingKeySetAndForEach        avgt   10   1593.342 ±   294.417  µs/op
test3_UsingForEachAndJava8         avgt   10   1666.296 ±   126.443  µs/op
test7_UsingJava8StreamApi          avgt   10   1706.676 ±   436.867  µs/op
test9_UsingApacheIterableMap       avgt   10   3289.866 ±  1445.564  µs/op

利用 iterator Map.Entry【办法 1】稳居第一,当先 第二名差不多 7s。

第二名为 Eclipse (CS) collections 中的 MutableMap 位列第二,在大数据量下体现体现比拟杰出。

指的留神的是之前在小数据量下体现比拟杰出的 Java 8中的 foreach,排名却比拟靠后,然而依然超过了利用 Java8Stream API

其中还有另一个景象:利用并行模式计算的 Java8 中的 Stream API parallel,在大数据量时体现好于 foreachstream api

总结性能

下表为不同数据量状况下的各个办法性能体现

          100     600      1100     1600     2100
test10    0.333    1.631    2.752    5.937    8.024
test3     0.309    1.971    4.147    8.147   10.473
test6     0.372    2.190    4.470    8.322   10.531
test1     0.405    2.237    4.616    8.645   10.707
test2     0.376    2.267    4.809    8.403   10.910
test7     0.473    2.448    5.668    9.790   12.125
test9     0.565    2.830    5.952   13.220   16.965
test4     0.808    5.012    8.813   13.939   17.407
test5     0.810    5.104    8.533   14.064   17.422
test8     5.173   12.499   17.351   24.671   30.403

在平时开发中,数据量都不算太大时,剖除外援而言,Java 8 中的 foreach【办法 3】,体现比拟优异。而并行运算的 Stream API parallel【办法 8】体现没有设想中好,Stream API【办法 7】体现中规中矩。

总结

次要列举了多种遍历 Map 的形式,每个实现形式都有各自的特点,有的人喜爱 foreach 的通俗易懂;有的人喜爱 stream 的干净利落。

如果从性能来看,小数据量状况下:优先举荐应用 Java8 Foreach【办法 3】。

大数据量状况下举荐 应用 iterator Map.Entry【办法 1】。

本文非原创文章,翻译自 stackoverflow 上的 How do I efficiently iterate over each entry in a Java Map? 问题答案之一。

原文地址为:(https://stackoverflow.com/que…

也能够通过浏览原文跳转。

我是大黄,一个只会写 HelloWorld 的程序员,下期见。

正文完
 0