目录
问题:
复现问题:
问题原因:
解决办法
总结:
问题:
在使用 stream 的 toMap方法时,假设其中存在重复的key,如果不做任何处理,会抛异常:java.lang.IllegalStateException: Duplicate key
复现问题:
构建模拟数据代码如下
// 构建模拟数据String[] data = new String[]{"a", "b", "c", "d"};List<HashMap<String, String>> testList = new ArrayList<>();for(int i = 0; i <= 16; i++){HashMap<String, String> testMap = new HashMap<>();int idx = i & (data.length - 1);testMap.put("id", String.valueOf(i));testMap.put("value", data[idx]);testList.add(testMap);}
得到的模拟数据:
处理数据,使用 toMap方法将 list 转化为 map:
// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值Map<String, String> target = testList.stream().collect(Collectors.toMap(t -> t.get("value"), t -> t.get("id")));target.forEach((key, value) -> System.out.println(key + ":" + value));
这样直接进行转 map ,当存在重复key时,会抛异常。
问题原因:
toMap方法不会自动处理key冲突问题,参见源码:
这里传入了 throwingMerger 和一个 新的hashmap实例。
throwingMerger 方法什么都没做,只是抛了个异常。
在这里可以看到,处理key冲突的合并策略使用的是 mergeFunction,也就是前面传入的 throwingMerger;mapSupplier 也就是前面传入的 new hashmap,所以其实最终走的是 hashmap 的 merge 方法。
hashmap 的 merge 方法接收一个参数 remappingFunction,当key重复时,也就是old能取到值的时候,使用 remappingFunction 策略来处理冲突,那么就会调用默认传入的throwingMerger ,也就是抛一个异常。
解决办法
了解了问题的来龙去脉,其实解决也很容易,只需要在使用 toMap 方法的时候,指定一个解决key冲突的策略:
只保留一个值:
// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值Map<String, String> target = testList.stream().collect(Collectors.toMap(t -> t.get("value"),t -> t.get("id"),// 定义 o 为原值,n 为新值,// 策略为保留原值,(o, n) -> 0;// 保留新值,覆盖原值,(o, n) -> n(o, n) -> o));target.forEach((key, value) -> System.out.println(key + ":" + value));
保留原值结果:
保留新值结果:
将所有冲突的value值放入list中:
// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值Map<Object, List<String>> target = testList.stream().collect(Collectors.toMap(t -> t.get("value"),// 将value转化为list,等同于 // t -> new ArrayList<String>(){{add(t.get("id"));}}t -> Lists.newArrayList(t.get("id")),// 指定策略为,合并为一个list(List<String> oldList, List<String> newList) -> {oldList.addAll(newList);return oldList;}));target.forEach((key, value) -> System.out.println(key + ":" + value));
结果如下:
总结:
使用 toMap 方法,如果存在重复key,需要指定解决策略。当然也可以使用groupingBy 方法代替。