摘要:上一篇我們介紹了的概念與實際的一些操作,本篇我們繼續來學習的另一個重要操作,分組與分區。注意到分組后的返回類型是,結果集中會將作為,對應的集合作為返回。
上一篇我們介紹了Strem的概念與實際的一些操作,本篇我們繼續來學習Stream的另一個重要操作,分組與分區。
我們在上一篇介紹Stream的操作時,會經常使用到Collectors這個類,這個類實際上是一個封裝了很多常用的匯聚操作的一個工廠類。我們之前用到過
//將結果匯聚到ArrayList中 Collectors.toList();
//將結果匯聚到HashSet中 Collectors.toSet();
以及更為通用的
//將結果匯聚到一個指定類型的集合中 Collectors.toCollection(SuppliercollectionFactory);
Stream分組
在實際開發中,對于將一個集合的內容進行分組或分區這種需求也非常常見,所以我們繼續學習下Collectors類中的groupingBy和partitioningBy方法。
public static Collector groupingBy(Function super T, ? extends K> classifier){ //... }
groupingBy接收一個Function類型的變量classifier,classifier被稱作分類器,收集器會按著classifier作為key對集合元素進行分組,然后返回Collector收集器對象,假如現在有一個實體Student
public class Student { private String name; private int score; private int age; public Student(String name,int score,int age){ this.name = name; this.score = score; this.age = age; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getScore() { return score; } public void setScore(int score) { this.score = score; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } }
我們現在按Student的name進行分組,如果使用sql來表示就是select * from student group by name; 再看下使用Stream的方式
Map> collect = students.stream().collect(Collectors.groupingBy(Student::getName));
這里我們使用方法引用(類名::實例方法名)替代lambda表達式(s -> s.getName())的方式來指定classifier分類器,使集合按Student的name來分組。
注意到分組后的返回類型是Map
那如果按name分組后,想求出每組學生的數量,就需要借助groupingBy另一個重載的方法
public static Collector groupingBy(Function super T, ? extends K> classifier,Collector super T, A, D> downstream){ //... }
第二個參數downstream還是一個收集器Collector對象,也就是說我們可以先將classifier作為key進行分組,然后將分組后的結果交給downstream收集器再進行處理
//按name分組 得出每組的學生數量 使用重載的groupingBy方法,第二個參數是分組后的操作 Mapcollect1 = students.stream().collect(Collectors.groupingBy(Student::getName, Collectors.counting()));
Collectors類這里也幫我們封裝好了用于統計數量的counting()方法,這里先了解一下counting()就是將收集器中元素求總數即可,后續我們會再深入源碼學習。
我們還可以對分組后的數據求平均值
Mapcollect2 = students.stream().collect(Collectors.groupingBy(Student::getName, Collectors.averagingDouble(Student::getScore)));
averagingDouble方法接收一個ToDoubleFunction參數
@FunctionalInterface public interface ToDoubleFunction{ /** * Applies this function to the given argument. * * @param value the function argument * @return the function result */ double applyAsDouble(T value); }
ToDoubleFunction實際上也是Function系列函數式接口中的其中一個特例,接收一個參數,返回Double類型(這里是接收一個Student返回score)。因為分組后的集合中每個元素是Student類型的,所以我們無法直接對Student進行求平均值
//偽代碼 Collectors.averagingDouble(Student))
所以需要將Student轉成score再求平均值,Collectors.averagingDouble(Student::getScore))。
Stream分區
針對上面的Student,我們現在再加一個需求,分別統計一下及格和不及格的學生(分數是否>=60)
這時候符合Stream分區的概念了,Stream分區會將集合中的元素按條件分成兩部分結果,key是Boolean類型,value是結果集,滿足條件的key是true,我們看下示例。
Map> collect3 = students.stream().collect(Collectors.partitioningBy(student -> student.getScore() >= 60)); System.out.println(collect3.get(true));//輸出及格的Student System.out.println(collect3.get(false));//輸出不及格的Student
partitioningBy方法接收一個Predicate作為分區判斷的依據,滿足條件的元素放在key為true的集合中,反之放在key為false的集合中
//partitioningBy方法 public static Collector partitioningBy(Predicate super T> predicate) { return partitioningBy(predicate, toList()); }
下一篇
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/70778.html
摘要:這些切片稱為窗口。函數允許對常規數據流進行分組。通常,這是非并行數據轉換,因為它在非分區數據流上運行。 showImg(https://segmentfault.com/img/remote/1460000017874226?w=1920&h=1271); 前言 在第一篇介紹 Flink 的文章 《《從0到1學習Flink》—— Apache Flink 介紹》 中就說過 Flink ...
閱讀 1849·2021-11-25 09:43
閱讀 1491·2021-09-02 15:21
閱讀 3453·2019-08-30 15:52
閱讀 1501·2019-08-30 12:48
閱讀 1295·2019-08-30 10:57
閱讀 2929·2019-08-26 17:41
閱讀 681·2019-08-26 11:59
閱讀 1366·2019-08-26 10:41