摘要:序本文主要講述一下如何使用的以及的的數據結構來統計單詞次數。小結經過封裝后的數據結構,用起來非常簡潔。
序
本文主要講述一下如何使用apache collections4的bag以及guava的multiset的數據結構來統計單詞次數。
mavenbagcom.google.guava guava 22.0 org.apache.commons commons-collections4 4.1
@Test public void testBag(){ Bagmultisetbag = new HashBag<>(); String content = "She is beautiful and she is my angel"; Arrays.stream(content.split(" ")).forEach(word -> { bag.add(word);bag.add(word); }); //get unique key Set set = bag.uniqueSet(); set.stream().forEach(word -> { System.out.println(word + "-->" + bag.getCount(word)); }); }
@Test public void testMultiSet(){ String content = "She is beautiful and she is my angel"; Multiset小結set = HashMultiset.create(); Arrays.stream(content.split(" ")).forEach(word -> { set.add(word); }); set.stream().distinct().forEach(e -> { System.out.println(e + "-->" + set.count(e)); }); }
經過封裝后的數據結構,用起來非常簡潔。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/67519.html
摘要:接著我們將數據流按照單詞字段即號索引字段做分組,這里可以簡單地使用方法,得到一個以單詞為的數據流。得到的結果數據流,將每秒輸出一次這秒內每個單詞出現的次數。最后一件事就是將數據流打印到控制臺,并開始執行最后的調用是啟動實際作業所必需的。 本文轉載自 Jark’s Blog ,作者伍翀(云邪),Apache Flink Committer,阿里巴巴高級開發工程師。 本文將從開發環境準備、創建 ...
閱讀 929·2023-04-26 01:34
閱讀 3363·2023-04-25 20:58
閱讀 3289·2021-11-08 13:22
閱讀 2118·2019-08-30 14:17
閱讀 2526·2019-08-29 15:27
閱讀 2679·2019-08-29 12:45
閱讀 3004·2019-08-29 12:26
閱讀 2816·2019-08-28 17:51