Java 8 Stream并行流

yzd 發布于2019-08-16 14:18 / 3175人閱讀

摘要：實際上，在并行流上使用新的方法。此外，我們了解到所有并行流操作共享相同的范圍。因此，您可能希望避免實施慢速阻塞流操作，因為這可能會減慢嚴重依賴并行流的應用程序的其他部分。

流可以并行執行，以增加大量輸入元素的運行時性能。并行流ForkJoinPool通過靜態ForkJoinPool.commonPool()方法使用公共可用的流。底層線程池的大小最多使用五個線程 - 具體取決于可用物理CPU核心的數量：

ForkJoinPool commonPool = ForkJoinPool.commonPool();
System.out.println(commonPool.getParallelism()); // 3

在我的機器上，公共池初始化為默認值為3的并行度。通過設置以下JVM參數可以減小或增加此值：

-Djava.util.concurrent.ForkJoinPool.common.parallelism=5

集合支持創建并行元素流的方法parallelStream()。或者，您可以在給定流上調用中間方法parallel()，以將順序流轉換為并行流。

為了評估并行流的并行執行行為，下一個示例將有關當前線程的信息打印出來：

Arrays.asList("a1", "a2", "b1", "c2", "c1")
    .parallelStream()
    .filter(s -> {
        System.out.format("filter: %s [%s]
",
            s, Thread.currentThread().getName());
        return true;
    })
    .map(s -> {
        System.out.format("map: %s [%s]
",
            s, Thread.currentThread().getName());
        return s.toUpperCase();
    })
    .forEach(s -> System.out.format("forEach: %s [%s]
",
        s, Thread.currentThread().getName()));

通過調查調試輸出，我們應該更好地理解哪些線程實際用于執行流操作：

filter:  b1 [main]
filter:  a2 [ForkJoinPool.commonPool-worker-1]
map:     a2 [ForkJoinPool.commonPool-worker-1]
filter:  c2 [ForkJoinPool.commonPool-worker-3]
map:     c2 [ForkJoinPool.commonPool-worker-3]
filter:  c1 [ForkJoinPool.commonPool-worker-2]
map:     c1 [ForkJoinPool.commonPool-worker-2]
forEach: C2 [ForkJoinPool.commonPool-worker-3]
forEach: A2 [ForkJoinPool.commonPool-worker-1]
map:     b1 [main]
forEach: B1 [main]
filter:  a1 [ForkJoinPool.commonPool-worker-3]
map:     a1 [ForkJoinPool.commonPool-worker-3]
forEach: A1 [ForkJoinPool.commonPool-worker-3]
forEach: C1 [ForkJoinPool.commonPool-worker-2]

如您所見，并行流利用公共中的所有可用線程ForkJoinPool來執行流操作。輸出在連續運行中可能不同，因為實際使用的特定線程的行為是非確定性的。

讓我們通過一個額外的流操作來擴展該示例：

Arrays.asList("a1", "a2", "b1", "c2", "c1")
    .parallelStream()
    .filter(s -> {
        System.out.format("filter: %s [%s]
",
            s, Thread.currentThread().getName());
        return true;
    })
    .map(s -> {
        System.out.format("map: %s [%s]
",
            s, Thread.currentThread().getName());
        return s.toUpperCase();
    })
    .sorted((s1, s2) -> {
        System.out.format("sort: %s <> %s [%s]
",
            s1, s2, Thread.currentThread().getName());
        return s1.compareTo(s2);
    })
    .forEach(s -> System.out.format("forEach: %s [%s]
",
        s, Thread.currentThread().getName()));

結果可能最初看起來很奇怪：

filter:  c2 [ForkJoinPool.commonPool-worker-3]
filter:  c1 [ForkJoinPool.commonPool-worker-2]
map:     c1 [ForkJoinPool.commonPool-worker-2]
filter:  a2 [ForkJoinPool.commonPool-worker-1]
map:     a2 [ForkJoinPool.commonPool-worker-1]
filter:  b1 [main]
map:     b1 [main]
filter:  a1 [ForkJoinPool.commonPool-worker-2]
map:     a1 [ForkJoinPool.commonPool-worker-2]
map:     c2 [ForkJoinPool.commonPool-worker-3]
sort:    A2 <> A1 [main]
sort:    B1 <> A2 [main]
sort:    C2 <> B1 [main]
sort:    C1 <> C2 [main]
sort:    C1 <> B1 [main]
sort:    C1 <> C2 [main]
forEach: A1 [ForkJoinPool.commonPool-worker-1]
forEach: C2 [ForkJoinPool.commonPool-worker-3]
forEach: B1 [main]
forEach: A2 [ForkJoinPool.commonPool-worker-2]
forEach: C1 [ForkJoinPool.commonPool-worker-1]

似乎sort只在主線程上順序執行。實際上，sort在并行流上使用新的Java 8方法Arrays.parallelSort()。如Javadoc中所述，如果排序將按順序或并行執行，則此方法決定數組的長度：

如果指定數組的長度小于最小粒度，則使用適當的Arrays.sort方法對其進行排序。

回到reduce一節的例子。我們已經發現組合器函數只是并行調用，而不是順序流調用。讓我們看看實際涉及哪些線程：

List persons = Arrays.asList(
    new Person("Max", 18),
    new Person("Peter", 23),
    new Person("Pamela", 23),
    new Person("David", 12));

persons
    .parallelStream()
    .reduce(0,
        (sum, p) -> {
            System.out.format("accumulator: sum=%s; person=%s [%s]
",
                sum, p, Thread.currentThread().getName());
            return sum += p.age;
        },
        (sum1, sum2) -> {
            System.out.format("combiner: sum1=%s; sum2=%s [%s]
",
                sum1, sum2, Thread.currentThread().getName());
            return sum1 + sum2;
        });

控制臺輸出顯示累加器和組合器函數在所有可用線程上并行執行：

accumulator: sum=0; person=Pamela; [main]
accumulator: sum=0; person=Max;    [ForkJoinPool.commonPool-worker-3]
accumulator: sum=0; person=David;  [ForkJoinPool.commonPool-worker-2]
accumulator: sum=0; person=Peter;  [ForkJoinPool.commonPool-worker-1]
combiner:    sum1=18; sum2=23;     [ForkJoinPool.commonPool-worker-1]
combiner:    sum1=23; sum2=12;     [ForkJoinPool.commonPool-worker-2]
combiner:    sum1=41; sum2=35;     [ForkJoinPool.commonPool-worker-2]

總之，并行流可以為具有大量輸入元素的流帶來良好的性能提升。但請記住，某些并行流操作reduce,collect需要額外的計算（組合操作），這在順序執行時是不需要的。

此外，我們了解到所有并行流操作共享相同的JVM范圍ForkJoinPool。因此，您可能希望避免實施慢速阻塞流操作，因為這可能會減慢嚴重依賴并行流的應用程序的其他部分。

云服務器 GPU云服務器 Java 8 java 8 進階 java并行和并發 java的并行編程

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/72912.html

樂字節-Java8新特性之Stream流（上）

摘要：需要注意的是很多流操作本身就會返回一個流，所以多個操作可以直接連接起來，如下圖這樣，操作可以進行鏈式調用，并且并行流還可以實現數據流并行處理操作。為集合創建并行流。上一篇文章，小樂給大家介紹了《Java8新特性之方法引用》，下面接下來小樂將會給大家介紹Java8新特性之Stream，稱之為流，本篇文章為上半部分。 1、什么是流? Java Se中對于流的操作有輸入輸出IO流,而Jav...

dingda 2019-08-19 11:35 評論0 收藏0
Java８新特性總覽

摘要：新特性總覽標簽本文主要介紹的新特性，包括表達式方法引用流默認方法組合式異步編程新的時間，等等各個方面。還有對應的和類型的函數連接字符串廣義的歸約匯總起始值，映射方法，二元結合二元結合。使用并行流時要注意避免共享可變狀態。 Java８新特性總覽標簽： java [TOC] 本文主要介紹 Java 8 的新特性，包括 Lambda 表達式、方法引用、流(Stream API)、默認方...

mayaohua 2019-08-14 17:56 評論0 收藏0
「Java 8 函數式編程」讀書筆記——數據并行化

摘要：限制編寫并行流，存在一些與非并行流不一樣的約定。底層框架并行流在底層沿用的框架，遞歸式的分解問題，然后每段并行執行，最終由合并結果，返回最后的值。本書第六章的讀書筆記，也是我這個系列的最后一篇讀書筆記。后面7、8、9章分別講的測試、調試與重構、設計和架構的原則以及使用Lambda表達式編寫并發程序，因為筆記不好整理，就不寫了，感興趣的同學自己買書來看吧。并行化流操作關于并行與并發...

leone 2019-08-14 17:34 評論0 收藏0
Java8的流（stream）操作

摘要：串行與并行可以分為串行與并行兩種，串行流和并行流差別就是單線程和多線程的執行。返回串行流返回并行流和方法返回的都是類型的對象，說明它們在功能的使用上是沒差別的。唯一的差別就是單線程和多線程的執行。 Stream是什么 Stream是Java8中新加入的api，更準確的說: Java 8 中的 Stream 是對集合（Collection）對象功能的增強，它專注于對集合對象進行各種非常便...

yacheng 2019-08-16 16:47 評論0 收藏0
Java8-流

摘要：因此，使用并行流需要考慮以下幾點數據量將問題分解之后并行化處理，再將結果合并會帶來額外的開銷。目錄簡介用法例子注意點一. 簡介流是Java8引入的一個新特性,提供了對集合元素一系列便捷的操作，可以用很少的代碼實現復雜的功能。流有兩大類，分別是對象流（Stream），基本數據流(IntStream、LongStream、DoubleStream)。二.用法流的使用通...

whinc 2019-08-15 15:20 評論0 收藏0