深入理解Java內存模型（二）——重排序

tunny 發布于2019-08-14 16:02 / 2664人閱讀

摘要：前情提要深入理解內存模型一基礎編譯器運行時會對指令進行重排序。以處理器的猜測執行為例，執行線程的處理器可以提前讀取并計算，然后把計算結果臨時保存到一個名為重排序緩沖的硬件緩存中。請看下篇深入理解內存模型三順序一致性

前情提要 深入理解Java內存模型（一）——基礎

Java編譯器、運行時會對指令進行重排序。這種重排序在單線程和多線程情況下分別有什么影響呢？

數據依賴性

如果兩個操作訪問同一個變量，且這兩個操作中有一個為寫操作，此時這兩個操作之間就存在數據依賴性。數據依賴分下列三種類型：

  -------- -------------- -------------------------------
  名稱     代碼示例       說明
  寫后讀   a = 1;b = a;   寫一個變量之后，再讀這個位置。
  寫后寫   a = 1;a = 2;   寫一個變量之后，再寫這個變量。
  讀后寫   a = b;b = 1;   讀一個變量之后，再寫這個變量。
  -------- -------------- -------------------------------

上面三種情況，只要重排序兩個操作的執行順序，程序的執行結果將會被改變。

前面提到過，編譯器和處理器可能會對操作做重排序。編譯器和處理器在重排序時，會遵守數據依賴性，編譯器和處理器不會改變存在數據依賴關系的兩個操作的執行順序。

注意，這里所說的數據依賴性僅針對單個處理器中執行的指令序列和單個線程中執行的操作，不同處理器之間和不同線程之間的數據依賴性不被編譯器和處理器考慮。

as-if-serial語義

as-if-serial語義的意思指：不管怎么重排序（編譯器和處理器為了提高并行度），（單線程）程序的執行結果不能被改變。編譯器，runtime 和處理器都必須遵守as-if-serial語義。

為了遵守as-if-serial語義，編譯器和處理器不會對存在數據依賴關系的操作做重排序，因為這種重排序會改變執行結果。但是，如果操作之間不存在數據依賴關系，這些操作可能被編譯器和處理器重排序。為了具體說明，請看下面計算圓面積的代碼示例：

    double pi  = 3.14;    //A
    double r   = 1.0;     //B
    double area = pi * r * r; //C

上面三個操作的數據依賴關系如下圖所示：

如上圖所示，A和C之間存在數據依賴關系，同時B和C之間也存在數據依賴關系。因此在最終執行的指令序列中，C不能被重排序到A和B的前面（C排到A和B的前面，程序的結果將會被改變）。但A和B之間沒有數據依賴關系，編譯器和處理器可以重排序A和B之間的執行順序。下圖是該程序的兩種執行順序：

as-if-serial語義把單線程程序保護了起來，遵守as-if-serial語義的編譯器，runtime 和處理器共同為編寫單線程程序的程序員創建了一個幻覺：單線程程序是按程序的順序來執行的。as-if-serial語義使單線程程序員無需擔心重排序會干擾他們，也無需擔心內存可見性問題。

程序順序規則

根據happens-before的程序順序規則，上面計算圓的面積的示例代碼存在三個happens-
before關系：

A happens-before B；

B happens-before C；

A happens-before C；

這里的第3個happens-before關系，是根據happens-before的傳遞性推導出來的。

這里A happens-before B，但實際執行時B卻可以排在A之前執行（看上面的重排序后的執行順序）。在第一章提到過，如果A happens-before B，JMM并不要求A一定要在B之前執行。JMM僅僅要求前一個操作（執行的結果）對后一個操作可見，且前一個操作按順序排在第二個操作之前。這里操作A的執行結果不需要對操作B可見；而且重排序操作A和操作B后的執行結果，與操作A和操作B按happens- before順序執行的結果一致。在這種情況下，JMM會認為這種重排序并不非法（not illegal），JMM允許這種重排序。

在計算機中，軟件技術和硬件技術有一個共同的目標：在不改變程序執行結果的前提下，盡可能的開發并行度。編譯器和處理器遵從這一目標，從happens-before的定義我們可以看出，JMM同樣遵從這一目標。

重排序對多線程的影響

現在讓我們來看看，重排序是否會改變多線程程序的執行結果。請看下面的示例代碼：

class ReorderExample {
int a = 0;
boolean flag = false;

public void writer() {
    a = 1;                   //1
    flag = true;             //2
}

Public void reader() {
    if (flag) {                //3
        int i =  a * a;        //4
        ……
    }
}
}

flag變量是個標記，用來標識變量a是否已被寫入。這里假設有兩個線程A和B，A首先執行writer()方法，隨后B線程接著執行reader()方法。線程B在執行操作4時，能否看到線程A在操作1對共享變量a的寫入？

答案是：不一定能看到。

由于操作1和操作2沒有數據依賴關系，編譯器和處理器可以對這兩個操作重排序；同樣，操作3和操作4沒有數據依賴關系，編譯器和處理器也可以對這兩個操作重排序。讓我們先來看看，當操作1和操作2重排序時，可能會產生什么效果？請看下面的程序執行時序圖：

如上圖所示，操作1和操作2做了重排序。程序執行時，線程A首先寫標記變量flag，隨后線程B讀這個變量。由于條件判斷為真，線程B將讀取變量a。此時，變量a還根本沒有被線程A寫入，在這里多線程程序的語義被重排序破壞了！

※注：本文統一用紅色的虛箭線表示錯誤的讀操作，用綠色的虛箭線表示正確的讀操作。

下面再讓我們看看，當操作3和操作4重排序時會產生什么效果（借助這個重排序，可以順便說明控制依賴性）。下面是操作3和操作4重排序后，程序的執行時序圖：

在程序中，操作3和操作4存在控制依賴關系。當代碼中存在控制依賴性時，會影響指令序列執行的并行度。為此，編譯器和處理器會采用猜測（Speculation）執行來克服控制相關性對并行度的影響。以處理器的猜測執行為例，執行線程B的處理器可以提前讀取并計算a*a，然后把計算結果臨時保存到一個名為重排序緩沖（reorder buffer ROB）的硬件緩存中。當接下來操作3的條件判斷為真時，就把該計算結果寫入變量i中。

從圖中我們可以看出，猜測執行實質上對操作3和4做了重排序。重排序在這里破壞了多線程程序的語義！

在單線程程序中，對存在控制依賴的操作重排序，不會改變執行結果（這也是as-if-serial語義允許對存在控制依賴的操作做重排序的原因）；但在多線程程序中，對存在控制依賴的操作重排序，可能會改變程序的執行結果。

參考文獻

Computer Architecture: A Quantitative Approach, 4th
Edition

Concurrent Programming on
Windows

Concurrent Programming in Java?: Design Principles and
Pattern

JSR-133: Java Memory Model and Thread Specification

JSR 133 (Java Memory Model) FAQ

關于作者

程曉明，Java軟件工程師，系統分析師、信息項目管理師。專注于并發編程。個人郵箱：asst2003@163.com。

請看下篇深入理解Java內存模型（三）——順序一致性

via ifeve

GPU云服務器云服務器 java重排序指令深入理解java基礎重排序數組重排序

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/66144.html

深入理解volatile類型——從Java虛擬機內存模型角度

摘要：本文從內存模型角度，探討的實現原理。通過共享內存或者消息通知這兩種方法，可以實現通信或同步。基于共享內存的線程通信是隱式的，線程同步是顯式的而基于消息通知的線程通信是顯式的，線程同步是隱式的。鎖規則鎖的解鎖，于于鎖的獲取或加鎖。一、前言在java多線程編程中，volatile可以用來定義輕量級的共享變量，它比synchronized的使用成本更低，因為它不會引起線程上下文的切換和調...

mushang 2019-08-16 10:47 評論0 收藏0
深入理解Java內存模型（一）——基礎

摘要：線程之間的通信由內存模型本文簡稱為控制，決定一個線程對共享變量的寫入何時對另一個線程可見。為了保證內存可見性，編譯器在生成指令序列的適當位置會插入內存屏障指令來禁止特定類型的處理器重排序。并發編程模型的分類在并發編程中，我們需要處理兩個關鍵問題：線程之間如何通信及線程之間如何同步（這里的線程是指并發執行的活動實體）。通信是指線程之間以何種機制來交換信息。在命令式編程中，線程之間的...

jsdt 2019-08-14 11:42 評論0 收藏0
深入理解Java內存模型（七）——總結

摘要：編譯器，和處理器會共同確保單線程程序的執行結果與該程序在順序一致性模型中的執行結果相同。正確同步的多線程程序的執行將具有順序一致性程序的執行結果與該程序在順序一致性內存模型中的執行結果相同。前情提要深入理解Java內存模型（六）——final 處理器內存模型順序一致性內存模型是一個理論參考模型，JMM和處理器內存模型在設計時通常會把順序一致性內存模型作為參照。JMM和處理器內...

paney129 2019-08-14 11:45 評論0 收藏0
Java 雙重加鎖單例與 java 內存重排序特性

摘要：關于對于重排序的講解，強烈推薦閱讀程曉明寫的深入理解內存模型二重排序。語義語義單線程下，為了優化可以對操作進行重排序。編譯器和處理器為單個線程實現了語義，但對于多線程并不實現語義。雙重加載的單例模式分析即雙重檢查加鎖。版權聲明：本文由吳仙杰創作整理，轉載請注明出處：https://segmentfault.com/a/1190000009231182 1. 引言在開始分析雙重加鎖單...

HackerShell 2019-08-16 10:31 評論0 收藏0
深入理解Java內存模型（六）——final

摘要：對于域，編譯器和處理器要遵守兩個重排序規則在構造函數內對一個域的寫入，與隨后把這個被構造對象的引用賦值給一個引用變量，這兩個操作之間不能重排序。這個屏障禁止處理器把域的寫重排序到構造函數之外。下一篇深入理解內存模型七總結與前面介紹的鎖和volatile相比較，對final域的讀和寫更像是普通的變量訪問。對于final域，編譯器和處理器要遵守兩個重排序規則：在構造函數內對一個fi...

lixiang 2019-08-14 16:02 評論0 收藏0