還在用Synchronized？Atomic你了解不？

陳江龍發布于2019-08-16 13:47 / 2261人閱讀

摘要：失敗重試自旋比如說，我上面用了個線程，對值進行加。我們都知道如果在線程安全的情況下，這個值最終的結果一定是為的。那就意味著每個線程都會對這個值實質地進行加。

前言

只有光頭才能變強

之前已經寫過多線程相關的文章了，有興趣的同學可以去了解一下：

https://github.com/ZhongFuCheng3y/3y/blob/master/src/thread.md

在閱讀《阿里巴巴 Java開發手冊》讀后感時，還有未解決的問題：

如果是count++操作，使用如下類實現: AtomicInteger count = new AtomicInteger(); count.addAndGet(1);如果是 JDK8，推薦使用 LongAdder 對象，比 AtomicLong 性能更好(減少樂觀鎖的重試次數)。

之前在學習的時候也看過AtomicInteger類很多次了，一直沒有去做相關的筆記。現在遇到問題了，于是就過來寫寫筆記，并希望在學習的過程中解決掉問題。

一、基礎鋪墊

首先我們來個例子：

public class AtomicMain {

    public static void main(String[] args) throws InterruptedException {

        ExecutorService service = Executors.newCachedThreadPool();

        Count count = new Count();
        // 100個線程對共享變量進行加1
        for (int i = 0; i < 100; i++) {
            service.execute(() -> count.increase());
        }

        // 等待上述的線程執行完
        service.shutdown();
        service.awaitTermination(1, TimeUnit.DAYS);


        System.out.println("公眾號：Java3y---------");
        System.out.println(count.getCount());
    }

}

class Count{

    // 共享變量
    private Integer count = 0;
    public Integer getCount() {
        return count;
    }
    public  void increase() {
        count++;
    }
}

你們猜猜得出的結果是多少？是100嗎？

多運行幾次可以發現：結果是不確定的，可能是95，也可能是98，也可能是100

根據結果我們得知：上面的代碼是線程不安全的！如果線程安全的代碼，多次執行的結果是一致的！

我們可以發現問題所在：count++并不是原子操作。因為count++需要經過讀取-修改-寫入三個步驟。舉個例子：

如果某一個時刻：線程A讀到count的值是10，線程B讀到count的值也是10

線程A對count++，此時count的值為11

線程B對count++，此時count的值也是11(因為線程B讀到的count是10)

所以到這里應該知道為啥我們的結果是不確定了吧。

要將上面的代碼變成線程安全的(每次得出的結果是100)，那也很簡單，畢竟我們是學過synchronized鎖的人：

在increase()加synchronized鎖就好了

public synchronized void increase() {
    count++;
}

無論執行多少次，得出的都是100：

從上面的代碼我們也可以發現，只做一個++這么簡單的操作，都用到了synchronized鎖，未免有點小題大做了。

Synchronized鎖是獨占的，意味著如果有別的線程在執行，當前線程只能是等待！

于是我們原子變量的類就登場了！

1.2CAS再來看看

在寫文章之前，本以為對CAS有一定的了解了(因為之前已經看過相關概念，以為自己理解了)..但真正敲起鍵盤寫的時候，還是發現沒完全弄懂...所以再來看看CAS吧。

來源維基百科：

比較并交換(compare and swap, CAS)，是原子操作的一種，可用于在多線程編程中實現不被打斷的數據交換操作，從而避免多線程同時改寫某一數據時由于執行順序不確定性以及中斷的不可預知性產生的數據不一致問題。 該操作通過將內存中的值與指定數據進行比較，當數值一樣時將內存中的數據替換為新的值。

CAS有3個操作數：

內存值V

舊的預期值A

要修改的新值B

當多個線程嘗試使用CAS同時更新同一個變量時，只有其中一個線程能更新變量的值(A和內存值V相同時，將內存值V修改為B)，而其它線程都失敗，失敗的線程并不會被掛起，而是被告知這次競爭中失敗，并可以再次嘗試(或者什么都不做)。

我們畫張圖來理解一下：

我們可以發現CAS有兩種情況：

如果內存值V和我們的預期值A相等，則將內存值修改為B，操作成功！

如果內存值V和我們的預期值A不相等，一般也有兩種情況：

重試(自旋)

什么都不做

我們再繼續往下看，如果內存值V和我們的預期值A不相等時，應該什么時候重試，什么時候什么都不做。

1.2.1CAS失敗重試(自旋)

比如說，我上面用了100個線程，對count值進行加1。我們都知道：如果在線程安全的情況下，這個count值最終的結果一定是為100的。那就意味著：每個線程都會對這個count值實質地進行加1。

我繼續畫張圖來說明一下CAS是如何重試(循環再試)的：

上面圖只模擬出兩個線程的情況，但足夠說明問題了。

1.2.2CAS失敗什么都不做

上面是每個線程都要為count值加1，但我們也可以有這種情況：將count值設置為5

我也來畫個圖說明一下：

理解CAS的核心就是：CAS是原子性的，雖然你可能看到比較后再修改(compare and swap)覺得會有兩個操作，但終究是原子性的！

二、原子變量類簡單介紹

原子變量類在java.util.concurrent.atomic包下，總體來看有這么多個：

我們可以對其進行分類：

基本類型：

AtomicBoolean：布爾型

AtomicInteger：整型

AtomicLong：長整型

數組：

AtomicIntegerArray：數組里的整型

AtomicLongArray：數組里的長整型

AtomicReferenceArray：數組里的引用類型

引用類型：

AtomicReference：引用類型

AtomicStampedReference：帶有版本號的引用類型

AtomicMarkableReference：帶有標記位的引用類型

對象的屬性：

AtomicIntegerFieldUpdater：對象的屬性是整型

AtomicLongFieldUpdater：對象的屬性是長整型

AtomicReferenceFieldUpdater：對象的屬性是引用類型

JDK8新增DoubleAccumulator、LongAccumulator、DoubleAdder、LongAdder

是對AtomicLong等類的改進。比如LongAccumulator與LongAdder在高并發環境下比AtomicLong更高效。

Atomic包里的類基本都是使用Unsafe實現的包裝類。

Unsafe里邊有幾個我們喜歡的方法(CAS)：

// 第一和第二個參數代表對象的實例以及地址，第三個參數代表期望值，第四個參數代表更新值
public final native boolean compareAndSwapObject(Object var1, long var2, Object var4, Object var5);

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);

public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);

從原理上概述就是：Atomic包的類的實現絕大調用Unsafe的方法，而Unsafe底層實際上是調用C代碼，C代碼調用匯編，最后生成出一條CPU指令cmpxchg，完成操作。這也就為啥CAS是原子性的，因為它是一條CPU指令，不會被打斷。

2.1原子變量類使用

既然我們上面也說到了，使用Synchronized鎖有點小題大作了，我們用原子變量類來改一下：

class Count{

    // 共享變量(使用AtomicInteger來替代Synchronized鎖)
    private AtomicInteger count = new AtomicInteger(0);
    
    public Integer getCount() {
        return count.get();
    }
    public void increase() {
        count.incrementAndGet();
    }
}


// Main方法還是如上

修改完，無論執行多少次，我們的結果永遠是100！

其實Atomic包下原子類的使用方式都不會差太多，了解原子類各種類型，看看API，基本就會用了(網上也寫得比較詳細，所以我這里果斷偷懶了)...

2.2ABA問題

使用CAS有個缺點就是ABA的問題，什么是ABA問題呢？首先我用文字描述一下：

現在我有一個變量count=10，現在有三個線程，分別為A、B、C

線程A和線程C同時讀到count變量，所以線程A和線程C的內存值和預期值都為10

此時線程A使用CAS將count值修改成100

修改完后，就在這時，線程B進來了，讀取得到count的值為100(內存值和預期值都是100)，將count值修改成10

線程C拿到執行權，發現內存值是10，預期值也是10，將count值修改成11

上面的操作都可以正常執行完的，這樣會發生什么問題呢？？線程C無法得知線程A和線程B修改過的count值，這樣是有風險的。

下面我再畫個圖來說明一下ABA的問題(以鏈表為例)：

2.3解決ABA問題

要解決ABA的問題，我們可以使用JDK給我們提供的AtomicStampedReference和AtomicMarkableReference類。

AtomicStampedReference：

An {@code AtomicStampedReference} maintains an object referencealong with an integer "stamp", that can be updated atomically.

簡單來說就是在給為這個對象提供了一個版本，并且這個版本如果被修改了，是自動更新的。

原理大概就是：維護了一個Pair對象，Pair對象存儲我們的對象引用和一個stamp值。每次CAS比較的是兩個Pair對象


    // Pair對象
    private static class Pair {
        final T reference;
        final int stamp;
        private Pair(T reference, int stamp) {
            this.reference = reference;
            this.stamp = stamp;
        }
        static  Pair of(T reference, int stamp) {
            return new Pair(reference, stamp);
        }
    }

    private volatile Pair pair;

    // 比較的是Pari對象
    public boolean compareAndSet(V   expectedReference,
                                 V   newReference,
                                 int expectedStamp,
                                 int newStamp) {
        Pair current = pair;
        return
            expectedReference == current.reference &&
            expectedStamp == current.stamp &&
            ((newReference == current.reference &&
              newStamp == current.stamp) ||
             casPair(current, Pair.of(newReference, newStamp)));
    }

因為多了一個版本號比較，所以就不會存在ABA的問題了。

2.4LongAdder性能比AtomicLong要好

如果是 JDK8，推薦使用 LongAdder 對象，比 AtomicLong 性能更好(減少樂觀鎖的重試次數)。

去查閱了一些博客和資料，大概的意思就是：

使用AtomicLong時，在高并發下大量線程會同時去競爭更新同一個原子變量，但是由于同時只有一個線程的CAS會成功，所以其他線程會不斷嘗試自旋嘗試CAS操作，這會浪費不少的CPU資源。

而LongAdder可以概括成這樣：內部核心數據value分離成一個數組(Cell)，每個線程訪問時,通過哈希等算法映射到其中一個數字進行計數，而最終的計數結果，則為這個數組的求和累加。

簡單來說就是將一個值分散成多個值，在并發的時候就可以分散壓力，性能有所提高。

參考資料：

AtomicLong與LongAdder性能對比https://zhuanlan.zhihu.com/p/45489739

LongAdder源碼詳解https://zhuanlan.zhihu.com/p/38288416

最后

參考資料：

Java并發編程札記-目錄https://blog.csdn.net/panweiwei1994/article/details/78483167

《Java并發編程實戰》

《Java并發編程的藝術》

如果你覺得我寫得還不錯，了解一下：

堅持原創的技術公眾號：Java3y。回復 1 加入Java交流群

文章的目錄導航(精美腦圖+海量視頻資源)：https://github.com/ZhongFuCheng3y/3y

GPU云服務器云服務器說說你所了解的人工智能外呼系統阿里云服務器你了解了嗎如何保護您不了解的數據資產免受網絡攻擊? 云服務器你的憑據不工作原因

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/72323.html

Java - 并發 atomic, synchronization and volatile

摘要：線程的這種交叉操作會導致線程不安全。原子操作是在多線程環境下避免數據不一致必須的手段。如果聲明一個域為一些情況就可以確保多線程訪問到的變量是最新的。并發要求一個線程對對象進行了操作，對象發生了變化，這種變化應該對其他線程是可見的。雖是讀書筆記，但是如轉載請注明出處 http://segmentfault.com/blog/exploring/ .. 拒絕伸手復制黨一個問題: ...

StonePanda 2019-08-14 12:08 評論0 收藏0
BATJ都愛問的多線程面試題

摘要：今天給大家總結一下，面試中出鏡率很高的幾個多線程面試題，希望對大家學習和面試都能有所幫助。指令重排在單線程環境下不會出先問題，但是在多線程環境下會導致一個線程獲得還沒有初始化的實例。使用可以禁止的指令重排，保證在多線程環境下也能正常運行。下面最近發的一些并發編程的文章匯總，通過閱讀這些文章大家再看大廠面試中的并發編程問題就沒有那么頭疼了。今天給大家總結一下，面試中出鏡率很高的幾個多線...

高勝山 2019-08-16 13:35 評論0 收藏0
java線程同步

摘要：只有首先獲得鎖的任務線程才能繼續獲取該對象上的多個鎖。會進一步對時失敗的那些線程進行阻塞操作調用操作系統的信號量此段來摘自別處。提供了多樣化的同步，比如有時間限制的同步，可以被的同步的同步是不能的等。各種方法 1?synchronized方法。 public synchronized void save(){} 2?synchronized代碼塊。 synchronized(obj...

endless_road 2019-08-14 18:08 評論0 收藏0
初識線程關鍵字

摘要：架構師入門筆記一初識線程關鍵字本章節主要介紹線程的關鍵字，的含義，使用方法，使用場景，以及注意事項。若次方法也加上了，就必須等待線程執行完后，才能調用關鍵字不具備關鍵字的原子性同步其主要作用就是使變量在多個線程中可見。架構師入門筆記一初識線程關鍵字本章節主要介紹線程的關鍵字 synchronized，volatile 的含義，使用方法，使用場景，以及注意事項。線程安全首先我們...

Michael_Ding 2019-08-16 10:49 評論0 收藏0