摘要:典型應用鎖和同步器框架的核心類,就是通過調用和實現線程的阻塞和喚醒的,而的方法實際是調用的方式來實現。
前言
Unsafe是位于sun.misc包下的一個類,主要提供一些用于執行低級別、不安全操作的方法,如直接訪問系統內存資源、自主管理內存資源等,這些方法在提升Java運行效率、增強Java語言底層資源操作能力方面起到了很大的作用。但由于Unsafe類使Java語言擁有了類似C語言指針一樣操作內存空間的能力,這無疑也增加了程序發生相關指針問題的風險。在程序中過度、不正確使用Unsafe類會使得程序出錯的概率變大,使得Java這種安全的語言變得不再“安全”,因此對Unsafe的使用一定要慎重。
注:本文對sun.misc.Unsafe公共API功能及相關應用場景進行介紹。
基本介紹如下Unsafe源碼所示,Unsafe類為一單例實現,提供靜態方法getUnsafe獲取Unsafe實例,當且僅當調用getUnsafe方法的類為引導類加載器所加載時才合法,否則拋出SecurityException異常。
public final class Unsafe { // 單例對象 private static final Unsafe theUnsafe; private Unsafe() { } @CallerSensitive public static Unsafe getUnsafe() { Class var0 = Reflection.getCallerClass(); // 僅在引導類加載器`BootstrapClassLoader`加載時才合法 if(!VM.isSystemDomainLoader(var0.getClassLoader())) { throw new SecurityException("Unsafe"); } else { return theUnsafe; } } }
那如若想使用這個類,該如何獲取其實例?有如下兩個可行方案。
其一,從getUnsafe方法的使用限制條件出發,通過Java命令行命令-Xbootclasspath/a把調用Unsafe相關方法的類A所在jar包路徑追加到默認的bootstrap路徑中,使得A被引導類加載器加載,從而通過Unsafe.getUnsafe方法安全的獲取Unsafe實例。
java -Xbootclasspath/a: ${path} // 其中path為調用Unsafe相關方法的類所在jar包路徑
其二,通過反射獲取單例對象theUnsafe。
private static Unsafe reflectGetUnsafe() { try { Field field = Unsafe.class.getDeclaredField("theUnsafe"); field.setAccessible(true); return (Unsafe) field.get(null); } catch (Exception e) { log.error(e.getMessage(), e); return null; } }功能介紹
如上圖所示,Unsafe提供的API大致可分為內存操作、CAS、Class相關、對象操作、線程調度、系統信息獲取、內存屏障、數組操作等幾類,下面將對其相關方法和應用場景進行詳細介紹。
內存操作這部分主要包含堆外內存的分配、拷貝、釋放、給定地址值操作等方法。
//分配內存, 相當于C++的malloc函數 public native long allocateMemory(long bytes); //擴充內存 public native long reallocateMemory(long address, long bytes); //釋放內存 public native void freeMemory(long address); //在給定的內存塊中設置值 public native void setMemory(Object o, long offset, long bytes, byte value); //內存拷貝 public native void copyMemory(Object srcBase, long srcOffset, Object destBase, long destOffset, long bytes); //獲取給定地址值,忽略修飾限定符的訪問限制。與此類似操作還有: getInt,getDouble,getLong,getChar等 public native Object getObject(Object o, long offset); //為給定地址設置值,忽略修飾限定符的訪問限制,與此類似操作還有: putInt,putDouble,putLong,putChar等 public native void putObject(Object o, long offset, Object x); //獲取給定地址的byte類型的值(當且僅當該內存地址為allocateMemory分配時,此方法結果為確定的) public native byte getByte(long address); //為給定地址設置byte類型的值(當且僅當該內存地址為allocateMemory分配時,此方法結果才是確定的) public native void putByte(long address, byte x);
通常,我們在Java中創建的對象都處于堆內內存(heap)中,堆內內存是由JVM所管控的Java進程內存,并且它們遵循JVM的內存管理機制,JVM會采用垃圾回收機制統一管理堆內存。與之相對的是堆外內存,存在于JVM管控之外的內存區域,Java中對堆外內存的操作,依賴于Unsafe提供的操作堆外內存的native方法。
使用堆外內存的原因對垃圾回收停頓的改善。由于堆外內存是直接受操作系統管理而不是JVM,所以當我們使用堆外內存時,即可保持較小的堆內內存規模。從而在GC時減少回收停頓對于應用的影響。
提升程序I/O操作的性能。通常在I/O通信過程中,會存在堆內內存到堆外內存的數據拷貝操作,對于需要頻繁進行內存間數據拷貝且生命周期較短的暫存數據,都建議存儲到堆外內存。
典型應用DirectByteBuffer是Java用于實現堆外內存的一個重要類,通常用在通信過程中做緩沖池,如在Netty、MINA等NIO框架中應用廣泛。DirectByteBuffer對于堆外內存的創建、使用、銷毀等邏輯均由Unsafe提供的堆外內存API來實現。
下圖為DirectByteBuffer構造函數,創建DirectByteBuffer的時候,通過Unsafe.allocateMemory分配內存、Unsafe.setMemory進行內存初始化,而后構建Cleaner對象用于跟蹤DirectByteBuffer對象的垃圾回收,以實現當DirectByteBuffer被垃圾回收時,分配的堆外內存一起被釋放。
那么如何通過構建垃圾回收追蹤對象Cleaner實現堆外內存釋放呢?
Cleaner繼承自Java四大引用類型之一的虛引用PhantomReference(眾所周知,無法通過虛引用獲取與之關聯的對象實例,且當對象僅被虛引用引用時,在任何發生GC的時候,其均可被回收),通常PhantomReference與引用隊列ReferenceQueue結合使用,可以實現虛引用關聯對象被垃圾回收時能夠進行系統通知、資源清理等功能。如下圖所示,當某個被Cleaner引用的對象將被回收時,JVM垃圾收集器會將此對象的引用放入到對象引用中的pending鏈表中,等待Reference-Handler進行相關處理。其中,Reference-Handler為一個擁有最高優先級的守護線程,會循環不斷的處理pending鏈表中的對象引用,執行Cleaner的clean方法進行相關清理工作。
所以當DirectByteBuffer僅被Cleaner引用(即為虛引用)時,其可以在任意GC時段被回收。當DirectByteBuffer實例對象被回收時,在Reference-Handler線程操作中,會調用Cleaner的clean方法根據創建Cleaner時傳入的Deallocator來進行堆外內存的釋放。
CAS相關如下源代碼釋義所示,這部分主要為CAS相關操作的方法。
/** * CAS * @param o 包含要修改field的對象 * @param offset 對象中某field的偏移量 * @param expected 期望值 * @param update 更新值 * @return true | false */ public final native boolean compareAndSwapObject(Object o, long offset, Object expected, Object update); public final native boolean compareAndSwapInt(Object o, long offset, int expected,int update); public final native boolean compareAndSwapLong(Object o, long offset, long expected, long update);
什么是CAS? 即比較并替換,實現并發算法時常用到的一種技術。CAS操作包含三個操作數——內存位置、預期原值及新值。執行CAS操作的時候,將內存位置的值與預期原值比較,如果相匹配,那么處理器會自動將該位置值更新為新值,否則,處理器不做任何操作。我們都知道,CAS是一條CPU的原子指令(cmpxchg指令),不會造成所謂的數據不一致問題,Unsafe提供的CAS方法(如compareAndSwapXXX)底層實現即為CPU指令cmpxchg。
典型應用CAS在java.util.concurrent.atomic相關類、Java AQS、CurrentHashMap等實現上有非常廣泛的應用。如下圖所示,AtomicInteger的實現中,靜態字段valueOffset即為字段value的內存偏移地址,valueOffset的值在AtomicInteger初始化時,在靜態代碼塊中通過Unsafe的objectFieldOffset方法獲取。在AtomicInteger中提供的線程安全方法中,通過字段valueOffset的值可以定位到AtomicInteger對象中value的內存地址,從而可以根據CAS實現對value字段的原子操作。
下圖為某個AtomicInteger對象自增操作前后的內存示意圖,對象的基地址baseAddress="0x110000",通過baseAddress+valueOffset得到value的內存地址valueAddress="0x11000c";然后通過CAS進行原子性的更新操作,成功則返回,否則繼續重試,直到更新成功為止。
線程調度這部分,包括線程掛起、恢復、鎖機制等方法。
//取消阻塞線程 public native void unpark(Object thread); //阻塞線程 public native void park(boolean isAbsolute, long time); //獲得對象鎖(可重入鎖) @Deprecated public native void monitorEnter(Object o); //釋放對象鎖 @Deprecated public native void monitorExit(Object o); //嘗試獲取對象鎖 @Deprecated public native boolean tryMonitorEnter(Object o);
如上源碼說明中,方法park、unpark即可實現線程的掛起與恢復,將一個線程進行掛起是通過park方法實現的,調用park方法后,線程將一直阻塞直到超時或者中斷等條件出現;unpark可以終止一個掛起的線程,使其恢復正常。
典型應用Java鎖和同步器框架的核心類AbstractQueuedSynchronizer,就是通過調用LockSupport.park()和LockSupport.unpark()實現線程的阻塞和喚醒的,而LockSupport的park、unpark方法實際是調用Unsafe的park、unpark方式來實現。
Class相關此部分主要提供Class和它的靜態字段的操作相關方法,包含靜態字段內存定位、定義類、定義匿名類、檢驗&確保初始化等。
//獲取給定靜態字段的內存地址偏移量,這個值對于給定的字段是唯一且固定不變的 public native long staticFieldOffset(Field f); //獲取一個靜態類中給定字段的對象指針 public native Object staticFieldBase(Field f); //判斷是否需要初始化一個類,通常在獲取一個類的靜態屬性的時候(因為一個類如果沒初始化,它的靜態屬性也不會初始化)使用。 當且僅當ensureClassInitialized方法不生效時返回false。 public native boolean shouldBeInitialized(Class> c); //檢測給定的類是否已經初始化。通常在獲取一個類的靜態屬性的時候(因為一個類如果沒初始化,它的靜態屬性也不會初始化)使用。 public native void ensureClassInitialized(Class> c); //定義一個類,此方法會跳過JVM的所有安全檢查,默認情況下,ClassLoader(類加載器)和ProtectionDomain(保護域)實例來源于調用者 public native Class> defineClass(String name, byte[] b, int off, int len, ClassLoader loader, ProtectionDomain protectionDomain); //定義一個匿名類 public native Class> defineAnonymousClass(Class> hostClass, byte[] data, Object[] cpPatches);典型應用
從Java 8開始,JDK使用invokedynamic及VM Anonymous Class結合來實現Java語言層面上的Lambda表達式。
invokedynamic: invokedynamic是Java 7為了實現在JVM上運行動態語言而引入的一條新的虛擬機指令,它可以實現在運行期動態解析出調用點限定符所引用的方法,然后再執行該方法,invokedynamic指令的分派邏輯是由用戶設定的引導方法決定。
VM Anonymous Class:可以看做是一種模板機制,針對于程序動態生成很多結構相同、僅若干常量不同的類時,可以先創建包含常量占位符的模板類,而后通過Unsafe.defineAnonymousClass方法定義具體類時填充模板的占位符生成具體的匿名類。生成的匿名類不顯式掛在任何ClassLoader下面,只要當該類沒有存在的實例對象、且沒有強引用來引用該類的Class對象時,該類就會被GC回收。故而VM Anonymous Class相比于Java語言層面的匿名內部類無需通過ClassClassLoader進行類加載且更易回收。
在Lambda表達式實現中,通過invokedynamic指令調用引導方法生成調用點,在此過程中,會通過ASM動態生成字節碼,而后利用Unsafe的defineAnonymousClass方法定義實現相應的函數式接口的匿名類,然后再實例化此匿名類,并返回與此匿名類中函數式方法的方法句柄關聯的調用點;而后可以通過此調用點實現調用相應Lambda表達式定義邏輯的功能。下面以如下圖所示的Test類來舉例說明。
Test類編譯后的class文件反編譯后的結果如下圖一所示(刪除了對本文說明無意義的部分),我們可以從中看到main方法的指令實現、invokedynamic指令調用的引導方法BootstrapMethods、及靜態方法lambda$main$0(實現了Lambda表達式中字符串打印邏輯)等。在引導方法執行過程中,會通過Unsafe.defineAnonymousClass生成如下圖二所示的實現Consumer接口的匿名類。其中,accept方法通過調用Test類中的靜態方法lambda$main$0來實現Lambda表達式中定義的邏輯。而后執行語句consumer.accept("lambda")其實就是調用下圖二所示的匿名類的accept方法。
對象操作此部分主要包含對象成員屬性相關操作及非常規的對象實例化方式等相關方法。
//返回對象成員屬性在內存地址相對于此對象的內存地址的偏移量 public native long objectFieldOffset(Field f); //獲得給定對象的指定地址偏移量的值,與此類似操作還有:getInt,getDouble,getLong,getChar等 public native Object getObject(Object o, long offset); //給定對象的指定地址偏移量設值,與此類似操作還有:putInt,putDouble,putLong,putChar等 public native void putObject(Object o, long offset, Object x); //從對象的指定偏移量處獲取變量的引用,使用volatile的加載語義 public native Object getObjectVolatile(Object o, long offset); //存儲變量的引用到對象的指定的偏移量處,使用volatile的存儲語義 public native void putObjectVolatile(Object o, long offset, Object x); //有序、延遲版本的putObjectVolatile方法,不保證值的改變被其他線程立即看到。只有在field被volatile修飾符修飾時有效 public native void putOrderedObject(Object o, long offset, Object x); //繞過構造方法、初始化代碼來創建對象 public native Object allocateInstance(Class> cls) throws InstantiationException;典型應用
常規對象實例化方式:我們通常所用到的創建對象的方式,從本質上來講,都是通過new機制來實現對象的創建。但是,new機制有個特點就是當類只提供有參的構造函數且無顯示聲明無參構造函數時,則必須使用有參構造函數進行對象構造,而使用有參構造函數時,必須傳遞相應個數的參數才能完成對象實例化。
非常規的實例化方式:而Unsafe中提供allocateInstance方法,僅通過Class對象就可以創建此類的實例對象,而且不需要調用其構造函數、初始化代碼、JVM安全檢查等。它抑制修飾符檢測,也就是即使構造器是private修飾的也能通過此方法實例化,只需提類對象即可創建相應的對象。由于這種特性,allocateInstance在java.lang.invoke、Objenesis(提供繞過類構造器的對象生成方式)、Gson(反序列化時用到)中都有相應的應用。
如下圖所示,在Gson反序列化時,如果類有默認構造函數,則通過反射調用默認構造函數創建實例,否則通過UnsafeAllocator來實現對象實例的構造,UnsafeAllocator通過調用Unsafe的allocateInstance實現對象的實例化,保證在目標類無默認構造函數時,反序列化不夠影響。
數組相關這部分主要介紹與數據操作相關的arrayBaseOffset與arrayIndexScale這兩個方法,兩者配合起來使用,即可定位數組中每個元素在內存中的位置。
//返回數組中第一個元素的偏移地址 public native int arrayBaseOffset(Class> arrayClass); //返回數組中一個元素占用的大小 public native int arrayIndexScale(Class> arrayClass);典型應用
這兩個與數據操作相關的方法,在java.util.concurrent.atomic 包下的AtomicIntegerArray(可以實現對Integer數組中每個元素的原子性操作)中有典型的應用,如下圖AtomicIntegerArray源碼所示,通過Unsafe的arrayBaseOffset、arrayIndexScale分別獲取數組首元素的偏移地址base及單個元素大小因子scale。后續相關原子性操作,均依賴于這兩個值進行數組中元素的定位,如下圖二所示的getAndAdd方法即通過checkedByteOffset方法獲取某數組元素的偏移地址,而后通過CAS實現原子性操作。
內存屏障在Java 8中引入,用于定義內存屏障(也稱內存柵欄,內存柵障,屏障指令等,是一類同步屏障指令,是CPU或編譯器在對內存隨機訪問的操作中的一個同步點,使得此點之前的所有讀寫操作都執行后才可以開始執行此點之后的操作),避免代碼重排序。
//內存屏障,禁止load操作重排序。屏障前的load操作不能被重排序到屏障后,屏障后的load操作不能被重排序到屏障前 public native void loadFence(); //內存屏障,禁止store操作重排序。屏障前的store操作不能被重排序到屏障后,屏障后的store操作不能被重排序到屏障前 public native void storeFence(); //內存屏障,禁止load、store操作重排序 public native void fullFence();典型應用
在Java 8中引入了一種鎖的新機制——StampedLock,它可以看成是讀寫鎖的一個改進版本。StampedLock提供了一種樂觀讀鎖的實現,這種樂觀讀鎖類似于無鎖的操作,完全不會阻塞寫線程獲取寫鎖,從而緩解讀多寫少時寫線程“饑餓”現象。由于StampedLock提供的樂觀讀鎖不阻塞寫線程獲取讀鎖,當線程共享變量從主內存load到線程工作內存時,會存在數據不一致問題,所以當使用StampedLock的樂觀讀鎖時,需要遵從如下圖用例中使用的模式來確保數據的一致性。
如上圖用例所示計算坐標點Point對象,包含點移動方法move及計算此點到原點的距離的方法distanceFromOrigin。在方法distanceFromOrigin中,首先,通過tryOptimisticRead方法獲取樂觀讀標記;然后從主內存中加載點的坐標值 (x,y);而后通過StampedLock的validate方法校驗鎖狀態,判斷坐標點(x,y)從主內存加載到線程工作內存過程中,主內存的值是否已被其他線程通過move方法修改,如果validate返回值為true,證明(x, y)的值未被修改,可參與后續計算;否則,需加悲觀讀鎖,再次從主內存加載(x,y)的最新值,然后再進行距離計算。其中,校驗鎖狀態這步操作至關重要,需要判斷鎖狀態是否發生改變,從而判斷之前copy到線程工作內存中的值是否與主內存的值存在不一致。
下圖為StampedLock.validate方法的源碼實現,通過鎖標記與相關常量進行位運算、比較來校驗鎖狀態,在校驗邏輯之前,會通過Unsafe的loadFence方法加入一個load內存屏障,目的是避免上圖用例中步驟②和StampedLock.validate中鎖狀態校驗運算發生重排序導致鎖狀態校驗不準確的問題。
系統相關這部分包含兩個獲取系統相關信息的方法。
//返回系統指針的大小。返回值為4(32位系統)或 8(64位系統)。 public native int addressSize(); //內存頁的大小,此值為2的冪次方。 public native int pageSize();典型應用
如下圖所示的代碼片段,為java.nio下的工具類Bits中計算待申請內存所需內存頁數量的靜態方法,其依賴于Unsafe中pageSize方法獲取系統內存頁大小實現后續計算邏輯。
結語本文對Java中的sun.misc.Unsafe的用法及應用場景進行了基本介紹,我們可以看到Unsafe提供了很多便捷、有趣的API方法。即便如此,由于Unsafe中包含大量自主操作內存的方法,如若使用不當,會對程序帶來許多不可控的災難。因此對它的使用我們需要慎之又慎。
參考資料OpenJDK Unsafe source
Java Magic. Part 4: sun.misc.Unsafe
JVM crashes at libjvm.so
Java中神奇的雙刃劍--Unsafe
JVM源碼分析之堆外內存完全解讀
堆外內存 之 DirectByteBuffer 詳解
《深入理解Java虛擬機(第2版)》
作者簡介璐璐,美團點評Java開發工程師。2017年加入美團點評,負責美團點評境內度假的后端開發。
歡迎加入美團Java技術交流群,跟作者零距離交流。進群方式:請加美美同學微信(微信號:MTDPtech02),回復:Java,美美會自動拉你進群。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/73260.html
摘要:該類將整數值與引用關聯起來,可用于原子的更數據和數據的版本號。 CAS的全稱為Compare And Swap,直譯就是比較交換。是一條CPU的原子指令,其作用是讓CPU先進行比較兩個值是否相等,然后原子地更新某個位置的值,其實現方式是基于硬件平臺的匯編指令,在intel的CPU中,使用的是cmpxchg指令,就是說CAS是靠硬件實現的,從而在硬件層面提升效率。 CSA 原理 利用CP...
摘要:不難看出,方法的內部,必然是使用原子指令來完成的。它是一個內部使用的專屬類。注意根據類加載器的工作原理,應用程序的類由加載。加載器沒有對象的對象,因此試圖獲得這個類加載器會返回。 如果你對技術有著不折不撓的追求,應該還會特別在意incrementAndGet() 方法中compareAndSet()的實現。現在,就讓我們更進一步看一下它把!public final boolean co...
摘要:內存區域虛擬機在運行程序時,會將其管理的內存區域劃分成若干個不同的數據區域。運行時常量池運行時常量池是方法區的一部分。另外一部分官方稱為用于存儲自身運行時的數據,比如哈希值年齡鎖狀態標志偏向線程等。 前言 最近一直在看周志明老師的《深入理解虛擬機》,總是看了忘,忘了又看,陷入這樣無休止的循環當中。抱著紙上得來終覺淺的想法,準備陸續的寫幾篇學習筆記,梳理知識的脈絡并強化一下對知識的掌握。...
摘要:共享內存相信對并發有所了解的同學都應該知道在推出后,對內存管理有了更高標準的規范了,這使我們開發并發程序也有更好的標準了,不會有一些模糊的定義導致的無法確定的錯誤。 通過前幾篇的學習,相信大家對Akka應該有所了解了,都說解決并發哪家強,JVM上面找Akka,那么Akka到底在解決并發問題上幫我們做了什么呢? 共享內存 眾所周知,在處理并發問題上面,最核心的一部分就是如何處理共享內存,...
閱讀 1731·2023-04-25 23:43
閱讀 908·2021-11-24 09:39
閱讀 713·2021-11-22 15:25
閱讀 1711·2021-11-22 12:08
閱讀 1085·2021-11-18 10:07
閱讀 2067·2021-09-23 11:22
閱讀 3339·2021-09-22 15:23
閱讀 2470·2021-09-13 10:32