摘要:筆者多次參與銀行運營商等大型企業的性能優化工作總結了企業級應用最應重視的個性能指標,主要包括商業事務,外部服務,垃圾回收以及應用布局。應用布局最后要探討的性能指標是應用布局。另一個需要監測的是容器性能。
雖然很多人都曾預言 Java 將一蹶不振,但是不可否認的是,很多重要項目中,尤其是銀行和政府一些大型項目,Java 仍在其中扮演著極其重要的角色。筆者多次參與銀行、運營商等大型企業的性能優化工作,總結了企業級 Java 應用最應重視的4個性能指標,主要包括:商業事務,外部服務,垃圾回收以及應用布局。下文將逐一展開闡述:
1.商業事務商業事務是真實用戶體驗的直觀反映:它們抓取了用戶與應用交互時,用戶體驗到的實時性能數據。測量商業事務的性能,需要抓取一件商業事務整體的響應時間及其各個組件的響應時間。這些響應時間再與滿足業務需求的基準進行比較,從而決定應用是否正常。
如果你只打算測量應用的一個方面,本文會推薦你測量商業事務的表現。盡管容量指標(container metrics)能幫助你決定何時調節集群規模,但是商業事務才決定了應用本身的性能。你無需詢問應用服務器線程池(thread pool)的使用情況,而是關心用戶能否迅速完成他們的商業事務,以及這些事務的表現是否正常。
介紹一點背景知識:商業事務通過其入口進行辨別,即用戶與你的業務進行互動的入口。這類互動包括:一個網頁請求,一個網頁服務調用,或消息隊列中的一條消息。當然,你也可以基于一個 URL 參數為同樣的網頁請求定義多個入口,或基于一個服務調用的內容定義多個入口點。關鍵在于:商業交易必須與對你的業務流程相關聯,比如說中國移動的空中繳費業務對應到系統中是多個原子服務,我們就應該將這幾個原子服務通過相應的關聯聚合成一個空中繳費業務來進行監控。
辨別某個商業交易后,它的性能就會在整個應用生態系統中進行測量。每個商業交易的性能會與其基準進行比較,判定其是否正常。譬如,如果某個商業事務的響應時間大于您設定的閾值,我們便判定其運行異常。
總而言之,商業事務最能反映用戶體驗,因此它們也是最重要的抓取維度。
2.外部服務外部服務的形式多種多樣:從屬的網頁服務、遺留系統或數據庫等。外部服務是與應用交互的系統。運行在外部服務系統中的代碼常常無法控制,但是我們可以控制這些系統的配置,因此了解他們是否運行正常以及何時出錯也很重要。并且,我們必須有能力區分問題是出自自身應用,還是源于這些外部服務系統。
從商業事務的角度來說,我們可以辨別并測量這些處于自身應用的外部服務。有時,我們需要配置監控方法從而辨別那些包裹了外部服務調用的方法。但是對于常見的協議,諸如 HTTP 和 JDBC,外部服務可以自動檢測。
商業事務讓你對應用的性能有了全局的掌控,幫助你對性能問題進行分類。但是外部服務總能以意想不到的方式極大地影響應用的運行,所以你必須監控它們。
3.垃圾回收從 Java 發布最早版本開始,一直都保留的核心特性就是垃圾回收,它真是讓人又愛又恨。垃圾回收使我們不再需要手動管理內存:當使用完一個對象后,我們只需刪除它的引用,然后垃圾回收就會自動釋放它。如果你使用過需要手動管理內存的語言,諸如C或C++,你會滿懷感激。垃圾回收為程序員們減少了分配、釋放內存空間的繁瑣步驟。
此外,因為垃圾回收器會自動釋放沒有引用的內存空間,它減少了傳統的內容泄露情況,即內存被分配后,該內存的引用在內存釋放前就被刪除了。聽起來就像靈丹妙藥,不是么?
盡管垃圾回收達成了無需手動管理內存的目標,也防止了傳統的內存泄露,但是作為代價,垃圾回收過程有時相當笨拙。根據不同的 JVM,垃圾回收策略也會不同。深入探討這些策略超出了本文的主旨。但是,讀者應該明白,了解垃圾回收期的工作原理,以及最佳的配置方案至關重要。
垃圾回收最大的敵人就是傳說中的主要 (major) 或 (full) 垃圾回收。除了 Azul JVM,所有的 JVM 都有這個問題。通常,垃圾回收大致分為兩類:
次級
主要
為了釋放存活時間較短的對象,次級垃圾回收發生得相對頻繁。他們在運行時不會封鎖線程,產生的影響較小。
然而,主要垃圾回收,有時也稱為“暫停世界(Stop The World, STW)”垃圾回收,因為他們在運行時會封鎖 JVM 中的所有線程。
當垃圾回收運行時,它會運行一項可達性測試 (reachability test),如圖四所示。它會創建一個由對象組成的根集合 (root set),該集合包含每個運行線程中的直接可見對象。接著,它會探尋根集合中的對象涉及的其他對象,然后探尋這些對象涉及的對象,直到所有對象都被涉及。在這個過程中,它會記錄 (mark) 下現時活動對象的內存地址,然后把不被使用的所有地址都掃除 (sweep)。說得更恰當些,它會把沒有根集合對象引用的內存都釋放。最終,它會壓縮、整理這些內存,這樣新的對象才能獲得內存分配。
根據不同的 JVM ,次級、主要回收的方式都會不同。圖五圖六展示了在Sun JVM內次級、主要回收的操作方式。
在次級回收中,內存主要分配到 Eden 空間直到將其填滿。接著,拷貝收集器(copy collector)會將 Eden 中的活動對象拷貝到兩個幸存者空間(survivor spaces, to space和from space)。遺留在 Eden 中的對象就會被移除。如果幸存者空間被填滿,但還有多余的活動對象,這些對象會被移到 tenured 空間。只有主要回收才能釋放tenured空間的內存。
最終,tenured 空間會被填滿,主要回收將會執行。它不會將幸存者空間放不下的活動對象拷貝到 tenured 空間中。此時,JVM 會封鎖所有線程,運行可達性測試,清除年輕的數據(Eden和兩個幸存者空間),并壓縮 tenured 空間。我們將之稱為主要回收。
你或許會想,堆越大,主要回收運行得越不頻繁。但是當它執行時,所需時間就會比小堆要長。因此,調整好堆的大小和垃圾回收策略對于應用的性能也很重要。
4.應用布局最后要探討的性能指標是應用布局。因為云的出現,現在的應用變得更加靈活:應用環境可以根據用戶需求調節大小。因此,對應用的布局進行檢測從而決定實例的多少是否合適是非常重要的。如果你的實例太多,你的云主機成本就會增加。但如果你沒有足夠的實例,商業事務就會受到影響。
在評測過程中,下面兩個指標尤其重要:
商業事務的吞吐量
容器性能
商業事務應該基準化,你應該知道在給定的時間里為了滿足基準所需的實例數量。如果你的商業事務的吞吐量增長突然,你就要增加實例以滿足用戶。
另一個需要監測的是容器性能。具體來說,你想確定是否有應用中的實例負載過大,如果有,你或許想在那個應用中添加實例。從應用的角度查看實例狀態很重要,因為單個實例可能由于垃圾回收之類的因素負載過大,但如果應用中大多數實例都負載過大,則該應用可能已經無法支持它接受的訪問量。
因為應用中的實例可以單個地調節規模,所以分析各個實例的性能進而調整應用布局就至關重要。
本文系 OneAPM 工程師陶炳哲整理。請訪問 OneAPM 官方技術博客。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/64379.html
摘要:孔淼大數據分析處理與用戶畫像實踐直播內容如下今天咱們就來閑聊下我過去接觸過的數據分析領域,因為我是連續創業者,所以我更多的注意力還是聚焦在解決問題和業務場景上。在對微博數據進行上面提到的計算分析之前,我們其實還做了很多數據處理的工作。 孔淼:大數據分析處理與用戶畫像實踐 直播內容如下: 今天咱們就來閑聊下我過去接觸過的數據分析領域,因為我是連續創業者,所以我更多的注意力還是聚焦在解決問...
摘要:可行工具圖為上監控到的應用程序響應時間和吞吐量平均負載第二個廣泛使用的衡量指標就是服務器的平均負載。率和中止時間垃圾回收器行為異常,是導致應用吞吐量和響應時間突然下降的主要原因之一。 在某個重大發布之后,都需要記錄相應的指標,本文介紹了最重要的幾個 Java 性能指標,包括響應時間和平均負載等。為理解應用程序在生產環境中如何運行,就需要遵循一些 Java 性能指標。 在以前,當軟件被發...
摘要:本文基于這些主題,通過回顧最重要的六個性能指標,幫助評估企業應用數據庫的健康狀況。容量并不是所有的數據庫性能問題都是數據庫問題。因此,對數據庫負載及使用進行審查也是必不可少的。在某些情況下,選擇協議而不是命名管道可顯著提高數據庫性能。 【編者按】本文作者是 Omed Habib,在其職業生涯中花費了大量的時間不斷探索一些新方法以提高大型 Web 應用的性能狀況。本篇文章中,作者詳細介紹...
閱讀 2690·2021-11-08 13:16
閱讀 2367·2021-10-18 13:30
閱讀 2237·2021-09-27 13:35
閱讀 1993·2019-08-30 15:55
閱讀 2442·2019-08-30 13:22
閱讀 576·2019-08-30 11:24
閱讀 2077·2019-08-29 12:33
閱讀 1813·2019-08-26 12:10