摘要:智能調度系統實時監測集群所有計算節點計算存儲網絡等負載信息,作為虛擬機調度和管理的數據依據。當有新的虛擬資源需要部署時,調度系統會優先選擇低負荷節點進行部署,確保整個集群節點的負載。
智能調度是 UCloudStack 平臺虛擬機資源調度管理的核心,由調度模塊負責調度任務的控制和管理,用于決策虛擬機運行在哪一臺物理服務器上,同時管理虛擬機狀態及遷移計劃,保證虛擬機可用性和可靠性。
智能調度系統實時監測集群所有計算節點計算、存儲、網絡等負載信息,作為虛擬機調度和管理的數據依據。當有新的虛擬資源需要部署時,調度系統會優先選擇低負荷節點進行部署,確保整個集群節點的負載。如下圖所示,新創建的虛擬資源將會通過調度檢測,自動部署至負載較低的 Node3 節點上。
調度系統在優先選擇低負荷節點進行虛擬資源部署的同時,分別提供打散部署、在線遷移、宕機遷移等能力,整體保證云平臺的可靠性。UCloudStack 云平臺使用分布式存儲提供存儲服務,如上圖所示,虛擬機均運行于分布式存儲池之上,且分布式存儲池可跨多臺物理機構建統一分布式存儲資源池。虛擬機的系統盤、鏡像文件及掛載的硬盤均存儲于統一分布式存儲池中,每臺計算節點均可通過分布式存儲池中的虛擬機的系統盤文件及配置信息注冊一個相同的虛擬機進程,可作用于在線遷移或宕機遷移任務。
在線遷移(虛擬機熱遷移)是計劃內的遷移操作,即虛擬機不停機的情況下,在不同的物理機之間進行在線跨機遷移。首先是在目標物理機注冊一個相同配置的虛擬機進程,然后進行虛擬機內存數據同步,最終快速切換業務到目標新虛擬機。整個遷移切換過程非常短暫,幾乎不影響或中斷用戶運行在虛擬機中的業務,適用于云平臺資源動態調整、物理機停機維護、優化服務器能源消耗等場景,進一步增強云平臺可靠性。
由于采用分布式統一存儲,虛擬機在線遷移時只遷移 【計算】 的運行位置,不涉及 【存儲】(系統盤、鏡像、云硬盤)位置遷移。遷移時僅需通過統一存儲內的源虛擬機配置文件在目的主機上注冊一個相同配置且狀態置為暫停的虛擬機進程,然后反復遷移源虛擬機的內存至目的虛擬機,待虛擬機內存同步一致后,關閉源虛擬機并激活目標虛擬機進程,最后進行網絡切換并成功接管源虛擬機業務。
整個遷移任務僅在激活目標虛擬機及網絡切換時業務處于短暫中斷,由于激活和切換所用時間很短,少于 TCP 超時重傳時間,因此源虛擬機業務幾乎無感知。同時由于無需遷移虛擬機磁盤及鏡像位置,虛機掛載的云盤遷移后不受影響,可為用戶提供無感知且攜帶存儲數據的遷移服務。具體遷移過程如下:
整個遷移過程中,從源虛擬機暫停至目標虛擬機激活并完成網絡切換為停機時間,由于激活虛擬機及網絡切換時間非常短暫,通常小于幾百毫秒,少于 TCP 超時重傳時間,對大多數應用服務來說可忽略不計,因此虛擬機業務幾乎不會感知到遷移停機。如智能調度圖中的 VM6 默認運行在 Node1 上,管理員通過在線遷移功能手動將 VM6 遷移至 Node3 的流程如下:
宕機遷移又稱離線遷移(Offline Migration)或虛擬機高可用( High Availability),指平臺底層物理機出現異常或故障而導致宕機時,調度系統會自動將其所承載的虛擬資源快速遷移到健康且負載正常的物理機,盡量保證業務的可用性。整體宕機遷移不涉及存儲及數據遷移,新虛擬機可快速在新物理機上運行,平均遷移時間為 90 秒左右,可能會影響或中斷運行在虛擬機中的業務。
由于采用分布式統一存儲,虛擬機的系統盤及寫進系統盤的數據均存儲在底層分布式存儲中,虛擬機宕機遷移只遷移 【計算】 的運行位置,不涉及 【存儲】(系統盤、鏡像、云硬盤)位置遷移,僅需在新物理機上重新啟動虛擬機并保證網絡通信即可。遷移機制說明如下:
整個遷移過程,從檢測到故障至遷移成功平均為 90 秒左右。虛擬機啟動時間與源虛擬機的組件及配置有關,如綁定云硬盤、外網 IP 、彈性網卡及操作系統等;同時由于虛擬機規格過大、底層物理資源不足、底層硬件故障等原因可能會導致宕機遷移失敗,通常建議盡量保證底層物理資源充足。
如智能調度圖中的 Node2 節點故障,智能調度系統自動將 VM3 和 VM4 分別遷移至 Node1 和 Node3 節點,具體流程如下:
宕機遷移的前提是集群中至少有 2 臺以上的物理服務器,且在遷移過程中需保證健康節點的資源充足及網絡連通性。通過宕機遷移技術,為業務系統提供高可用性,極大縮短由于各種主機物理故障或鏈路故障引起的中斷時間。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/125812.html
在互聯網市場的頭部效應下,企業所面臨的競爭壓力越來越大,如何有效解決獲客成本高、用戶黏性低、變現能力弱等問題,正是越來越多的企業開始構建大數據平臺的初衷。但由于大數據解決方案所涉及的組件錯綜復雜、技術門檻較高,且初期投入的資源和后期的維護成本較大,十分考驗企業的大數據平臺組建和運維能力。因此,UCloud大數據團隊于近期上線了大數據智能平臺(UCloud Smart Data Platform,下...
摘要:集群默認對所有租戶開放權限,平臺支持對存儲集群進行權限控制,用于將部分物理存儲資源獨享給一個或部分租戶使用,適用于專屬私有云場景。支持租戶將有權限的存儲卷信息作為虛擬機的系統盤,使虛擬機直接運行直商業存儲中,提升性能。4.1.1 地域地域 ( Region ) 指 UCloudStack 云平臺物理數據中心的地理區域,如上海、北京、杭州等。不同地域間完全物理隔離,云平臺資源創建后不能更換地域...
摘要:北京網絡廣播電視臺直播室樓上為運營團隊在實時監測點擊大圖在北京網絡廣播電視臺的大展廳中,記者對大媒體非常驚艷。其中北京網絡廣播電視臺云基礎支撐平臺架構圖點擊大圖涉及了服務器小型機網絡資源池存儲資源池操作系統,以及在內的虛擬化平臺。 從2013年下半年開始,媒體與新媒體的分析不絕于耳。面對借移動互聯與社交而日益蓬勃的新媒體的攻勢,傳統媒體是抱殘守缺,還是勇于變革?IPTV的反擊是整個產業的...
閱讀 283·2024-11-07 18:25
閱讀 130362·2024-02-01 10:43
閱讀 867·2024-01-31 14:58
閱讀 828·2024-01-31 14:54
閱讀 82766·2024-01-29 17:11
閱讀 3047·2024-01-25 14:55
閱讀 1985·2023-06-02 13:36
閱讀 3032·2023-05-23 10:26