某通信公司隨著業務擴張和信息化發展迅速,目前共有服務器 3000+臺,存儲容量 50PB+, 依據未來規劃各個機房中心需同步規劃、同步擴容、同步運行,由集團IT云管理平臺統一管理,將提供包括 X86 物理機、虛擬機、分布式塊 存儲、分布式文件存儲、FC/IP SAN 存儲、備份系統以及網絡設備、安全設備、負載均衡設備等基礎資源。屆時龐大的基礎設施資源的性能監控、資源管理是信息中心重點工作之一。
為了解決此問題,開發了智能化統一監控展示手段來完成資源的監控展示工作。智能化統一監控展示方案,能夠自動的對資源進行持續的監控,實時獲取資源的資源配置及性能數據,通過預警閥值的配置進行自動告警推送;同時通過大屏的方式對資源數據和性能數據進行直觀的可視化展示,有效的提高監控工作的效率,同時實時、全景的展示給資源管理提供有力決策保障 。
2.1 開發部署監控代理工具
通過監控代理工具去發現及監控資源池資源信息。
上傳“環境初始化腳本/deploy”這個目錄和目錄中所有文件;
安裝執行腳本所需的依賴包,命令行運行:yum -y install dos2unix gcc-c++ zlib zlib-devel openssl-devel;
執行“環境初始化腳本/deploy/deploy.sh”,如腳本執行過程有提示缺依賴,直接通過yum安裝缺失的依賴包;
資源大屏展示數據中心資源分布及使用情況
系統主機資源占比TOP5
說明:按業務系統維度統計各業務系統主機資源占比情況
系統告警分布TOP10
說明:按業務系統維度統計各業務系統的告警數量
系統平均響應時間趨勢
說明:以時間趨勢展示所有業務系統的平均響應時間
撥測實時圖
說明:動態顯示數據中心的網絡延時情況,并以紅/黃/綠三色動態顯示
系統總可用率
說明:以5分鐘作為一個周期,統計前一周期內各業務系統的可用率,以及所有業務系統的平均可用率
系統健康度
說明:統計各業務系統的系統健康度,以及所有業務系統的平均健康度
系統平均響應時間
說明:統計業務系統的平均響應時間,以及所有業務系統的平均響應時間
當前用戶體驗度
說明:統計業務系統的用戶體驗度,以及所有業務系統的用戶體驗度
系統近一月健康度趨勢
說明:以時間趨勢展示所有業務系統近一個月的健康度情況
系統近一月負載趨勢
說明:以時間趨勢展示系統所有主機近一個月的負載情況
系統近一月告警趨勢
說明:以時間趨勢展示系統所有告警的情況
1. 無agent采集
通過大屏的方式展示數據中心全景的資源使用狀態及性能狀態,幫助客戶在更短的時間內掌握信息中心的資源信息,提供快速的決策能力。
更多精彩干貨分享
點擊下方名片關注
IT那活兒
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/129859.html
摘要:今天,阿里數據庫事業部研究員張瑞,將為你講述雙數據庫技術不為人知的故事。這十年,阿里巴巴數據庫團隊一直有一個使命推動中國數據庫技術變革。 第十個雙11即將來臨之際,阿里技術推出《十年牧碼記》系列,邀請參與歷年雙11備戰的核心技術大牛,一起回顧阿里技術的變遷。 今天,阿里數據庫事業部研究員張瑞,將為你講述雙11數據庫技術不為人知的故事。在零點交易數字一次次提升的背后,既是數據庫技術的一次...
摘要:明確了客服調度的核心問題,也知道了難點,更看到了目前的現狀后,我們決定打造一款自動智能的客服調度系統。對于社會化的云客服,我們可以做到,比如排隊數超過某值時,自動觸發云客服的應急放班。 背景 為什么客服需要調度?阿里集團客戶體驗事業群(CCO)目前承接了阿里集團以及生態體的客戶服務業務,我們的客戶通過各個渠道來尋求解決各類問題,每天的進線量巨大,而且經常伴隨著突發性進線,比如天貓代金券...
摘要:今天,我們邀請阿里高級技術專家力君,為大家分享自動智能的客服調度系統。明確了客服調度的核心問題,也知道了難點,更看到了目前的現狀后,我們決定打造一款自動智能的客服調度系統。 小嘰導讀:提到調度,大家腦海中可能想起的是調度阿里云的海量機器資源,而對于阿里集團客戶體驗事業群(CCO)而言,我們要調度的不是機器,而是客服資源。今天,我們邀請阿里高級技術專家力君,為大家分享自動、智能的客服調度...
閱讀 1346·2023-01-11 13:20
閱讀 1684·2023-01-11 13:20
閱讀 1132·2023-01-11 13:20
閱讀 1858·2023-01-11 13:20
閱讀 4100·2023-01-11 13:20
閱讀 2704·2023-01-11 13:20
閱讀 1385·2023-01-11 13:20
閱讀 3597·2023-01-11 13:20