摘要:總故障時間是關于告警事件數量與各告警事件時長的函數。一個月的告警數據顯示平均響應時間為分鐘平均解決時間為分鐘。確定團隊領導人此人將在解決故障期間帶領團隊工作。找到并解決問題事件解決時間大部分花在確定告警問題的過程中。
前不久,我們討論了運維不容錯過的 4個關鍵指標,其中平均解決時間(MTTR)被認為是衡量業務的最佳標準,隨后也分析了「告警等級」對MTTR的重要性。
正確看待 MTTRMTTR 為從故障發生到故障修復所經歷的時間。總故障時間是關于告警事件數量與各告警事件時長的函數。經過仔細地探討這兩項因素及其優先級,結合具體情況,總結以下策略用來縮短MTTR:
如果想通過加快工作速度降低 MTTR,理論上是完美的,但是骨感的現實根本不按我們的劇本走!為了對 MTTR 進行持續的、可衡量的改進,應該對故障事件進行深入的調查,分析事件的復雜程度及重要程度,然后從人與系統的協作上,實現對流程進行優化。
一旦事件發生,「MTTR」時鐘便開始計時。通過調整通知流程,或許就能速戰速決。下圖為常見故障處理過程:
還不夠直觀?數據來說話。 OneAlert 一個月的告警數據顯示:平均響應時間為 2.8 分鐘;平均解決時間為 27 分鐘。(不要問我為什么你們的響應時間要好幾個小時!)
如果你的響應時間較長,建議檢查一下團隊值班響應機制,告警是否可有效傳達給了正確的人?如果一線排版人員無響應,告警能否自動升級?升級時間閾值是多少?通過設定接近平均響應時間的適當期望值和目標,能確保所有成員盡快對告警作出響應。
告警響應時間過長,說明告警響應機制存在問題,故需建立有效的故障解決流程,即需確保以下內容:
建立有效溝通協議——明確每個人的任務分工,確立有效溝通方式。以 OneAlert 為例,團隊的溝通方式主要有 QQ 群聊、WeChat 聊天室、釘釘等。
確定團隊領導人——此人將在解決故障期間帶領團隊工作。需要做好記錄并合理安排工作。
做好記錄——應當詳細記錄故障期間發生的一切。這些記錄在你事后回顧之時將會非常有用。OneAlert 團隊領導人還會定期總結告警事件。
熟能生巧——確保團隊中每一個人都不是告警響應的新手。
事件解決時間大部分花在確定告警問題的過程中。所以,如何更快的明確問題的關鍵,是目前各大監控工具搶占市場的核心武器。但是未來可以肯定的是,找到問題還不夠,自動化處理才是發展的出路。這部分內容將在后期的文章中深入探討。
OneAlert 是應用性能管理領軍企業 OneAPM 公司旗下產品,也是國內首個 SaaS 模式的云告警平臺,集成國內外主流監控/支撐系統,實現一個平臺上集中處理所有 IT 事件,提升 IT 可靠性。想了解更多信息,請訪問 OneAlert 官網 。
本文轉自 OneAPM 官方博客
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/7963.html
摘要:告警當一個問題通過告警系統將消息以短信電話郵件等方式告知給用戶時,我們稱之為一條告警。圖統一告警系統結構圖告警收斂對于告警平臺每天會產生數以萬計的告警,這些告警對于運維或開發人員都需要去分析甄別優先級并處理故障。 一、背景一套監控系統檢測和告警是密不可分的,檢測用來發現異常,告警用來將問題信息發送給相應的人。v...
摘要:術作者三畫,阿里巴巴技術專家,梓敬鵬升和余樂對此文亦有貢獻。接下來,阿里巴巴技術專家三畫,將分享自己和團隊在畫好架構圖方面的理念和經驗,希望對你有所幫助。架構是結構和愿景。架構圖的作用一圖勝千言。 showImg(https://segmentfault.com/img/bVbrpzm?w=1000&h=739);術 作者 | 三畫,阿里巴巴技術專家,梓敬、鵬升和余樂對此文亦有貢獻。...
摘要:編者按本文作者為,主要介紹告警疲勞的產生原因與對抗告警疲勞的種方法。告警疲勞不僅會影響團隊成員的工作情緒,而且會阻礙軟件交付鏈的成長。利用工具事件管理工具對抵抗告警疲勞大有幫助。 【編者按】本文作者為 Chris Riley,主要介紹告警疲勞的產生原因與對抗告警疲勞的8種方法。文章系國內 ITOM 管理平臺 OneAPM 編譯呈現。 各司其職、孤軍作戰非常不利于團隊溝通,一旦發生重大事...
摘要:行勝于言,理論結合實踐才是王道,所以本文我將基于前面的學習方法,分享我是如何學習微信小程序的。第二個目標則需要學習小程序的插件相關接口調用,以及蟬知建站系統這邊的微信模塊代碼。 前段時間和大家一起分享了一篇關于學習方法內容《大牛與搬運工的差距——學習方法的力量》。我們將學習過程分成八步,并借鑒了敏捷開發的迭代思想,以達到自我迭代學習的效果。行勝于言,理論結合實踐才是王道,所以本文我將基...
閱讀 1264·2021-09-27 13:35
閱讀 2563·2021-09-06 15:12
閱讀 3380·2019-08-30 15:55
閱讀 2828·2019-08-30 15:43
閱讀 431·2019-08-29 16:42
閱讀 3446·2019-08-29 15:39
閱讀 3062·2019-08-29 12:28
閱讀 1239·2019-08-29 11:11