国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

日常巡檢自動化

IT那活兒 / 2001人閱讀
日常巡檢自動化

點擊上方“IT那活兒”公眾號,關注后了解更多內容,不管IT什么活兒,干就完了!!!


  
作為運維人員,其中最基本一項職能職責針對網絡、服務器等進行服務周期內的維護。

維護過程中,巡檢是一項必不可缺少的工作。看似簡單的巡檢動作,在日常工作中尤為重要。

“日常巡檢”是對相關設備進行日常的巡視和檢查,發現隱患及時盡可能的去進行安全處理,盡可能的將該隱患處理在萌芽狀態,就可以最大限度的減少該隱患帶來不必要的損失。
本文主要介紹基于智慧運維平臺(AMP)將日常巡檢以及簡單故障恢復實現自動化處理,并可在流程圖上直觀地看到是哪一步流程出錯,從而進一步快速精準定位問題。
AMP平臺簡介
自動化運維管理平臺--支撐八大運維場景自動化(如圖所示),覆蓋常見運維工作
靈活的可視化任務編排及調度,操作、資源、工具、人員的任意編排調度,構建多方位自動化能力。
內置大量運維操作原子場景,支持常見數據庫、中間件、云平臺、網絡設備等運維操作自動化能力



實際場景--日常巡檢之微服務和組件狀態巡檢以及故障恢復

1. 日常巡檢自動化前

對于平臺的各個微服務狀態進行巡檢需要登錄服務器,進入指定目錄,執行命令,查看各個微服務狀態:
如果發現有服務狀態時 No running狀態還需要人工執行重啟腳本進行針對性啟動。
對于平臺使用的組件狀態進行巡檢,例如kafka:
平臺的kafka部署在三臺服務器中,如果想要巡檢三個kafka的狀態時,最基礎的方法是登錄到每一個服務器上查看kafka的進程是否存在:
另外方法可以通過查看kafka組件信息和消費信息來確認三臺kafka是否都屬于正常狀態:

1)查看kafka組信息

./bin/kafka-consumer-groups.sh --bootstrap-server ip:prot --list

2)查看消費信息

./bin/kafka-consumer-groups.sh --describe --bootstrap-server ip:prot --group 7a4f66af-a983-4a10-9a0c-19424ffcab3d

如果發現某一個kafka進程掛掉,需要登錄到該服務器上執行重啟腳本進行進程啟動。
同時平臺部署依賴的組件還有zookeeper、redis、Elasticsearch、nginx等。他們巡檢的操作都和kafka 的巡檢步驟相同或者類似。
如果按照最原始的巡檢步驟進行巡檢,那么將上述的所有微服務、組件巡檢完成,費時費力。且是由于人工操作,會出現巡檢漏掉、或者未注意等等問題。
所以為了減輕人工巡檢時間,提高巡檢效率,減少由人工巡檢帶來的問題。于是使用到了平臺的調度功能來實現自動化巡檢。

自動巡檢結果流程圖

需要做到上述的流程圖的過程為:

  • 將微服務、組件所在服務器安裝Agent并且納入運維由平臺進行管理;
  • 將各個微服務、組件的啟動、查看狀態等腳本分別配置在平臺的操作中,即將服務器上的腳本復制到平臺上一份,由平臺來進行執行腳本;
  • 通過平臺的調度功能進行將各個操作,通過邏輯關系串聯在一起,即可形成上圖的結構。
從該流程圖上可以很明確清晰的看到在巡檢過程中Elasticsearch、nginx兩個組件進程異常,并通過了人工審核的步驟,再執行重啟,重啟完畢之后再次執行集群巡檢,指導正常才通過。

2. 日常巡檢自動化后

在巡檢過程中不需要人工登陸服務器,完全在平臺進行操作,避免巡檢人員巡檢不到位、誤操作等問題,解決了傳統巡檢方式的弊端,在此優勢之上,自動化巡檢更能將每次巡檢記錄進行導出,為巡檢人員制作巡檢報告提供了可視化數據,使巡檢報告脫離了繁瑣單一的文字描述的層次。

本文首發于2021年9月16日。

本文作者:李偉業(上海新炬王翦團隊)

本文來源:“IT那活兒”公眾號


文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/129288.html

相關文章

  • 超帥!無人機巡檢上海1.3萬座玻璃幕墻的背后

    摘要:而其中執行玻璃幕墻自動巡檢工作的正是合作伙伴獅尾智能研發的無人機。萬座玻璃幕墻建筑自動巡檢的背后目前,上海有近萬座玻璃幕墻建筑,是世界上玻璃幕墻建筑數量最大的大都市之一。說到無人機第一個想到的會是什么?大多數人的回答可能是:航拍玩具但,無人機還能做些什么呢?來看看下邊這個視頻視頻中,無人機正應用于上海玻璃幕墻建筑的日常自動巡檢作業,幫助上海住建委完成玻璃幕墻高空風險的預警工作。而其中執行玻璃...

    Tecode 評論0 收藏0
  • 數據庫管理平臺NetopGO簡介

    摘要:原文出自聽云技術博客斷斷續續寫了將近一個月,聽云第一版數據庫管理平臺終于寫完了,期間來來回回的改了好多次小毛病,現在已經部署到生產環境上去了。主機管理這里主要是主機列表管理和業務組列表管理。 原文出自【聽云技術博客】:http://blog.tingyun.com/web/article/detail/600 斷斷續續寫了將近一個月,聽云第一版數據庫管理平臺終于寫完了,期間來來回回的改...

    YacaToy 評論0 收藏0
  • 智慧園區三維可視化系統(附方案+源碼)

    摘要:一,智慧園區建設的核心價值,三維可視化應用,未來智慧園區管理發展方向。,應急指揮預案可視化通過對應急預案的資源流程事件預案進行可視化管理,為園區重大危險事故提供高效調度指揮管理手段。獲取智慧園區三維可視化系統源碼 一,智慧園區建設的核心價值 1,三維可視化應用,未來智慧園區管理發展方向。 ?...

    tanglijun 評論0 收藏0
  • 云計算的運維管理問題

    摘要:運行監控云計算的運維管理應從數據中心的日常監控人手,對日常維護管理事件管理變更管理以及應急預案管理等進行全方位的日常監控,以提前發現問題并消除隱患。自動化管理已然成為了當前云計算運維管理的一個必然發展趨勢。從而有效實現云計算運維管理的改進。云計算在企業運營中的基本工作原理是將計算分布在大量分布式計算機中,從而使企業數據中心的運行和互聯網更為相似。通過云計算的運維管理,企業不僅能夠實現對IT資...

    CoderBear 評論0 收藏0

發表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<