摘要:數(shù)據(jù)中心操作系統(tǒng)以和等新一代創(chuàng)業(yè)公司為代表,開(kāi)始提出數(shù)據(jù)中心操作系統(tǒng)的概念。數(shù)據(jù)中心操作系統(tǒng)與開(kāi)發(fā)方有一個(gè)非常清晰和低成本的接入接口,完全省去了運(yùn)維這個(gè)角色寫膠水腳本的必要性,從而徹底顛覆這個(gè)崗位。
崗位價(jià)值有:
權(quán)限縮小
提供操作安全的保險(xiǎn)服務(wù)
提供操作的可擴(kuò)展性
提供業(yè)務(wù)和資源能見(jiàn)度
屏蔽資源的部署細(xì)節(jié)
靜態(tài)資源調(diào)平
動(dòng)態(tài)資源調(diào)平
故障處理和善后
權(quán)限縮小通過(guò)配置文件修改一個(gè)后臺(tái)參數(shù)需要登錄權(quán)限,文件修改權(quán)限,甚至進(jìn)程起停權(quán)限。這些運(yùn)營(yíng)環(huán)境的權(quán)限需要盡可能的收歸到很少的人的手里以控制風(fēng)險(xiǎn)。業(yè)務(wù)運(yùn)維初期以人工接口的方式提供服務(wù),后期以web應(yīng)用的方式提供自助服務(wù)。如果后臺(tái)開(kāi)發(fā)人員做得比較完善可以直接提供web應(yīng)用提供自助服務(wù)。但是很多時(shí)候業(yè)務(wù)開(kāi)發(fā)部門的主要 KPI 不是提供運(yùn)維的方便性,所以使得業(yè)務(wù)運(yùn)維部門需要自己去開(kāi)發(fā)這些管理性質(zhì)的 web 應(yīng)用。
常規(guī)的新服務(wù)器上架版本發(fā)布都需要登錄權(quán)限,文件修改權(quán)限等幾乎不受限制的權(quán)限。運(yùn)維提供人工接口或者web應(yīng)用的方式把權(quán)限縮小之后對(duì)外提供服務(wù)。
操作安全可以量化為操作次數(shù)與操作引起的故障的比例關(guān)系。運(yùn)維部門初期以認(rèn)真仔細(xì)的工作態(tài)度提供高標(biāo)準(zhǔn)的操作服務(wù)。后期以高可重復(fù)性高一致性的自動(dòng)化系統(tǒng)提供安全保險(xiǎn),把每一次都不大一樣的人工操作變成每次執(zhí)行相同的腳本由計(jì)算機(jī)執(zhí)行。業(yè)務(wù)運(yùn)維售賣的是一種保險(xiǎn)服務(wù),其實(shí)質(zhì)和保險(xiǎn)公司一樣是以風(fēng)險(xiǎn)來(lái)核算成本的。
傳統(tǒng)的操作安全也存在兩點(diǎn)問(wèn)題:
即便是自動(dòng)化的腳本并不能帶來(lái)一致性的保障。因?yàn)槊看螆?zhí)行自動(dòng)化腳本都可能對(duì)現(xiàn)網(wǎng)狀態(tài)產(chǎn)生影響,人工的手工操作會(huì)使之雪上加霜。實(shí)際上每次自動(dòng)化執(zhí)行之前的現(xiàn)網(wǎng)狀態(tài)都可能不同,結(jié)果是一臺(tái)服務(wù)器使用的時(shí)間越久運(yùn)維風(fēng)險(xiǎn)越高。
版本交付方式的多樣化,操作現(xiàn)網(wǎng)環(huán)境的多樣化極大地提高了風(fēng)險(xiǎn)系數(shù)。通過(guò)標(biāo)準(zhǔn)化版本交付方式,標(biāo)準(zhǔn)化進(jìn)程和服務(wù)起停與依賴管理方式可以用一套自動(dòng)化系統(tǒng)對(duì)接各種差異化的應(yīng)用,減少中間的膠水腳本帶來(lái)的操作安全隱患。攜程出的運(yùn)維事故說(shuō)明了其操作安全是沒(méi)有保障的。當(dāng)我們把一個(gè)數(shù)據(jù)中心上的硬盤整體格式化之后,其上的應(yīng)用多久可以恢復(fù)很好的度量了操作方面的水平。
低風(fēng)險(xiǎn)的操作是頻繁變更的前提,也是提高業(yè)務(wù)敏捷性的前提。
提供操作的可擴(kuò)展性可以迅速地完成跨數(shù)據(jù)中心海量 IP 的操作變更
操作的完成速度是頻繁變更的前提,也是提高業(yè)務(wù)敏捷性的前提。
與權(quán)限收歸性質(zhì)的后臺(tái) web 應(yīng)用類似。理論上來(lái)說(shuō)后臺(tái)開(kāi)發(fā)會(huì)提供一些管理類的界面去查看業(yè)務(wù)的運(yùn)營(yíng)指標(biāo),以及程序和資源效率方面的監(jiān)控指標(biāo)。但是因?yàn)闃I(yè)務(wù)部門的 KPI 是以收入為導(dǎo)向的。很多運(yùn)營(yíng)決策用的指標(biāo),性能調(diào)優(yōu)性質(zhì)的指標(biāo),故障判別類的指標(biāo)都需要由業(yè)務(wù)運(yùn)維部門來(lái)采集展示和告警。
屏蔽資源的部署細(xì)節(jié)從 IDC 選址,專線規(guī)劃到給進(jìn)程配置文件配置 IP 地址。讓開(kāi)發(fā)人員關(guān)心邏輯與邏輯拓?fù)洌帘瘟瞬渴鸺?xì)節(jié),減少了開(kāi)發(fā)的工作量。讓昂貴的專業(yè)開(kāi)發(fā)人員專注于更有價(jià)值的事情上。
靜態(tài)資源調(diào)平利用虛擬機(jī),container,同機(jī)部署多個(gè)進(jìn)程等各種手段提高主機(jī)的利用率。合理規(guī)劃?rùn)C(jī)架和出口分布,提高網(wǎng)絡(luò)的利用率。
靜態(tài)資源調(diào)平主要靠?jī)?yōu)化部署來(lái)完成。兩次調(diào)平之間一般需要調(diào)用比較慢的重部署流程(比如ssh執(zhí)行腳本起停進(jìn)程等),甚至可能包含人工操作環(huán)節(jié)。
靜態(tài)資源調(diào)平的顆粒度是 IP。
動(dòng)態(tài)資源調(diào)平一般說(shuō)法是動(dòng)態(tài)擴(kuò)所容。和靜態(tài)資源調(diào)平的主要的區(qū)別是一般不以部署流程去調(diào)平資源,而是以更快的調(diào)整負(fù)載均衡,起停進(jìn)程的方式完成,完全不能包含人工操作環(huán)節(jié)。
動(dòng)態(tài)資源調(diào)平要求運(yùn)維必須從 IP 級(jí)別的管理水平提高的到進(jìn)程和服務(wù)級(jí)別。
大部分時(shí)候業(yè)務(wù)都會(huì)提供高可用的系統(tǒng)。運(yùn)維僅需要在故障之后,對(duì)故障機(jī)做重啟或者下架替換等善后操作。有的時(shí)候,運(yùn)維需要以冷備和自動(dòng)切換的方式提供等級(jí)弱一個(gè)級(jí)別的可用性保障。
故障處理時(shí),運(yùn)維需要進(jìn)程初步的故障定位。進(jìn)程和服務(wù)的依賴管理可以幫助運(yùn)維定位到問(wèn)題。
以 mesosphere 和 hashicorp 等新一代創(chuàng)業(yè)公司為代表,開(kāi)始提出數(shù)據(jù)中心操作系統(tǒng)(DCOS)的概念。實(shí)質(zhì)上是復(fù)制了 google/twitter 等大公司的標(biāo)準(zhǔn)化運(yùn)維系統(tǒng)。
數(shù)據(jù)中心操作系統(tǒng)(DCOS) 提供方的愿景是提供一個(gè)通用的標(biāo)準(zhǔn)化運(yùn)維系統(tǒng)高效率可靠安全地管理數(shù)據(jù)中心。直接與開(kāi)發(fā)方對(duì)接,以 docker 容器等標(biāo)準(zhǔn)化的方式交付版本,以進(jìn)程和服務(wù)描述的方式標(biāo)準(zhǔn)化搭建進(jìn)程和服務(wù)。數(shù)據(jù)中心操作系統(tǒng)與開(kāi)發(fā)方有一個(gè)非常清晰和低成本的接入接口,完全省去了運(yùn)維這個(gè)角色寫膠水腳本的必要性,從而徹底顛覆這個(gè)崗位。
運(yùn)維目前需要開(kāi)發(fā)的操作和監(jiān)控類的 web 應(yīng)用不再需要定制開(kāi)發(fā),數(shù)據(jù)中心操作系統(tǒng)(DCOS)提供可定制的操作和監(jiān)控模塊,只需要配置就可以接入,形成 web 應(yīng)用,不需要代碼開(kāi)發(fā)。
當(dāng)一家DCOS的產(chǎn)品公司可以低成本的與各種中小開(kāi)發(fā)商對(duì)接之后,中小開(kāi)發(fā)商可以大幅裁剪運(yùn)維部門。而DCOS公司可以獲得可觀的經(jīng)濟(jì)收益,從而進(jìn)一步地開(kāi)發(fā)更完善的產(chǎn)品。DCOS實(shí)現(xiàn)的技術(shù)關(guān)鍵在于,docker的標(biāo)準(zhǔn)化版本交付技術(shù),smartstack為代表的路由托管技術(shù)使得不標(biāo)準(zhǔn)業(yè)務(wù)改造為標(biāo)準(zhǔn)業(yè)務(wù)的成本急劇降低。
puppet/chef 是讓運(yùn)維寫腳本編程寫cookbook。而DCOS則可能直接讓寫腳本地這個(gè)膠水崗位消亡。DCOS顯然比 puppet/chef 等公司更具有顛覆性。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/7935.html
摘要:之前寫了一個(gè)版本,不夠簡(jiǎn)練業(yè)務(wù)運(yùn)維部門有四個(gè)方面的崗位價(jià)值,按照實(shí)現(xiàn)的難易程度排序效率質(zhì)量成本安全效率這是最容易實(shí)現(xiàn),也是能夠輸出最大的價(jià)值地方。總結(jié)越關(guān)鍵的業(yè)務(wù)停機(jī)的單位損失越大越可以體現(xiàn)運(yùn)維的價(jià)值。 http://segmentfault.com/a/1190000002890102 之前寫了一個(gè)版本,不夠簡(jiǎn)練 業(yè)務(wù)運(yùn)維部門有四個(gè)方面的崗位價(jià)值,按照實(shí)現(xiàn)的難易程度排序 效率 ...
摘要:分享實(shí)錄云計(jì)算技術(shù)源于互聯(lián)網(wǎng)公司,現(xiàn)在云計(jì)算已經(jīng)是下一代企業(yè)級(jí)的發(fā)展趨勢(shì)。如何做云計(jì)算一直是云計(jì)算技術(shù)的領(lǐng)導(dǎo)者。互聯(lián)網(wǎng)公司的快速發(fā)展,已經(jīng)印證了云計(jì)算技術(shù)和云原生應(yīng)用相比傳統(tǒng)構(gòu)架的巨大優(yōu)勢(shì)。 今天小數(shù)又給大家?guī)?lái)一篇干貨滿滿的分享——來(lái)自KVM社區(qū)線上群分享的實(shí)錄,分享嘉賓是數(shù)人云CEO王璞,題目是《云計(jì)算與 Cloud Native》。這是數(shù)人云在KVM社區(qū)群分享的第一彈,之后還有數(shù)...
摘要:此文已由作者劉超授權(quán)網(wǎng)易云社區(qū)發(fā)布。所以當(dāng)我們?cè)u(píng)估大數(shù)據(jù)平臺(tái)牛不牛的時(shí)候,往往以單位時(shí)間內(nèi)跑的任務(wù)數(shù)目以及能夠處理的數(shù)據(jù)量來(lái)衡量。的問(wèn)題調(diào)度在大數(shù)據(jù)領(lǐng)域是核心中的核心,在容器平臺(tái)中是重要的,但不是全部。 此文已由作者劉超授權(quán)網(wǎng)易云社區(qū)發(fā)布。 歡迎訪問(wèn)網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運(yùn)營(yíng)經(jīng)驗(yàn) 最近總在思考,為什么在支撐容器平臺(tái)和微服務(wù)的競(jìng)爭(zhēng)中,Kubernetes 會(huì)取得最終的勝出,事實(shí)...
摘要:降低對(duì)外包服務(wù)團(tuán)隊(duì)的依賴,提高業(yè)務(wù)的敏捷性研發(fā)部門實(shí)現(xiàn)測(cè)試環(huán)境自動(dòng)創(chuàng)建配置和郵件通知,滿足持續(xù)集成和持續(xù)交付的要求,可自動(dòng)并快速獲得基礎(chǔ)架構(gòu)應(yīng)用配置和代碼等各個(gè)關(guān)鍵環(huán)節(jié)的反饋。 2016年對(duì)Rancher Labs而言是太重要也太精彩的一年 Rancher 1.0,Rancher 1.1,Rancher 1.2三次重大的版本發(fā)布與更新Rancher的累積下載量已達(dá)1600萬(wàn) 在中國(guó)海航...
摘要:過(guò)去軟件時(shí)代是怎么回事一單品時(shí)代過(guò)去做標(biāo)準(zhǔn)軟件產(chǎn)品,而且是單部門單部門單崗位或單部門多崗位應(yīng)用,所以過(guò)去做軟件時(shí)分工特別簡(jiǎn)單總部研發(fā)軟件,然后構(gòu)建分銷網(wǎng)絡(luò),總部有專門的部門對(duì)分銷網(wǎng)絡(luò)進(jìn)行培訓(xùn)營(yíng)銷推廣管理與考核分銷網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單的培訓(xùn)簡(jiǎn)單的安裝(1)過(guò)去軟件時(shí)代是怎么回事 一、單品 IT時(shí)代 過(guò)去做標(biāo)準(zhǔn)軟件產(chǎn)品,而且是單部門(單部門單崗位或單部門多崗位)應(yīng)用,所以過(guò)去做軟件時(shí)分工特別...
閱讀 2529·2023-04-26 02:57
閱讀 1410·2023-04-25 21:40
閱讀 2173·2021-11-24 09:39
閱讀 3564·2021-08-30 09:49
閱讀 764·2019-08-30 15:54
閱讀 1172·2019-08-30 15:52
閱讀 2080·2019-08-30 15:44
閱讀 1278·2019-08-28 18:27