摘要:第二云平臺的可靠性云平臺就是在模擬數(shù)據(jù)中心傳統(tǒng)硬件和系統(tǒng)網(wǎng)絡(luò)架構(gòu),這三大塊可靠性都不太高。云平臺出故障了不主動通報,而是讓客戶自己猜。云平臺誤導(dǎo)了客戶的冗余策略,比如兩個可用區(qū)依賴同一個網(wǎng)絡(luò)出口或供電局。
前言 躲熱點真不容易
我不湊熱議性新聞的熱鬧,習(xí)慣按照自己的節(jié)奏發(fā)文章,但朋友圈里熱點尬聊看多了,我就有給潑一盆科普冷水的沖動。
最近云平臺故障挺多的,阿里云故障完了,我想等兩周再發(fā)本文,結(jié)果AWS美國掛了;AWS的熱議剛剛消停,企鵝家也遭災(zāi)了;現(xiàn)在又等了五天了,我覺得不算湊熱點了吧。
第一. ?這是新聞不是丑聞
當(dāng)某朵云故障時,我看到了太多從業(yè)者彈冠相慶,幻想著友商遭災(zāi)了就能白撿到個大單。但友商出故障這類事是新聞不是丑聞,客戶不會為一次故障而放棄現(xiàn)有供應(yīng)商。只有屌絲云備胎才幻想著情侶吵一架自己就能接盤。
這些年來,那么多數(shù)據(jù)中心都出過大量故障,有斷電的、挖斷光纜的、空調(diào)故障的、被封網(wǎng)的、DDOS打癱瘓的,有哪個IDC因為故障被迫退出市場的?高標(biāo)準(zhǔn)IDC的SLA標(biāo)準(zhǔn)是電力99.99%,網(wǎng)絡(luò)99.9%,斷網(wǎng)1分鐘IDC就會出故障報告,但斷網(wǎng)八個小時也不會賠客戶一分錢。客戶很著急也謾罵,但故障只要不頻繁發(fā)生誰敢觸發(fā)服務(wù)器遷移,大部分只能自認倒霉。
第二. ?云平臺的可靠性
IaaS云平臺就是在模擬數(shù)據(jù)中心、傳統(tǒng)硬件和系統(tǒng)網(wǎng)絡(luò)架構(gòu),這三大塊可靠性都不太高。云上虛擬資源因為可以靈活調(diào)度,可靠性稍微提升了一點點。云廠商的云主機和公網(wǎng)IP的SLA承諾是99.95%,但其可用性定義和賠償標(biāo)準(zhǔn)都比傳統(tǒng)IDC精明。
對于大型企業(yè)客戶來說,過去不信賴單一IDC,不依賴單臺服務(wù)器,不跪拜單個網(wǎng)絡(luò),現(xiàn)在也不相信單一云平臺可以做出100%的SLA承諾。
既然云平臺還會出故障,客戶就要做好多云采購和多云冗余,在技術(shù)實現(xiàn)上只會比多機房容災(zāi)更簡單——因為云廠商比IDC更能深度服務(wù)客戶。
第三. ?要尊重企業(yè)客戶
我在多篇文章中反復(fù)強調(diào),云平臺做不到100%高可用。我不介意說的刻薄露骨一點:
技術(shù)投機分子對個人站長和移動端開發(fā)者的欺騙該結(jié)束了,現(xiàn)在友商是系統(tǒng)架構(gòu)師,買主也是技術(shù)部負責(zé)人。
OpenStack等云技術(shù)的早期步道者,很多都是既不了解Dev也不深入OPS的“冒險家”,因為無知,所以無畏啊。
前幾年云用戶都是APP創(chuàng)業(yè)者,云廠商一口一個“開發(fā)者”叫的很甜蜜,但又不停的忽悠人家。現(xiàn)在的采購決策人是老牌技術(shù)總監(jiān)和架構(gòu)師,知道從硬件到應(yīng)用的一系列高可用該怎么定義怎么實現(xiàn)。
廠商最典型的就是各種吹9大賽,好多廠商都說產(chǎn)品的SLA是無數(shù)個“99.99999999...%”。
列這么多9到標(biāo)書上很浪費油墨的,不如解釋清楚服務(wù)可用性和數(shù)據(jù)持久性的區(qū)別。
這故障幾率比第三次世界大戰(zhàn)、恐龍復(fù)活、愛上外星人、宇宙湮滅的幾率都小了;我沒見過外星人,但云廠商故障見到一堆了。
對于企業(yè)客戶來說,單臺云主機的可用性到99.95%就超出期望值了,客戶自己會把到群集可用性提高到99.999%。
第四. ?無法忍受的服務(wù)態(tài)度
對于企業(yè)客戶來說,客觀技術(shù)故障是意料之中的,但涉及到服務(wù)部分就無法忍受了。
云平臺出故障了不主動通報,而是讓客戶自己猜。云服務(wù)有虛擬化層,如果只是緩慢不是中斷的故障該怎么猜?
對于故障時間、持續(xù)范圍、故障原因都說不清楚或刻意隱瞞,該認錯的時候不清晰,是想讓客戶技術(shù)團隊背鍋嗎?
客戶永遠看不到真實故障原因,但明顯的人為故障,明顯的資源不足,明顯的管理混亂,明顯的胡編亂造都在削弱客戶的信心。
云平臺誤導(dǎo)了客戶的冗余策略,比如兩個可用區(qū)依賴同一個網(wǎng)絡(luò)出口或供電局。
有些文盲寫出的報告在教育和指導(dǎo)客戶,商務(wù)語氣不對等,該擔(dān)責(zé)任時卻在甩鍋。
第五. ?危險背后總有新機遇
我一直很看好云計算這個行業(yè),縱然它雜草叢生野蠻生長,但也生機盎然活力無限。從云平臺的故障亂象,我們一樣能看到新機遇。
現(xiàn)在選購云平臺的決策人不會被苛責(zé),五年前業(yè)務(wù)系統(tǒng)上云出故障了,決策人是要承擔(dān)很重責(zé)任的,現(xiàn)在上不上云只是一種常規(guī)選型,不是技術(shù)冒險了。
多云冗余備份不僅僅是弱勢云廠商的機遇,也是客戶技術(shù)團隊的機遇。過去客戶要自己做應(yīng)用冗余備份,工作復(fù)雜責(zé)任也重大,現(xiàn)在只要預(yù)算不太低,客戶只做個心明眼亮的架構(gòu)師,臟活累活都是云廠商來做,遇到敬業(yè)的云廠商還能擔(dān)下大部分故障責(zé)任。
作者介紹:
曹亞孟,云計算老兵,擁有10+年運維工作經(jīng)驗,對主流運維技術(shù)都有所涉獵,先后就職于七牛云和百度。業(yè)內(nèi)罕見的全職業(yè)全履歷從業(yè)人員,會“做云”“用云”“賣云”“講解云”
聲明:文章收集于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系小編及時處理,謝謝!
歡迎加入本站公開興趣群
軟件開發(fā)技術(shù)群
興趣范圍包括:Java,C/C++,Python,PHP,Ruby,shell等各種語言開發(fā)經(jīng)驗交流,各種框架使用,外包項目機會,學(xué)習(xí)、培訓(xùn)、跳槽等交流
QQ群:26931708
Hadoop源代碼研究群
興趣范圍包括:Hadoop源代碼解讀,改進,優(yōu)化,分布式系統(tǒng)場景定制,與Hadoop有關(guān)的各種開源項目,總之就是玩轉(zhuǎn)Hadoop
QQ群:288410967?
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/3492.html
摘要:第二云平臺的可靠性云平臺就是在模擬數(shù)據(jù)中心傳統(tǒng)硬件和系統(tǒng)網(wǎng)絡(luò)架構(gòu),這三大塊可靠性都不太高。云平臺出故障了不主動通報,而是讓客戶自己猜。云平臺誤導(dǎo)了客戶的冗余策略,比如兩個可用區(qū)依賴同一個網(wǎng)絡(luò)出口或供電局。前言 躲熱點真不容易 我不湊熱議性新聞的熱鬧,習(xí)慣按照自己的節(jié)奏發(fā)文章,但朋友圈里熱點尬聊看多了,我就有給潑一盆科普冷水的沖動。 最近云平臺故障挺多的,阿里云故障完了,我想等兩周...
摘要:本文轉(zhuǎn)載自眾成翻譯譯者文藺鏈接原文譯者注本文講到的可能和我們通常理解的略有差異。文中部分主要講到的是,這一點可能在一些開發(fā)者看來是有爭議的。談到,最好也是最簡單的辦法是使用免費開源的框架。需要快速開發(fā)打樣那可能最好的選擇。 本文轉(zhuǎn)載自:眾成翻譯譯者:文藺鏈接:http://www.zcfy.cc/article/861原文:http://www.telerik.com/blogs/h...
閱讀 3384·2021-11-24 09:38
閱讀 1384·2021-11-22 15:08
閱讀 1453·2021-09-29 09:35
閱讀 474·2021-09-02 15:11
閱讀 1303·2019-08-30 12:55
閱讀 383·2019-08-29 17:16
閱讀 491·2019-08-29 11:30
閱讀 415·2019-08-26 13:23