摘要:靈活查詢,聚合分組并存除開(kāi)單純的聚合和分組,還支持聚合和分組的復(fù)合查詢。所以,與會(huì)聚合為一條曲線,而和的關(guān)系則是分組的關(guān)系。當(dāng)然,的功能在未來(lái),還遠(yuǎn)遠(yuǎn)不止這些,高效運(yùn)維的時(shí)代才剛剛開(kāi)啟。
運(yùn)維 2.0 時(shí)代
運(yùn)維 2.0 是指,從技術(shù)運(yùn)維升級(jí)為服務(wù)運(yùn)維,向公司提供可依賴(lài)的專(zhuān)業(yè)服務(wù)。運(yùn)維 2.0 強(qiáng)調(diào)服務(wù)交付能力,而不是技術(shù)能力,需求可依賴(lài)、懂業(yè)務(wù)、服務(wù)化的專(zhuān)業(yè)運(yùn)維。
為了了解運(yùn)維 2.0 時(shí)代的監(jiān)控方式,我們不妨從以前的監(jiān)控手段說(shuō)起。首先來(lái)了解一下 Zabbix ,通過(guò) Zabbix 能夠監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng);并提供靈活的通知機(jī)制以讓系統(tǒng)管理員快速定位和解決存在的各種問(wèn)題。但時(shí)代在推進(jìn),如今 Zabbix 的功能真的就能滿足廣大開(kāi)發(fā)者們么?
如果你是阿里云的用戶,或者使用過(guò) Zabbix,你將明顯感受到一個(gè)痛點(diǎn):沒(méi)有辦法對(duì)數(shù)據(jù)做聚合,只能挨個(gè)查看主機(jī)的性能指標(biāo),更不用說(shuō)有管理的功能了。
如上圖,Zabbix 只提供單臺(tái) Host 的 Disk 使用量。如果 3 臺(tái)主機(jī),同屬于一個(gè)組 Mi-Kafka,就沒(méi)法知道這個(gè)組總體 Disk 使用量了。
因此,就算線上系統(tǒng)發(fā)生了故障,要在短期內(nèi)知道,到底是哪個(gè)模塊的哪個(gè)部分出了什么樣的問(wèn)題,所需要的經(jīng)驗(yàn)和時(shí)長(zhǎng)都是巨大的。
而 OpenTSDB 和 StatsD 的出現(xiàn)改變了現(xiàn)狀。
OpenTSDB 是什么呢,一個(gè)開(kāi)源監(jiān)控系統(tǒng),可以從大規(guī)模的集群(包括集群中的網(wǎng)絡(luò)設(shè)備、操作系統(tǒng)、應(yīng)用程序)中獲取相應(yīng)的 Metrics 同時(shí)進(jìn)行存儲(chǔ)、索引以及服務(wù),從而使得這些數(shù)據(jù)更容易讓人理解。
集群監(jiān)控如今越來(lái)越多的企業(yè)開(kāi)始使用混合云模式,來(lái)建設(shè)數(shù)據(jù)中心。私有云和公有云,以及集群系統(tǒng),讓監(jiān)控工作變得異常復(fù)雜。所以,以下幾個(gè)方面在運(yùn)維監(jiān)控中顯得尤為重要:
性能指標(biāo)的采集的輕量化;
性能指標(biāo)能夠集中在一個(gè)平臺(tái)進(jìn)行管理和可視化;
能夠?qū)π阅苤笜?biāo)進(jìn)行靈活的組合和計(jì)算。
打個(gè)簡(jiǎn)單的比方,一家廣告監(jiān)控平臺(tái)購(gòu)買(mǎi) AWS 的 50 臺(tái) EC2 來(lái)進(jìn)行數(shù)據(jù)的采集,而數(shù)據(jù)分析則是本地的 10 臺(tái)服務(wù)器來(lái)支持。
如果還在使用傳統(tǒng)運(yùn)維工具 Zabbix,這時(shí)候就會(huì)遇到一個(gè)問(wèn)題,AWS 控制臺(tái)可以看到這 50 臺(tái)的監(jiān)控指標(biāo)。也就意味著,運(yùn)維工程師需要使用 Zabbix 和 AWS 控制臺(tái)來(lái)同時(shí)管理監(jiān)控?cái)?shù)據(jù)。
同時(shí)關(guān)注多集群中多個(gè)節(jié)點(diǎn)的運(yùn)行情況,以及需要查看不同中間件的指標(biāo)來(lái)發(fā)現(xiàn)問(wèn)題,或者想要通過(guò) Zabbix 集成短信報(bào)警渠道,這些讓運(yùn)維工作變得不堪重負(fù)。
而在非常早期的時(shí)候,淘寶團(tuán)隊(duì)就引入了 OpenTSDB 來(lái)輔助他們的運(yùn)維監(jiān)控。
隨后的幾年,云計(jì)算和 SaaS 的興起,國(guó)外也出現(xiàn)了多種采用 StatsD 和 OpenTSDB 的開(kāi)源工具搭建的 SaaS 服務(wù):Boundary、CopperEgg、Datadog 等等。
他們都不約而同地采用了同一種產(chǎn)品邏輯,也是 Cloud Insight 的產(chǎn)品邏輯————時(shí)間序列數(shù)據(jù)庫(kù)的邏輯。
任何的性能指標(biāo),都作為時(shí)間序列數(shù)據(jù)被采集和處理;
任何的 Host 等歸屬于性能指標(biāo)的屬性,都作為指標(biāo)的標(biāo)簽信息。
而在產(chǎn)品邏輯上,則表現(xiàn)為:
Cloud Insight運(yùn)維 2.0 時(shí)代有一款有趣的監(jiān)控產(chǎn)品——Cloud Insight,它支持多種操作系統(tǒng)、云主機(jī)、數(shù)據(jù)庫(kù)和中間件的監(jiān)控,通過(guò)標(biāo)簽,對(duì)基礎(chǔ)設(shè)施進(jìn)行有效地管理,讓您輕松應(yīng)對(duì)復(fù)雜的基礎(chǔ)設(shè)施架構(gòu)。來(lái)幫助所有的 IT 公司,減少在系統(tǒng)監(jiān)控上的人力和時(shí)間成本投入,讓運(yùn)維工作變得更加高效、簡(jiǎn)單。
視角決定高度,在此基礎(chǔ)之上,Cloud Insight 還能夠?qū)?shù)據(jù)指標(biāo)進(jìn)行聚合、分組、過(guò)濾、管理、計(jì)算;并提供團(tuán)隊(duì)協(xié)作功能,共同管理數(shù)據(jù)和報(bào)警事件。所以,Cloud Insight 也是一個(gè)數(shù)據(jù)管理平臺(tái),幫助企業(yè)內(nèi)部加強(qiáng)溝通和協(xié)作,填補(bǔ)部門(mén)間、人員間、技能間的溝通鴻溝。
Cloud Insight 通過(guò) 3 個(gè)步驟深入操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件,以及未來(lái)通過(guò) Developer API 對(duì)接進(jìn)來(lái)的所有 Metric 進(jìn)行處理:
Cloud Insight Agent 采集并處理 Metric;
在平臺(tái)服務(wù)儀表盤(pán)和自定義儀表盤(pán)中,提供 Metric 聚合、分組、統(tǒng)計(jì)運(yùn)算、基本數(shù)學(xué)運(yùn)算等操作;
針對(duì)操作的結(jié)果,提供曲線圖、柱狀圖等多樣化的展現(xiàn)形式。
Cloud Insight 的神奇功能自定義儀表盤(pán)
數(shù)據(jù)聚合
遙想 2015 年 8 月 17 日,Cloud Insight 還在梳理功能原型,暢想 Cloud Insight 存在的意義,而一轉(zhuǎn)眼,我們已經(jīng)實(shí)現(xiàn)了很有意思的功能:
自定義儀表盤(pán)
Cloud Insight 已經(jīng)可以自定義儀表盤(pán)了,除了在數(shù)據(jù)展現(xiàn)上清晰直觀,它還擁有一個(gè)炫酷的本事:隨意拖拽。
使用標(biāo)簽來(lái)實(shí)現(xiàn)數(shù)據(jù)聚合&分組
在 Beta v 0.2.1 中,我們實(shí)現(xiàn)了數(shù)據(jù)的聚合和分組。沿襲了 OpenTSDB 的查詢方式:用一種類(lèi) SQL 的方式來(lái)查詢指標(biāo)。
具體操作可以訪問(wèn) Cloud Insight 文檔中心 ? Metric 查詢。
Cloud Insight 還支持類(lèi)似 SQL 的 group_by 查詢語(yǔ)法。這個(gè)在查看多個(gè)磁盤(pán)分區(qū)的容量和Docker 中不同 Container 的性能消耗時(shí)都是非常有用的。
例子舉例,如果我們想要看每個(gè) host 的 CPU 空閑率:
avg: system.cpu.idle {} by {host}
此時(shí),第一個(gè) {FromTag} 缺省代表從所有 Metrics 中查詢數(shù)據(jù)。如圖所示,得到以下圖表:
在實(shí)際的測(cè)試環(huán)境中,由于我們有 6 臺(tái)測(cè)試主機(jī),所以會(huì)得到如下的曲線。并且,當(dāng)鼠標(biāo)懸停至曲線時(shí),下方的懸停窗口會(huì)分別顯示 6 臺(tái)主機(jī)的 system.cpu.idle。
靈活查詢,聚合&分組并存除開(kāi)單純的聚合和分組,Cloud Insight 還支持聚合和分組的復(fù)合查詢。如:
avg: system.cpu.idle {} by {owner}
此時(shí),雖然有 3 個(gè) host,但是分組是以 owner 來(lái)進(jìn)行的。所以,A 與 B 會(huì)聚合為一條曲線,而 C 和 A&B 的關(guān)系則是分組的關(guān)系。
當(dāng)然,Cloud Insight 的功能在未來(lái),還遠(yuǎn)遠(yuǎn)不止這些,高效運(yùn)維的時(shí)代才剛剛開(kāi)啟。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/7947.html
摘要:而今,我們就已經(jīng)實(shí)現(xiàn)了這樣的功能使用標(biāo)簽來(lái)實(shí)現(xiàn)數(shù)據(jù)的聚合和分組。數(shù)據(jù)聚合和分組在中,我們實(shí)現(xiàn)了數(shù)據(jù)的聚合和分組。指所需聚合的的查詢條件。所以,與會(huì)聚合為一條曲線,而和的關(guān)系是分組的關(guān)系。 遙想 2015 年 8 月 17 日,Cloud Insight 還在梳理功能原型,暢想 Cloud Insight 存在的意義:為什么阿里云用戶需要使用 Cloud Insight 來(lái)加強(qiáng)管理。 而...
摘要:應(yīng)用的研發(fā)上線運(yùn)維運(yùn)營(yíng)形成閉環(huán),順利完成從對(duì)內(nèi)服務(wù)到公共平臺(tái)的升級(jí)。從功能角度,只能支持靜態(tài)方式設(shè)置反向代理,然后,而平臺(tái)有服務(wù)對(duì)應(yīng)的后端服務(wù)和端口是有動(dòng)態(tài)調(diào)整需求。架構(gòu)上是基礎(chǔ)組件需要進(jìn)行升級(jí),數(shù)據(jù)訪問(wèn)層日志監(jiān)控系統(tǒng)等。 介紹 ? ? ? ?MaxLeap早期是一家研發(fā)、運(yùn)營(yíng)移動(dòng)應(yīng)用和手機(jī)游戲公司,發(fā)展過(guò)程中積累了很多通用組件。這些組件很大程度幫公司在移動(dòng)研發(fā)過(guò)程中節(jié)省了時(shí)間和成本,...
摘要:華為云華為云在云原生這場(chǎng)游戲中,最具競(jìng)爭(zhēng)力的玩家之一。年,金山云在云原生領(lǐng)域推出了三款重磅產(chǎn)品星曜裸金屬服務(wù)器云服務(wù)器和云盤(pán)。在線上智博會(huì)上,浪潮云發(fā)布了經(jīng)過(guò)全新迭代升級(jí)的浪潮云,進(jìn)一步提升平臺(tái)云原生服務(wù)能力。面對(duì)數(shù)字時(shí)代復(fù)雜系統(tǒng)的不確定性,傳統(tǒng)的 IT 應(yīng)用架構(gòu)研發(fā)交付周期長(zhǎng)、維護(hù)成本高、創(chuàng)新升級(jí)難,煙囪式架構(gòu),開(kāi)放性差、組件復(fù)用度低,這些都成為了企業(yè)業(yè)務(wù)快速增長(zhǎng)的瓶頸。而云原生以其敏捷、...
摘要:月日,首期沙龍海量運(yùn)維實(shí)踐大曝光在騰訊大廈圓滿舉行。六總結(jié)相關(guān)文章騰訊云運(yùn)維干貨沙龍海量運(yùn)維實(shí)踐大曝光二騰訊云運(yùn)維干貨沙龍海量運(yùn)維實(shí)踐大曝光三沙龍下載地址 作者丨郭智文:騰訊高級(jí)工程師,手機(jī)QQ運(yùn)維負(fù)責(zé)人。多年來(lái),對(duì)移動(dòng)互聯(lián)網(wǎng)應(yīng)用的接入質(zhì)量度量、優(yōu)化有豐富的實(shí)踐經(jīng)驗(yàn),專(zhuān)注于業(yè)務(wù)架構(gòu)優(yōu)化、彈性伸縮、運(yùn)營(yíng)服務(wù)管理、幫助產(chǎn)品打造極致的技術(shù)基礎(chǔ)和質(zhì)量口碑。 12月16日,首期沙龍海量運(yùn)維實(shí)踐大...
閱讀 845·2019-08-30 15:54
閱讀 3316·2019-08-29 15:33
閱讀 2701·2019-08-29 13:48
閱讀 1213·2019-08-26 18:26
閱讀 3333·2019-08-26 13:55
閱讀 1476·2019-08-26 10:45
閱讀 1164·2019-08-26 10:19
閱讀 305·2019-08-26 10:16