摘要:一大數(shù)據(jù)平臺(tái)介紹大數(shù)據(jù)平臺(tái)架構(gòu)演變?nèi)鐖D所示魅族大數(shù)據(jù)平臺(tái)架構(gòu)演變歷程年底,我們開始實(shí)踐大數(shù)據(jù),并部署了測(cè)試集群。因此,大數(shù)據(jù)運(yùn)維的目標(biāo)是以解決運(yùn)維復(fù)雜度的自動(dòng)化為首要目標(biāo)。大數(shù)據(jù)運(yùn)維存在的問題大數(shù)據(jù)運(yùn)維存在的問題包括部署及運(yùn)維復(fù)雜。
一、大數(shù)據(jù)平臺(tái)介紹
1.1大數(shù)據(jù)平臺(tái)架構(gòu)演變
?
如圖所示魅族大數(shù)據(jù)平臺(tái)架構(gòu)演變歷程:
2013年底,我們開始實(shí)踐大數(shù)據(jù),并部署了測(cè)試集群。當(dāng)時(shí)只有三個(gè)節(jié)點(diǎn),因?yàn)槲覀兤鸩奖容^晚,沒有趕上Hadoop1.0,直接是用YARN來跑的大數(shù)據(jù)集群,而且默認(rèn)就上了HA功能;
2014年9月節(jié)點(diǎn)增加到20個(gè),數(shù)據(jù)日增30GB;
2015年6月上線Spark和Hbase,同時(shí)節(jié)點(diǎn)達(dá)到100個(gè),數(shù)據(jù)日增10T;
2016年5月實(shí)現(xiàn)數(shù)據(jù)異地災(zāi)備;
現(xiàn)在我們主要在做大數(shù)據(jù)安全方面,包括用戶認(rèn)證和授權(quán)。目前規(guī)模已達(dá)到近千臺(tái)服務(wù)器,存儲(chǔ)30PB,日增60TB,每天跑2萬個(gè)計(jì)算任務(wù),業(yè)務(wù)包括搜索、廣告、推薦、統(tǒng)計(jì)分析、用戶畫像、崩潰跟蹤等等,今年還準(zhǔn)備上線一個(gè)新機(jī)房,專門用來跑大數(shù)據(jù)業(yè)務(wù)。屆時(shí)節(jié)點(diǎn)將達(dá)到2000個(gè)以上。
?
上圖展示的是魅族大數(shù)據(jù)的整體架構(gòu),組件很多,組件之間相互關(guān)聯(lián),提供的應(yīng)用也很多。
1.2 大數(shù)據(jù)運(yùn)維的挑戰(zhàn)
運(yùn)維這樣一個(gè)大規(guī)模的平臺(tái)要面對(duì)哪些挑戰(zhàn)呢?
首先來看大數(shù)據(jù)運(yùn)維的特點(diǎn)。
l?集群規(guī)模、數(shù)據(jù)量大,且爆發(fā)式增長(zhǎng)。大數(shù)據(jù)從字面上理解就是“大”,數(shù)據(jù)量大、規(guī)模大,而且是爆發(fā)式增長(zhǎng)。
l?組件多,相互關(guān)聯(lián),關(guān)系復(fù)雜。
l?組件批量部署、上下線。部署上線的時(shí)候一般都是批量進(jìn)行的,如果用傳統(tǒng)方式(比如腳本工具)操作的話效率非常低,且容易出現(xiàn)問題。
大數(shù)據(jù)運(yùn)維的特點(diǎn)決定了大數(shù)據(jù)運(yùn)維的核心問題主要體現(xiàn)在兩個(gè)方面:
l?一是如何管理好如何大規(guī)模的集群;
l?二是如何為用戶提供高質(zhì)量的服務(wù)。
因此,大數(shù)據(jù)運(yùn)維的目標(biāo)是:
l?以解決運(yùn)維復(fù)雜度的自動(dòng)化為首要目標(biāo)。自動(dòng)化能夠提升穩(wěn)定性,機(jī)器的操作比人要靠譜,固化的操作交給機(jī)器去做,可以降低人為造成的一些錯(cuò)誤,提高線上的穩(wěn)定性;;另一方面,自動(dòng)化能夠提高效率,把大部分操作交給機(jī)器之后,把運(yùn)維人員從日常繁瑣的操作中解放出來,我們就有更多的時(shí)間完成更加有意義、有價(jià)值的事情。
l?以預(yù)測(cè)和自動(dòng)決策為目標(biāo)的智能化。大數(shù)據(jù)運(yùn)維的趨勢(shì)正在從以解決運(yùn)維復(fù)雜度為目標(biāo)的自動(dòng)化,向以預(yù)測(cè)和自動(dòng)決策為目標(biāo)的智能化轉(zhuǎn)變,所以我們先要做好自動(dòng)化才可以擁抱智能化。
1.3大數(shù)據(jù)運(yùn)維存在的問題
?
大數(shù)據(jù)運(yùn)維存在的問題包括:
l?部署及運(yùn)維復(fù)雜。
l?重復(fù)監(jiān)控、重復(fù)告警、監(jiān)控分散。
l?權(quán)限控制、安全審計(jì)、任意跑任務(wù)。我們沒有對(duì)用戶的權(quán)限進(jìn)行限制,一個(gè)用戶拿一個(gè)賬號(hào)就可以訪問整個(gè)集群的數(shù)據(jù),安全審計(jì)方面我們無法得知該用戶是否訪問敏感數(shù)據(jù)。另外,在Hadoop官網(wǎng)上也沒有完善的用戶管理體系和開箱即用的安全設(shè)置,需要我們摸索和實(shí)踐。
l?無法查詢業(yè)務(wù)資源使用、任意申請(qǐng)資源。在資源使用上,我們不知道業(yè)務(wù)每天用了多少存儲(chǔ)、多少計(jì)算資源,業(yè)務(wù)要擴(kuò)容也只是口頭說資源不夠了,而且運(yùn)維他也沒有足夠的理由不給。
二、大數(shù)據(jù)運(yùn)維平臺(tái)建設(shè)
2.1 平臺(tái)選型
?
首先要選擇一個(gè)適合自己需求的平臺(tái)進(jìn)行開發(fā)。現(xiàn)在比較有代表性的平臺(tái)選型是Cloudera和Hortonworks,當(dāng)然我們也可以自己進(jìn)行組件開發(fā)。基于公司的現(xiàn)狀,用商業(yè)產(chǎn)品成本太大,完全照搬開源產(chǎn)品又不能滿足我們的需求。
?
對(duì)比來看商業(yè)化產(chǎn)品和開源產(chǎn)品:
l?商業(yè)化產(chǎn)品,優(yōu)點(diǎn)是安裝部署非常簡(jiǎn)單,界面功能齊全;缺點(diǎn)是更新比較慢,因?yàn)樗欠情_源的,我們無法對(duì)其進(jìn)行優(yōu)化,而且一般商業(yè)化產(chǎn)品占用系統(tǒng)資源也比較高。
l?開源產(chǎn)品,優(yōu)點(diǎn)是非常開放、自由,有強(qiáng)大的社區(qū)支持,安裝部署方便;缺點(diǎn)是穩(wěn)定性比較差,功能比較固定。
l?還有第三種選擇,就是自研,我們獨(dú)立研發(fā)產(chǎn)品,這樣就可以實(shí)現(xiàn)定制化,功能靈活豐富,但同樣存在缺點(diǎn):耗時(shí)耗力,研發(fā)成本非常高。
我們的做法是集中三者的優(yōu)點(diǎn),在投入較低成本的情況下,獲得功能豐富、可定制化、穩(wěn)定迭代的管理平臺(tái),在出現(xiàn)問題的時(shí)候我們又可以依靠強(qiáng)大的社區(qū)得到快速解決。
2.2組件版本選型
?
基于業(yè)務(wù)發(fā)展需求,以及考慮到組件本身的穩(wěn)定性和安全性,我們需要在不同階段對(duì)組件的版本進(jìn)行迭代和微調(diào),由此可見商業(yè)方案和開源方案是走不通的,這些方案的版本都比較固定。
2.3運(yùn)維規(guī)范制定
?
在平臺(tái)化建設(shè)之前,我們做了很多技術(shù)規(guī)范,通過標(biāo)準(zhǔn)化來規(guī)范運(yùn)維操作,平臺(tái)化來落地標(biāo)準(zhǔn)化。
l?系統(tǒng)規(guī)范,主要是約束系統(tǒng)的版本、內(nèi)核、系統(tǒng)賬號(hào)等;
l?部署規(guī)范,主要是約束組件的版本、配置等;
l?擴(kuò)容和升級(jí)規(guī)范,主要是用來制定擴(kuò)容的窗口期等;
l?任務(wù)運(yùn)行規(guī)范,比如說一個(gè)任務(wù)不能一天24小時(shí)跑下去;
l?監(jiān)控標(biāo)準(zhǔn),我們盡可能的避免規(guī)范造成的事故。
我們通過制定規(guī)范來約束人員操作,最大限度避免因不規(guī)范造成的運(yùn)維事故。
2.4平臺(tái)建設(shè)歷程
?
上圖是我們整個(gè)平臺(tái)建設(shè)的歷程。
l?首先通過平臺(tái)將固化操作自動(dòng)化,并通過平臺(tái)化落地規(guī)范。
l?然后是建立統(tǒng)一的監(jiān)控與告警平臺(tái)。
l?第三是建立全面的安全防護(hù)。
l?最后是實(shí)現(xiàn)資源使用可視化、成本化。
2.4.1 平臺(tái)化、自動(dòng)化
如圖,以一個(gè)集群的生命周期展示大數(shù)據(jù)運(yùn)維是如何做到平臺(tái)化和自動(dòng)化的。
裝機(jī)平臺(tái)&云平臺(tái)?
第一步是初始化,也就是系統(tǒng)的安裝。根據(jù)機(jī)器的不同,分為物理機(jī)和虛擬機(jī)。物理機(jī)有裝機(jī)平臺(tái),在平臺(tái)上可以批量安裝物理機(jī)操作系統(tǒng),規(guī)范系統(tǒng)版本和賬號(hào)。虛擬機(jī)也有云平臺(tái),可以批量創(chuàng)建并初始化云主機(jī),可用于跑一些臨時(shí)任務(wù)或?qū)嶒?yàn)性的集群。
集群管理
集群管理方面,之前說到的商業(yè)化產(chǎn)品也好,開源產(chǎn)品也好,一般都是針對(duì)單個(gè)集群來進(jìn)行管理的。如果有多個(gè)集群,就必須部署多套平臺(tái)來進(jìn)行管理,這在一定程度上增加了運(yùn)維的復(fù)雜度。
?
我們的做法是將多套集群統(tǒng)一管理起來,它們又擁有各自獨(dú)立的空間互不干擾。在產(chǎn)品層面上實(shí)現(xiàn)前群分組管理,降低了運(yùn)維難度,提高了運(yùn)維效率。
主機(jī)管理
在平臺(tái)上可以查看主機(jī)狀態(tài)、過濾主機(jī)列表、執(zhí)行主機(jī)級(jí)操作,比如為一些主機(jī)進(jìn)行開關(guān)機(jī)操作,還可以刪除主機(jī)、添加主機(jī)做機(jī)架管理、機(jī)架展示等。
?
主機(jī)列表
在主機(jī)列表頁面,可以方便地看到主機(jī)詳情和組件狀況,健康狀態(tài)、使用狀態(tài),包括CPU、內(nèi)存、磁盤等方面的情況。
?
主機(jī)的健康狀態(tài)主要分為四種,如果圖標(biāo)是紅色,表示主機(jī)上至少有一個(gè)master組件掛掉了;橙色表示至少有一個(gè)Stave組件是掛掉的;黃色表示主機(jī)三分鐘沒有上報(bào)心跳了;藍(lán)色則表示主機(jī)運(yùn)行狀態(tài)正常。
組件運(yùn)維
在組件運(yùn)維方面,可以看到所有的組件概述和狀態(tài),也可以實(shí)施組件級(jí)別的啟停操作、添加刪除組件、修改組件配置、執(zhí)行組件的操作。集群完整的生命周期應(yīng)該包括下線,就是回收階段,這部分也比較好理解,基本上就是把上面的四步倒過來操作就可以了。
?
通過平臺(tái)化我們落地了標(biāo)準(zhǔn)化,自動(dòng)化又大大降低了大數(shù)據(jù)集群部署的難度,提高了運(yùn)維效率,保證了集群的穩(wěn)定性。
2.4.2 統(tǒng)一監(jiān)控和統(tǒng)一告警
監(jiān)控?cái)?shù)據(jù)收集架構(gòu)(時(shí)序指標(biāo))
前面提到傳統(tǒng)大數(shù)據(jù)監(jiān)控是比較分散的。我們的方案是用AMBARI指標(biāo)監(jiān)控系統(tǒng),它可以統(tǒng)一監(jiān)控平臺(tái)各類服務(wù)及主機(jī)的運(yùn)行情況,提供各類服務(wù)及主機(jī)的相關(guān)指標(biāo),從而達(dá)到判斷集群健康情況的目的。整個(gè)流程包括監(jiān)控指標(biāo)的采集、存儲(chǔ)、聚合及指標(biāo)獲取。
數(shù)據(jù)的收集流程
?
首先是位于主機(jī)上的AMS Client會(huì)不斷的收集集群相關(guān)的各項(xiàng)指標(biāo)和性能數(shù)據(jù)發(fā)送到ams的 metric collector,metric collector會(huì)將收集到的數(shù)據(jù)分別存到兩張表里面
一張是以主機(jī)為單位的指標(biāo)信息表,一張是以集群為單位的指標(biāo)聚合信息表。
然后是指標(biāo)的獲取,Ambari提供了兩種方式:一種是通過指標(biāo)獲取中心獲取;另一種是通過Ambari Server端獲取,前一種方式更接近于原生的指標(biāo)數(shù)據(jù),后一種方式則是更為常用的方式,可以說Ambari上層指標(biāo)的獲取都是通過這種方式來獲取的,但本質(zhì)上還是調(diào)用的第一種方式,拿到庫中的原生數(shù)據(jù),再進(jìn)行加工及邏輯處理,最后返回到WEB端。
統(tǒng)一告警平臺(tái):接收告警并根據(jù)規(guī)則發(fā)送給責(zé)任人
?
有監(jiān)控的需求就有告警的需求,但告警不能僅僅是對(duì)信息的轉(zhuǎn)發(fā),不然會(huì)讓告警接收人員淹沒在茫茫告警信息里面,所有的告警信息必須要有一個(gè)統(tǒng)一的平臺(tái)進(jìn)行接管,平臺(tái)對(duì)收到的信息進(jìn)行必要的和按規(guī)則設(shè)定進(jìn)行合并再發(fā)送。
我們開發(fā)統(tǒng)一告警平臺(tái)的目的解決報(bào)警遺漏、對(duì)非值班人員的打擾以及減少告警疲勞,確保報(bào)警/故障/提醒通告等及時(shí)、準(zhǔn)確、高效地通知到具體人員。通過優(yōu)化現(xiàn)有報(bào)警處理流程,我們引入值班機(jī)制、告警升級(jí)機(jī)制、告警合并收斂規(guī)則,做到故障的準(zhǔn)確通知。通過統(tǒng)一監(jiān)控平臺(tái)和統(tǒng)一告警平臺(tái),降低大數(shù)據(jù)告警設(shè)置的難度,同時(shí)也提高了運(yùn)維人員對(duì)告警的敏感度。
2.4.3認(rèn)證、授權(quán)、審計(jì)全面防護(hù)Hadoop
?
全面防護(hù)Hadoop。我們最早部署Hadoop集群時(shí)并沒有考慮安全問題,隨著集群的不斷擴(kuò)大, 各部門對(duì)集群的使用需求增加,集群安全問題就顯得頗為重要。通過上圖來看從里到外的安全防護(hù)體系主要包括哪些方面。
l?最里面的是OS級(jí)別的安全,主要是一些賬號(hào)設(shè)置等。
l?第二方面是權(quán)限控制,主要是對(duì)特定資源和特定訪問用戶進(jìn)行授權(quán)或拒絕訪問。權(quán)限控制是建立在安全認(rèn)證基礎(chǔ)上的。
l?第三層次是安全認(rèn)證,安全認(rèn)證是對(duì)用戶的身份進(jìn)行核對(duì),確保用戶是正確的用戶,我們用的是Kerberos體系。
l?最后是網(wǎng)絡(luò)邊界安全體系,包括硬件防火墻,VLAN/子網(wǎng)隔離等等。
l?通過這四層,我們保證進(jìn)來的用戶都是通過安全認(rèn)證的,而且是有權(quán)限去操作這個(gè)集群的。但用戶操作是否合理、到底訪問了哪些數(shù)據(jù),或者說有沒有嘗試訪問敏感數(shù)據(jù),這就要交給審計(jì)來做了,安全審計(jì)對(duì)數(shù)據(jù)安全也是至關(guān)重要的。OS級(jí)別的安全和網(wǎng)絡(luò)安全一般都是統(tǒng)一的,這里不做展開。
安全認(rèn)證
Hadoop的安全認(rèn)證是基于Kerberos來做的,Kerberos是一個(gè)網(wǎng)絡(luò)身份驗(yàn)證協(xié)議,用戶輸入自己的驗(yàn)證信息來進(jìn)行驗(yàn)證,如果驗(yàn)證通過,會(huì)獲取到ticket,用戶拿這些ticket去訪問多個(gè)接入Kerberos的服務(wù)。
它主要解決了服務(wù)器到服務(wù)器的認(rèn)證,解決了Client到服務(wù)器的認(rèn)證,但對(duì)用戶級(jí)別的認(rèn)證沒有實(shí)現(xiàn),也就是說它無法限制用戶提交作業(yè)。
Hadoop本身并不串接用戶賬號(hào),它主要是通過Kerberos協(xié)議對(duì)用戶的身份進(jìn)行驗(yàn)證。我們從 YARN 上的 MR 任務(wù)提交過程簡(jiǎn)單說明一下。
?
在客戶端執(zhí)行任務(wù)之前,它會(huì)先跟KDC做自我驗(yàn)證,獲取TGT,客戶端通過TGT向KDC請(qǐng)求服務(wù)ticket,KDC 生成 session key 后一并發(fā)給客戶端,客戶端拿到ticket之后,向服務(wù)驗(yàn)證自己,完成身份驗(yàn)證。
權(quán)限控制
權(quán)限控制我們用的是Hadoop系統(tǒng)當(dāng)中的安全管理框架Apache Ranger來實(shí)現(xiàn),它是一種定義和管理安全策略的集中式組件,里面內(nèi)置了一些通用的策略防護(hù)和策略模型,這些安全策略在Hadoop支持的組件上會(huì)被強(qiáng)制執(zhí)行。
如上圖,我們來看一下策略執(zhí)行過程。
首先用戶請(qǐng)求資源,匹配到該資源的所有權(quán)限,然后對(duì)所有資源進(jìn)行檢查,先看是不是在拒絕訪問列表里,如果在就拒絕訪問,如果不在就看是不是在允許列表里,如果在就允許訪問,如果不在,就拒絕訪問,或者做決策下放。Ranger可以選擇將決策下放給系統(tǒng)本身的訪問控制層。
?
Ranger架構(gòu)
?
Ranger架構(gòu)主要由三個(gè)部分組成:
第一部分是同步用戶,它會(huì)定期加載用戶,然后同步給管理中心;
第二部分是管理中心,管理中心提供接口,同時(shí)也執(zhí)行用戶設(shè)置的策略。
第三部分是客戶端的插件。這些插件會(huì)被嵌入到組件執(zhí)行流程當(dāng)中,定期向管理中心拉取策略,用來執(zhí)行這個(gè)策略的訪問決策。當(dāng)然它也會(huì)定期把這些訪問的審計(jì)日志記錄起來。
?
安全審計(jì)
?
安全防護(hù)的最后一環(huán)是審計(jì)。審計(jì)我們用的是Apache Eagle框架,它是一個(gè)高度可擴(kuò)展的行為監(jiān)控警報(bào)平臺(tái),采用了靈活的應(yīng)用框架和經(jīng)過實(shí)踐考驗(yàn)的大數(shù)據(jù)技術(shù),如 Kafka,Hbase和 Storm。提供了基于元數(shù)據(jù)驅(qū)動(dòng)的告警引擎和高度可定制的告警策略來報(bào)告異常行為的發(fā)生,實(shí)時(shí)監(jiān)控用戶的操作行為,實(shí)時(shí)檢測(cè)敏感數(shù)據(jù)訪問和惡意數(shù)據(jù)操作。
Apache ?Eagle框架主要由三個(gè)部分組成:
l?首先是數(shù)據(jù)流的接收和存儲(chǔ)。Eagle支持任何類型的數(shù)據(jù)流接收到它的策略引擎中。比如HDFS的審計(jì)機(jī)制可以通過Kafka將這些資質(zhì)收集過來,發(fā)送到簡(jiǎn)單的策略執(zhí)行當(dāng)中進(jìn)行處理。
l?第二部分是主機(jī)的實(shí)時(shí)數(shù)據(jù)處理引擎,Eagle提供一個(gè)獨(dú)立于物理平臺(tái)的高效流處理API,處理實(shí)時(shí)發(fā)過來的數(shù)據(jù)。
l?第三個(gè)是告警,它提供了靈活的告警框架。
Eagle的應(yīng)用場(chǎng)景,主要是用來做數(shù)據(jù)行為監(jiān)控。
l?監(jiān)控Hadoop中的數(shù)據(jù)訪問。
l?檢測(cè)非法入侵和違反安全規(guī)則的行為。
l?檢測(cè)敏感數(shù)據(jù)訪問,防止數(shù)據(jù)丟失。
l?基于策略的實(shí)時(shí)檢測(cè)和預(yù)警
l?基于用戶行為的異常檢測(cè)
安全是互聯(lián)網(wǎng)產(chǎn)品的生命基線,我們通過認(rèn)證、授權(quán)、審計(jì)全方位的防護(hù)Hadoop的安全,保障了大數(shù)據(jù)集群的穩(wěn)定運(yùn)行。而成本則是最終校驗(yàn)運(yùn)維效率的標(biāo)準(zhǔn),如人力成本的節(jié)約、業(yè)務(wù)資源使用的把控都是運(yùn)維價(jià)值的直接體現(xiàn)。
2.4.4資源可視化、成本化
在進(jìn)行資源可視化、成本化之前,我們常常不知道一個(gè)業(yè)務(wù)資源使用是否合理、資源擴(kuò)容是否有必要。通過對(duì)業(yè)務(wù)資源的可視化、成本化,可以統(tǒng)計(jì)業(yè)務(wù)資源消費(fèi)、展示業(yè)務(wù)消費(fèi)明晰、任務(wù)詳細(xì)信息,可以提供業(yè)務(wù)彈性依據(jù),為推動(dòng)業(yè)務(wù)優(yōu)化計(jì)算任務(wù)提供有利依據(jù)。
?
在這個(gè)平臺(tái)上我們直觀給出每個(gè)業(yè)務(wù)系的CPU、內(nèi)存、存儲(chǔ)的占用情況、使用的時(shí)長(zhǎng),以及轉(zhuǎn)換的成本,同時(shí)也可以通過消費(fèi)曲線觀察異常消費(fèi),進(jìn)行成本優(yōu)化。
?
我們還從用戶的維度給出消費(fèi)明細(xì),做到有理有據(jù),便于后面的一些反查。
?
同時(shí)還可以了解到任務(wù)詳細(xì)運(yùn)行情況。比如任務(wù)的類型,什么時(shí)候啟動(dòng),什么時(shí)候結(jié)束,使用時(shí)長(zhǎng)等。
以上所述是大數(shù)據(jù)運(yùn)維平臺(tái)建設(shè)過程當(dāng)中所用的一些方法論和技術(shù)。
三、總結(jié)與展望
3.1 總結(jié)
l?在質(zhì)量和效率上,闡述了大數(shù)據(jù)運(yùn)維平臺(tái)化和自動(dòng)化的必要性,實(shí)現(xiàn)了集群、主機(jī)、組件自動(dòng)化部署與管理;
l?在安全上,解決了誰有權(quán)限、有什么權(quán)限、做了什么的問題,保證了平臺(tái)的安全;
l?在成本上,做到了有圖有真相,伸縮有依據(jù),優(yōu)化有目標(biāo)。
3.2 展望
l?大數(shù)據(jù)運(yùn)維的總體目標(biāo)是用盡可能低的成本來提供足夠好的服務(wù)質(zhì)量和用戶體驗(yàn)。網(wǎng)絡(luò)帶寬、服務(wù)器、維護(hù)人力是大數(shù)據(jù)成本主要的來源,我們希望通過大數(shù)據(jù)分析技術(shù),對(duì)硬件故障的預(yù)測(cè)和自動(dòng)化進(jìn)行管理,對(duì)機(jī)器的管理實(shí)現(xiàn)零投入,最大化利用資源,減少預(yù)算開銷。
l?提供高質(zhì)量業(yè)務(wù)運(yùn)維服務(wù),我們希望用戶可以通過平臺(tái)申請(qǐng)自動(dòng)創(chuàng)建交付集群,開展業(yè)務(wù)運(yùn)營(yíng)。
l?同時(shí)我們也希望運(yùn)維團(tuán)隊(duì)可以充分利用大數(shù)據(jù)分析技術(shù)提升預(yù)測(cè)、發(fā)現(xiàn)和自動(dòng)檢測(cè)的能力,預(yù)測(cè)分配資源,動(dòng)態(tài)伸縮集群,實(shí)現(xiàn)智能預(yù)警,自動(dòng)修復(fù),推動(dòng)運(yùn)維向智能化方向發(fā)展。
11月9-12日,北京國(guó)家會(huì)議中心,第六屆TOP100全球軟件案例研究峰會(huì),魅族科技主題桌面負(fù)責(zé)人譚林英將分享《手機(jī)廠商如何做互聯(lián)網(wǎng)產(chǎn)品》。
TOP100全球軟件案例研究峰會(huì)已舉辦六屆,甄選全球軟件研發(fā)優(yōu)秀案例,每年參會(huì)者達(dá)上萬人次。包含產(chǎn)品、團(tuán)隊(duì)、架構(gòu)、運(yùn)維、大數(shù)據(jù)、人工智能等多個(gè)技術(shù)專場(chǎng),現(xiàn)場(chǎng)學(xué)習(xí)谷歌、微軟、騰訊、阿里、百度等一線互聯(lián)網(wǎng)企業(yè)的最新研發(fā)實(shí)踐。
更多TOP100案例信息及日程請(qǐng)前往[官網(wǎng)]查閱。4天時(shí)間集中分享2017年最值得學(xué)習(xí)的100個(gè)研發(fā)案例實(shí)踐。本平臺(tái)共送出10張開幕式單天免費(fèi)體驗(yàn)票,數(shù)量有限,先到先得。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/8002.html
摘要:本文系魅族架構(gòu)師胡成元,在直聘主辦的直聘學(xué)院對(duì)話架構(gòu)師活動(dòng)上的分享整理,介紹魅族應(yīng)用商店云端架構(gòu)實(shí)踐的總結(jié)。年加入魅族,一直致力于移動(dòng)應(yīng)用架構(gòu)研發(fā),提升產(chǎn)品體驗(yàn)和研發(fā)效率。目前主要負(fù)責(zé)魅族應(yīng)用商店的研發(fā)工作,關(guān)注服務(wù)化分布式大數(shù)據(jù)等領(lǐng)域。 本文系魅族Flyme架構(gòu)師胡成元,在Boss直聘主辦的直聘學(xué)院「對(duì)話架構(gòu)師」活動(dòng)上的分享整理,介紹魅族應(yīng)用商店云端架構(gòu)實(shí)踐的總結(jié)。 showImg(...
閱讀 2932·2023-04-26 01:49
閱讀 2066·2021-10-13 09:39
閱讀 2278·2021-10-11 11:09
閱讀 923·2019-08-30 15:53
閱讀 2816·2019-08-30 15:44
閱讀 916·2019-08-30 11:12
閱讀 2966·2019-08-29 17:17
閱讀 2371·2019-08-29 16:57