摘要:數(shù)據(jù)出來后,阿里云還要在全球范圍內(nèi)調(diào)度流量,一絲一毫的不準(zhǔn)確都可能導(dǎo)致很嚴(yán)重的后果,所以對于數(shù)據(jù)的準(zhǔn)確性要求很高。阿里云更多的是做實時數(shù)據(jù)分析。
想要實現(xiàn)優(yōu)質(zhì)高速的互聯(lián)網(wǎng)視頻服務(wù),一定離不開高質(zhì)量的內(nèi)容分發(fā)網(wǎng)絡(luò)服務(wù),就是我們常說的CDN,在10月13日云棲大會視頻多媒體分論壇上,阿里云高級技術(shù)專家空見為大家講解了CDN服務(wù)過程中,數(shù)據(jù)處理、安全監(jiān)測、日志分析、智能分析是如何為CDN賦能的。下面是演講主要內(nèi)容提煉:
一、業(yè)務(wù)背景目前阿里云CDN的節(jié)點的數(shù)量超過1200個,可承載的帶寬能力超過80Tbps,基本能覆蓋國內(nèi)一半的分發(fā)要求,海外的部署也是十分廣泛的。在產(chǎn)品方面,CDN包括PCDN、安全加速、全站加速等各種子產(chǎn)品,因為分析的場景不同,所以對數(shù)據(jù)平臺的擴展性也提出了更高的要求。從業(yè)務(wù)規(guī)模來看,阿里云CDN現(xiàn)在線上跑著百萬級的域名,每個域名的分析都要做,比傳統(tǒng)CDN高了兩個量級。如此龐大的業(yè)務(wù),對于用戶內(nèi)容的分發(fā)是好事情,對數(shù)據(jù)的回收和分析,卻是一個不小的挑戰(zhàn)。
二、數(shù)據(jù)需求CDN的數(shù)據(jù)有三個關(guān)鍵字:海量、可靠、實時。
海量,CDN目前每秒鐘有大幾千萬的數(shù)據(jù)訪問,每天會沉淀出來5PB的系統(tǒng)日志,所以離線數(shù)據(jù)通常在EB級別,這個對實時計算和離線分析都有很大的壓力;在監(jiān)控這塊阿里云CDN每天達到千億級別,而且每年CDN數(shù)據(jù)增長都在100%之上,所以系統(tǒng)必須要有很強的擴展性,并提前設(shè)計好各個環(huán)節(jié)。
可靠,CDN的數(shù)據(jù)一定要是準(zhǔn)確的,不能有毛刺的數(shù)據(jù)。因為數(shù)據(jù)的應(yīng)用場景是很苛刻的,比如計費和監(jiān)控,不能出現(xiàn)紕漏,不能漏報誤報。數(shù)據(jù)出來后,阿里云CDN還要在全球范圍內(nèi)調(diào)度流量,一絲一毫的不準(zhǔn)確都可能導(dǎo)致很嚴(yán)重的后果,所以對于數(shù)據(jù)的準(zhǔn)確性要求很高。第二是系統(tǒng)本身的穩(wěn)定,系統(tǒng)各個環(huán)境不能有明顯的瓶頸,系統(tǒng)要有足夠強的容災(zāi)能力,系統(tǒng)的自動恢復(fù)方案也要是充分的。
實時,在從前,阿里云CDN是五分鐘分析一次數(shù)據(jù),不管是計量還是計費,都以這個為標(biāo)準(zhǔn)?,F(xiàn)在,因為有了更多的業(yè)務(wù)場景,以直播為例,如果一個主播推流斷掉了,不能馬上發(fā)現(xiàn)的話,影響的可能就是幾十、上百萬的用戶的觀看體驗。所以,在實時性上,阿里云CDN現(xiàn)在能做到分鐘以及秒級的實時,也就是說,在整個數(shù)據(jù)的要求上來看,不僅吞吐量要大,延遲也要足夠低。
如此大規(guī)模的數(shù)據(jù),如此嚴(yán)苛的要求,阿里云CDN又如何應(yīng)對呢?
三、數(shù)據(jù)收集下面我們看看阿里云CDN在數(shù)據(jù)收集方面是怎么做的。現(xiàn)在整個系統(tǒng)數(shù)據(jù)量化的程度還是比較高的,不光是用戶的訪問數(shù)據(jù),系統(tǒng)的操作數(shù)據(jù)也是可以量化的。下面是數(shù)據(jù)收集全貌圖:
數(shù)據(jù)來源,有兩個方面,一個是左邊的節(jié)點,另一個是右邊的用戶。
先從從左邊的邊緣節(jié)點來看,它是從全球的邊緣節(jié)點去采集和處理,上面的數(shù)據(jù)大部分都是訪問、回源的日志,節(jié)點之間互相探測的日志等,在總數(shù)據(jù)中占比80%以上。這里的數(shù)據(jù)量級非常大,而且本身CDN就是分布式系統(tǒng),所以阿里云CDN將一部分?jǐn)?shù)據(jù)分析工作在節(jié)點上就先完成了,比如通用的流量、命中率、QPS等指標(biāo),會在節(jié)點上做預(yù)處理,同時,全量的數(shù)據(jù)也會通過流式傳輸往數(shù)據(jù)中心去走。
右面是用戶數(shù)據(jù),通過瀏覽器或SDK來訪問我們內(nèi)容的用戶,還包括系統(tǒng)上的用戶,包括管理員管理配置、業(yè)務(wù)人員在后臺對線上資源進行調(diào)配等,一般這里的數(shù)據(jù)直接通過流式傳輸平臺SLS客戶端直接發(fā)出。
在中心傳輸這一層,阿里云CDN采用阿里云本身的SLS產(chǎn)品,SLS支持對數(shù)據(jù)進行抽取、轉(zhuǎn)化、分發(fā)、檢索等功能,本身比較靈活,滿足了ETL的場景,并且可以在上面做一些客戶定制化的處理。SLS下來后,再用Blink對數(shù)據(jù)進行流式處理,它有一個好處就是中間狀態(tài)可以保存,不需要應(yīng)用和外部的第三方存儲再做交互,能夠滿足數(shù)據(jù)定制化分析的一些場景。原始的訪問及分析后的業(yè)務(wù)數(shù)據(jù),最終會沉淀存儲在ODPS中。用戶也可以選擇其他存儲方式,比如可以提供文件下載功能的對象存儲OSS。另外,時序數(shù)據(jù)也會存在OTS數(shù)據(jù)庫中,以備實時檢索。
以上的數(shù)據(jù)收集,基本上都是采用阿里云的產(chǎn)品,阿里云CDN的技術(shù)專家們只需要把系統(tǒng)串聯(lián)起來,保證整體可用性即可,如此,就能將更多精力集中在數(shù)據(jù)的分析和應(yīng)用上了。
四、數(shù)據(jù)分析在數(shù)據(jù)分析這塊,離線方面會做的輕一點,做運營報表和數(shù)據(jù)挖掘。阿里云CDN更多的是做實時數(shù)據(jù)分析。這兩個分析系統(tǒng),會將數(shù)據(jù)最終匯集到專家系統(tǒng),用于檢測這些數(shù)據(jù)有沒有異常,找到異常問題的定位。找到問題根源后,根據(jù)其他平臺產(chǎn)生的數(shù)據(jù),關(guān)聯(lián)起來,用機器學(xué)習(xí)的算法做一個問題的分類。
數(shù)據(jù)分析的使用場景包括:
自動化運維,通過機器資源、線上問題的收斂,阿里云CDN目前只需要三個運維就足夠了;
智能調(diào)度,實時根據(jù)大區(qū)、節(jié)點的情況,合理調(diào)度流量和進行節(jié)點建設(shè);
用戶畫像,相當(dāng)于給用戶提供一個體檢,給出當(dāng)前服務(wù)的建議,優(yōu)化業(yè)務(wù);
事件中心,記錄當(dāng)前節(jié)點上正在發(fā)生的事件,關(guān)注網(wǎng)絡(luò)抖動和發(fā)布情況。
左邊是官網(wǎng)的截圖,用戶可以根據(jù)自己想要的維度,關(guān)注各類報表,看到CDN使用的情況。
中間是內(nèi)部的監(jiān)控系統(tǒng),分鐘+秒級監(jiān)控,用于問題的復(fù)排和打標(biāo)。
右邊是事件的數(shù)據(jù),顯示當(dāng)前整個平臺的流量、事件等級和匯集情況等。
除了業(yè)務(wù)層數(shù)據(jù),阿里云CDN和阿里云IDST聯(lián)合,對CDN上分發(fā)的文本、圖片、視頻等內(nèi)容進行鑒定,篩查涉黃等違規(guī)內(nèi)容,防止IP被封。
六、總結(jié)整個CDN數(shù)據(jù)化為了驅(qū)動系統(tǒng),形成下發(fā)、執(zhí)行、采集、分析的閉環(huán)。
在分享的最后,空見總結(jié)道:“從業(yè)務(wù)接入層,我們可以提供方便、快捷的接入環(huán)境;在策略執(zhí)行層,我們可以快速把操作發(fā)布到線上,達到秒級生效;在數(shù)據(jù)生產(chǎn)層,我們將把所有的系統(tǒng)都量化起來,采集到海量、有效的數(shù)據(jù);在決策中心層,我們相應(yīng)對數(shù)據(jù)進行收斂,只關(guān)注關(guān)鍵數(shù)據(jù)指標(biāo),整個是一個閉環(huán)的過程。有了數(shù)據(jù)化的系統(tǒng),后面的自動化、智能化才有更多發(fā)揮的空間。”
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/33798.html
摘要:數(shù)據(jù)出來后,阿里云還要在全球范圍內(nèi)調(diào)度流量,一絲一毫的不準(zhǔn)確都可能導(dǎo)致很嚴(yán)重的后果,所以對于數(shù)據(jù)的準(zhǔn)確性要求很高。阿里云更多的是做實時數(shù)據(jù)分析。 想要實現(xiàn)優(yōu)質(zhì)高速的互聯(lián)網(wǎng)視頻服務(wù),一定離不開高質(zhì)量的內(nèi)容分發(fā)網(wǎng)絡(luò)服務(wù),就是我們常說的CDN,在10月13日云棲大會視頻多媒體分論壇上,阿里云高級技術(shù)專家空見為大家講解了CDN服務(wù)過程中,數(shù)據(jù)處理、安全監(jiān)測、日志分析、智能分析是如何為CDN賦能...
摘要:摘要本文由阿里視頻云高級技術(shù)專家空見撰寫,主要介紹的歷史特性如何使用和使用之后的性能對比驗證。實踐證明解決了的一些頑疾,在性能上提升顯著,最終正式考慮制定的計劃,最后決定以為基礎(chǔ)起草,的部分設(shè)計人員也被邀請參與了的設(shè)計。 摘要: 本文由阿里視頻云高級技術(shù)專家空見撰寫,主要介紹HTTP2.0的歷史、特性、如何使用和使用之后的性能對比驗證。 背景介紹 要了解HTTP2.0,先了解一下HT...
摘要:講解從三個部分展開短視頻應(yīng)用場景阿里云短視頻解決方案阿里云對短視頻用戶體驗的相關(guān)優(yōu)化。同時,為了面對業(yè)務(wù)的突發(fā)流量,阿里云提供了超過的帶寬儲備,為持續(xù)增長的業(yè)務(wù)保駕護航。二播放卡頓是指在播放過程中的不流暢情況,會嚴(yán)重影響用戶體驗。 深圳云棲大會已經(jīng)圓滿落幕,在3月29日飛天技術(shù)匯-彈性計算、網(wǎng)絡(luò)和CDN專場中,阿里云CDN高級技術(shù)專家周哲為我們帶來了《海量短視頻極速分發(fā)》的主題分享,帶...
閱讀 713·2023-04-25 19:43
閱讀 3907·2021-11-30 14:52
閱讀 3784·2021-11-30 14:52
閱讀 3852·2021-11-29 11:00
閱讀 3783·2021-11-29 11:00
閱讀 3869·2021-11-29 11:00
閱讀 3557·2021-11-29 11:00
閱讀 6104·2021-11-29 11:00