国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

大數(shù)據(jù)面臨的挑戰(zhàn):當(dāng)大數(shù)據(jù)遭遇云計(jì)算

Berwin / 3294人閱讀

摘要:毫無疑問,大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲(chǔ)架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會(huì)引發(fā)云計(jì)算數(shù)據(jù)倉庫數(shù)據(jù)挖掘商業(yè)智能等應(yīng)用的連鎖反應(yīng)。

?????? 大數(shù)據(jù)正在徹底改變IT世界。那么,什么樣的數(shù)據(jù)談得上數(shù)據(jù)呢?

  根據(jù)IDC的報(bào)告,未來十年全球大數(shù)據(jù)將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬億GB)的大數(shù)據(jù)創(chuàng)建產(chǎn)生。這相當(dāng)于每位美國人每分鐘寫3條Tweet,而且還是不停地寫2.6976萬年。在未來十年,管理數(shù)據(jù)倉庫的服務(wù)器的數(shù)量將增加10倍以便迎合50倍的大數(shù)據(jù)增長。


   毫無疑問,大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲(chǔ)架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會(huì)引發(fā)云計(jì)算、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能等應(yīng)用的連鎖反應(yīng)。2011年企業(yè)會(huì)將更多 的多TB(1TB=1000GB)數(shù)據(jù)集用于商務(wù)智能和商務(wù)分析;到2020年,全球數(shù)據(jù)使用量預(yù)計(jì)暴增44倍,達(dá)到35.2ZB(1ZB=10億 TB)。


  大數(shù)據(jù)面臨的挑戰(zhàn)——RISC已無法滿足未來的企業(yè)架構(gòu)需求

  對于海量的數(shù)據(jù)信息,如何對這些 數(shù)據(jù)進(jìn)行復(fù)雜的應(yīng)用成了現(xiàn)今數(shù)據(jù)倉庫、商業(yè)智能和數(shù)據(jù)分析技術(shù)的研究熱點(diǎn)。數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中發(fā)現(xiàn)隱含的規(guī)律性的內(nèi)容,解決數(shù)據(jù)的應(yīng)用質(zhì)量問題。 充分利用有用的數(shù)據(jù),廢棄虛偽無用的數(shù)據(jù),是數(shù)據(jù)挖掘技術(shù)的最重要的應(yīng)用。傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)結(jié)構(gòu)性很強(qiáng),即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù),而目前數(shù)據(jù) 較大特點(diǎn)就是半結(jié)構(gòu)化,因此此類數(shù)據(jù)挖掘比面向單個(gè)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘要復(fù)雜得多。


  談到傳統(tǒng)數(shù)據(jù)倉庫的時(shí)候,大家不免就會(huì)買存儲(chǔ)設(shè)備,選服務(wù)器,不管是IBM Power或者是Oracle架構(gòu)的,這些其實(shí)都是在傳統(tǒng)時(shí)代非常有名的數(shù)據(jù)庫品牌,把它構(gòu)建在一起,構(gòu)成數(shù)據(jù)倉庫,微軟、COCNOS等都提供解決方案。


  但從目前來看,現(xiàn)有的數(shù)據(jù)倉庫已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足未來的企業(yè)大數(shù)據(jù)架構(gòu)。


  對企業(yè)業(yè)務(wù)來說,不光要有高擴(kuò)展性,而且是動(dòng)態(tài)的需求,能夠讓設(shè)備自由擴(kuò)充,不用去管數(shù)據(jù)倉庫、應(yīng)用具體運(yùn)行在這些機(jī)器的哪一臺上,這些計(jì)算能力的耗費(fèi)完全是根據(jù)業(yè)務(wù)的伸縮而來的。


   傳統(tǒng)的架構(gòu)做這類的項(xiàng)目十年到二十年的時(shí)間,它們有一個(gè)特點(diǎn),數(shù)據(jù)倉庫的訪問和傳統(tǒng)的不同,所謂的不同就是查詢特別大,查詢的語句特別長、特別復(fù)雜,不 像去銀行的存提款只是在眾多的記錄中查詢一兩條,它符合大數(shù)據(jù)查詢的特征,傳統(tǒng)的查詢索引作用非常有限。在數(shù)據(jù)庫中涉及多張表的連接,同時(shí)還有匯總、算標(biāo) 準(zhǔn)差等復(fù)雜的運(yùn)算。但是相反它的并發(fā)請求不是很多,一個(gè)企業(yè)就是人再多,不會(huì)同時(shí)超過一千個(gè)業(yè)務(wù)分析員在分析數(shù)據(jù)。


  因此,在數(shù)據(jù)倉庫誕生的第一天,系統(tǒng)一直就有一個(gè)瓶頸,要把大查詢分解成小任務(wù),這些小任務(wù)由并行的服務(wù)器來完成,我們強(qiáng)調(diào)小的機(jī)器要多,而不要大的機(jī)器CPU數(shù)少。因此,數(shù)據(jù)倉庫天生就是MPP、開放架構(gòu)的CPU加上并行擴(kuò)展橫向擴(kuò)展數(shù)量,從這方面來看,擴(kuò)展性較差,并行處理能力有限的RISC架構(gòu)已經(jīng)不能代表未來的企業(yè)架構(gòu)。


  而以英特爾為代表的X86處理器天生就是為大數(shù)據(jù)應(yīng)用而生,Oracle推出的Exadata數(shù)據(jù)倉庫服務(wù)器采用了英特爾至強(qiáng)(Nehalem)處理器、DDR3內(nèi)存和40Gbps InfiniBand,Exadata數(shù)據(jù)庫機(jī)第二版的CPU、內(nèi)存和網(wǎng)絡(luò)速度分別提高了80%、200%、100%,單個(gè)數(shù)據(jù)庫服務(wù)器內(nèi)存容量則達(dá)到了72GB,原始磁盤容量和每機(jī)架磁盤容量達(dá)到100TB、336TB,Sun FlashFire內(nèi)存卡則實(shí)現(xiàn)了高性能的OLTP。


  當(dāng)大數(shù)據(jù)遭遇云計(jì)算

   云計(jì)算為什么能盛行呢?在互聯(lián)網(wǎng)領(lǐng)域應(yīng)用系統(tǒng)的構(gòu)建:客戶群體是不確定的、系統(tǒng)規(guī)模不確定、系統(tǒng)投資不固定、業(yè)務(wù)應(yīng)用有很清晰的并行分割特征、數(shù)據(jù)倉庫 系統(tǒng)的構(gòu)建、數(shù)據(jù)倉庫規(guī)模可估算、數(shù)據(jù)倉庫的系統(tǒng)投資與業(yè)務(wù)分析的價(jià)值和回報(bào)相關(guān)、商業(yè)智能應(yīng)用屬于整體應(yīng)用、Saas模式構(gòu)建數(shù)據(jù)倉庫系統(tǒng)。


   在大數(shù)據(jù)技術(shù)上用云計(jì)算構(gòu)建下一代數(shù)據(jù)倉庫成為熱門話題,這當(dāng)中包括大數(shù)據(jù)管理,分布式進(jìn)行文件系統(tǒng),如Hadoop、Mapreduce數(shù)據(jù)分割與訪 問執(zhí)行;同時(shí)SQL支持,以Hive HADOOP為代表的SQL界面支持。從系統(tǒng)需求來看,大數(shù)據(jù)的架構(gòu)對系統(tǒng)提出了新的挑戰(zhàn):


  1、集成度更高:這意味著一個(gè)標(biāo)準(zhǔn)機(jī)箱較大限度完成特定任務(wù),華碩不久推出的一款高密度機(jī)架式服務(wù)器RS720,2U高度較大能采用支持4個(gè)雙路計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)單機(jī)8個(gè)英特爾5600系列處理器和高達(dá)總計(jì)768G內(nèi)存資源。


   2、配置更合理、速度更快:存儲(chǔ)、控制器、I/O通道、內(nèi)存、CPU、網(wǎng)絡(luò)均衡設(shè)計(jì),針對數(shù)據(jù)倉庫訪問最優(yōu)設(shè)計(jì),比傳統(tǒng)類似平臺高出一個(gè)數(shù)量級以上,這 方面的經(jīng)典案例是數(shù)據(jù)倉庫頭號廠商Teradata,其采用雙路Xeon六核處理器的企業(yè)級數(shù)據(jù)倉庫5650可輕松為數(shù)千名用戶處理更復(fù)雜、更大量的工作 負(fù)載、持續(xù)負(fù)載以及批負(fù)載、操作性查詢、簡單報(bào)表和復(fù)雜的分析,所有功能均在同一個(gè)平臺上運(yùn)行。與上一代產(chǎn)品相比,動(dòng)態(tài)企業(yè)級數(shù)據(jù)倉庫5650的性能提高 了43%,占地面積保持不變,減少了能源消耗和空間需求。


  3、整體能耗更低:同等計(jì)算任務(wù),能耗較低。


  4、系統(tǒng)更加穩(wěn)定可靠:能夠消除各種單點(diǎn)故障環(huán)節(jié),統(tǒng)一一個(gè)部件、器件的品質(zhì)和標(biāo)準(zhǔn)。


  5、管理維護(hù)費(fèi)用低:數(shù)據(jù)藏的常規(guī)管理全部集成。


  6、可規(guī)劃和預(yù)見的系統(tǒng)擴(kuò)容、升級路線圖。


  云計(jì)算環(huán)境作為大數(shù)據(jù)處理平臺

  1.云計(jì)算環(huán)境中基本計(jì)算單元的分化

   企業(yè)云計(jì)算平臺上雖然有多個(gè)并行計(jì)算的CPU,但并沒有創(chuàng)造出具有超強(qiáng)數(shù)據(jù)處理能力的超級CPU,因此云計(jì)算平臺需要的是有并行運(yùn)算能力的軟件系統(tǒng)。同 時(shí),當(dāng)所有用戶的數(shù)據(jù)全部放在云端時(shí),雖然存儲(chǔ)容量可以很方便地?cái)U(kuò)充,但面對大量用戶同時(shí)發(fā)起的海量數(shù)據(jù)處理請求,簡單的數(shù)據(jù)處理邏輯已經(jīng)無法滿足需要。


  可以看到,國內(nèi)有相當(dāng)多的電商企業(yè),用小型機(jī)和Oracle扛了好幾年,并請了全國最牛的Oracle的專家不停優(yōu)化他的Oracle和小型機(jī),初期發(fā)展可能很快,但是后來由于數(shù)據(jù)量激增,業(yè)務(wù)開始受到嚴(yán)重影響,最典型的例子無疑是京東商城前段時(shí)間發(fā)生的大規(guī)模訪問請求宕機(jī)事件,因此他們開始逐漸放棄了Oracle或者M(jìn)S-SQL,并逐漸轉(zhuǎn)向MySQL X86的分布式架構(gòu)。


  目前的基本計(jì)算單元常常是普通的X86服務(wù)器,它們組成了一個(gè)大的云,而未來的云計(jì)算單元里有可能有存儲(chǔ)單元、計(jì)算單元、協(xié)調(diào)單元,總體的效率會(huì)更高。


  2、對系統(tǒng)穩(wěn)定性的需求

  在應(yīng)對大規(guī)模訪問的時(shí)候有一些系統(tǒng)穩(wěn)定性的追求,來自很多方面,來自網(wǎng)絡(luò)穩(wěn)定性、數(shù)據(jù)庫穩(wěn)定性。對系統(tǒng)而言,需要把握一個(gè)大原則,需要消除任何單點(diǎn)故障。不光是網(wǎng)絡(luò)上單點(diǎn)故障,還有來自你呼叫中心里的單點(diǎn)故障,只要有單點(diǎn)故障一定要消除掉。因?yàn)閷τ陔娚绦袠I(yè)而言,每一秒都是錢,電子商務(wù)業(yè)務(wù)如果宕機(jī)一個(gè)小時(shí),損失多少是可以算出來的,電商行業(yè)需要非常全面的技術(shù)系統(tǒng)監(jiān)控報(bào)警系統(tǒng)。有時(shí)候你會(huì)發(fā)現(xiàn)你如果通過技術(shù)系統(tǒng)的監(jiān)控去推導(dǎo)出你的技術(shù)發(fā)生問題已經(jīng)晚了。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/3599.html

相關(guān)文章

  • 數(shù)據(jù)面臨挑戰(zhàn):當(dāng)數(shù)據(jù)遭遇計(jì)算

    摘要:在未來十年,管理數(shù)據(jù)倉庫的服務(wù)器的數(shù)量將增加倍以便迎合倍的大數(shù)據(jù)增長。毫無疑問,大數(shù)據(jù)將挑戰(zhàn)企業(yè)的存儲(chǔ)架構(gòu)及數(shù)據(jù)中心基礎(chǔ)設(shè)施等,也會(huì)引發(fā)云計(jì)算數(shù)據(jù)倉庫數(shù)據(jù)挖掘商業(yè)智能等應(yīng)用的連鎖反應(yīng)。 大數(shù)據(jù)正在徹底改變IT世界。那么,什么樣的數(shù)據(jù)談得上數(shù)據(jù)呢? ? 根據(jù)IDC的報(bào)告,未來十年全球大數(shù)據(jù)將增加50倍。僅在2011年,我們就將看到1.8ZB(也就是1.8萬億GB)的大數(shù)據(jù)創(chuàng)建產(chǎn)生。這相當(dāng)...

    forsigner 評論0 收藏0
  • 同向計(jì)算轉(zhuǎn)型 微軟、英特爾面臨不同挑戰(zhàn)

    摘要:據(jù)國外媒體報(bào)道,微軟和英特爾本周發(fā)布的財(cái)報(bào),清楚地表明了這兩家昔日的霸主在把重心轉(zhuǎn)向云計(jì)算時(shí)面臨的挑戰(zhàn)。英特爾數(shù)據(jù)中心業(yè)務(wù)包括云計(jì)算數(shù)據(jù)中心用芯片,英特爾稱其云計(jì)算數(shù)據(jù)中心用芯片業(yè)務(wù)相當(dāng)強(qiáng)勁。 據(jù)國外媒體報(bào)道,微軟和英特爾本周發(fā)布的財(cái)報(bào),清楚地表明了這兩家昔日的PC霸主在把重心轉(zhuǎn)向云計(jì)算時(shí)面臨的挑戰(zhàn)。微軟云計(jì)算業(yè)務(wù)長期增長前景強(qiáng)勁。盡管上一財(cái)季微軟云計(jì)算業(yè)務(wù)Azure營收增長逾1倍,微軟在周...

    miguel.jiang 評論0 收藏0
  • 計(jì)算技術(shù)如何改變醫(yī)療行業(yè)

    摘要:云計(jì)算有能力革新醫(yī)療保健行業(yè),可以通過分散化的方式提高效率,并通過提供與內(nèi)部組織相媲美的服務(wù)來改善患者體驗(yàn),而成本卻大大降低。云計(jì)算對醫(yī)療行業(yè)的另一個(gè)重要優(yōu)勢是靈活性,因?yàn)樘峁┥炭筛鶕?jù)需要擴(kuò)大或縮小資源。如今,在全球范圍內(nèi),許多國家在尋求數(shù)字化醫(yī)療服務(wù)方面面臨著無數(shù)的問題。由于資源(包括員工和財(cái)務(wù))的減少,對數(shù)字化服務(wù)的需求不斷上升,以及不斷增長的需求,各國的醫(yī)療體系面臨著前所未有的挑戰(zhàn)。所...

    codercao 評論0 收藏0
  • 計(jì)算技術(shù)落地遭遇瓶頸

    摘要:近年來,云計(jì)算技術(shù)得到蓬勃發(fā)展,增長快速。云計(jì)算已經(jīng)成為當(dāng)前信息技術(shù)產(chǎn)業(yè)發(fā)展和應(yīng)用創(chuàng)新的熱點(diǎn)。中國聯(lián)通年也成立了云數(shù)據(jù)公司,完成沃云網(wǎng)絡(luò)商用部署,部署十大云數(shù)據(jù)中心個(gè)省會(huì)城市的云計(jì)算資源池。云計(jì)算技術(shù)可以解決現(xiàn)有數(shù)據(jù)中心中遺留的一些問題。近年來,云計(jì)算技術(shù)得到蓬勃發(fā)展,增長快速。云計(jì)算已經(jīng)成為當(dāng)前信息技術(shù)產(chǎn)業(yè)發(fā)展和應(yīng)用創(chuàng)新的熱點(diǎn)。在我國,云計(jì)算已度過了初期的市場培育、概念炒作階段,目前進(jìn)入到...

    spacewander 評論0 收藏0
  • 計(jì)算機(jī)器學(xué)習(xí)適合你組織嗎?

    摘要:云計(jì)算機(jī)器學(xué)習(xí)平臺的另一個(gè)大問題是所有公共云所共有的問題供應(yīng)商鎖定。無論組織是使用云計(jì)算機(jī)器學(xué)習(xí)平臺還是其他類型的機(jī)器學(xué)習(xí)解決方案,收集這些數(shù)據(jù)并將其轉(zhuǎn)換為可用的數(shù)據(jù)都是一項(xiàng)艱巨的任務(wù)。云計(jì)算機(jī)器學(xué)習(xí)的替代品組織有很多其他平臺的替代品。云計(jì)算機(jī)器學(xué)習(xí)平臺,有時(shí)也被稱為機(jī)器學(xué)習(xí)即服務(wù)(MLaaS)解決方案,可以讓企業(yè)更加輕松地采用人工智能(AI)。但專家表示,中小企業(yè)在考慮采用這些服務(wù)之前應(yīng)該...

    Tikitoo 評論0 收藏0

發(fā)表評論

0條評論

最新活動(dòng)
閱讀需要支付1元查看
<