摘要:國內(nèi)互聯(lián)網(wǎng)巨頭百度也在近期表明,將發(fā)起建立一個(gè)名為深盟的分布式機(jī)器學(xué)習(xí)開源平臺,由旗下深度學(xué)習(xí)研究院牽頭,聯(lián)合來自卡耐基梅隴大學(xué)華盛頓大學(xué)紐約大學(xué)香港科技大學(xué)的多位系統(tǒng)開發(fā)者,共同推出旨在大幅降低機(jī)器深度學(xué)習(xí)門檻的蟲洞項(xiàng)目。
當(dāng)前人工智能之所以能夠引起大家的興奮和廣泛關(guān)注,在很大程度上是源于深度學(xué)習(xí)的研究進(jìn)展。這項(xiàng)機(jī)器學(xué)習(xí)技術(shù)為計(jì)算機(jī)視覺、語音識別和自然語言處理帶來了巨大的、激動人心的進(jìn)步,也相應(yīng)的帶來了具體應(yīng)用的產(chǎn)品。科技巨頭們——谷歌、Facebook、亞馬遜和百度紛紛涉足這個(gè)領(lǐng)域:四處挖掘人才、建立研究實(shí)驗(yàn)室、高價(jià)收購創(chuàng)業(yè)公司、發(fā)布研究成果并將成果應(yīng)用于產(chǎn)品,等等。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中一系列試圖使用多重非線性變換對數(shù)據(jù)進(jìn)行多層抽象的算法,相較于在一大堆數(shù)據(jù)中自我生成任務(wù)的機(jī)器學(xué)習(xí)來說,這是一個(gè)巨大的進(jìn)步。之前的機(jī)器學(xué)習(xí)可以稱之為「膚淺的學(xué)習(xí)系統(tǒng)」,會受系統(tǒng)能計(jì)算的函數(shù)的復(fù)雜度的限制,例如,當(dāng)使用線性分類器來識別圖像時(shí),將需要從圖像中提取出足夠多的參數(shù)特征來提供給它,但手動設(shè)計(jì)一個(gè)特征提取器非常困難,而且很耗時(shí)。或者使用一個(gè)更加靈活的分類器,比如說支持向量機(jī)或者兩層神經(jīng)網(wǎng)絡(luò),直接將圖片的像素提供給它們,但這也不會提高物體識別的準(zhǔn)確性。但深度學(xué)習(xí)的出現(xiàn)使這種情況發(fā)生了改觀,互相關(guān)聯(lián)的多層級為深度學(xué)習(xí)提供了「深度」,通過這樣一種自下而上的工作,算法學(xué)著去識別特征、概念和類別,這就是人類非常擅長但一直很難用代碼去實(shí)現(xiàn)的任務(wù)。
人工智能近幾年的發(fā)展一方面取決于深度學(xué)習(xí)算法的成熟,另一方面取決于數(shù)據(jù)量的海量增長。百度的人工智能專家吳恩達(dá)把人工智能比作火箭,而深度學(xué)習(xí)是火箭的發(fā)動機(jī),大數(shù)據(jù)是火箭的燃料,這兩部分必須同時(shí)做好,才能順利發(fā)射到太空中。
移動互聯(lián)網(wǎng)和多種智能設(shè)備的普及使我們進(jìn)入大數(shù)據(jù)時(shí)代,為人工智能的發(fā)動機(jī)——深度學(xué)習(xí)提供了足夠多的燃料,早期的神經(jīng)網(wǎng)絡(luò)只擁有有限的數(shù)據(jù)處理能力。超過這個(gè)臨界點(diǎn)時(shí),為它們輸入更多信息并不會帶來更好的表現(xiàn)。而現(xiàn)在的神經(jīng)網(wǎng)絡(luò)系統(tǒng)所依賴的開發(fā)者的指導(dǎo)和調(diào)整要少得多。同時(shí),不管你能輸入多少數(shù)據(jù),系統(tǒng)都能夠?qū)ζ溥M(jìn)行充分利用。谷歌、Facebook和百度等互聯(lián)網(wǎng)巨頭坐擁海量信息,大量的搜索歷史、社交信息和圖片等。因此,他們才會積極布局深度學(xué)習(xí),讓機(jī)器不再懼怕信息過載的問題,反而是更好的從這些海量信息中挖掘中更多價(jià)值。
從另一方面來說,神經(jīng)網(wǎng)絡(luò)要發(fā)揮作用必須先接受訓(xùn)練。比如說,一臺機(jī)器要教會自己識別人臉,必須先被展示一個(gè)「訓(xùn)練集」,其中包含成千上萬的照片。也就是說,數(shù)據(jù)量的增長反過來也會提升神經(jīng)網(wǎng)絡(luò)的表現(xiàn)。也就是說,對于深度學(xué)習(xí)和人工智能,需要越來越多的數(shù)據(jù)。雖然谷歌、Facebook和百度這類科技巨頭坐擁海量數(shù)據(jù),但依然需要更加開放的互聯(lián)網(wǎng)中的數(shù)據(jù)輸入。例如,F(xiàn)acebook人工智能實(shí)驗(yàn)室負(fù)責(zé)人Yann LeCun在接受IEEE采訪時(shí)表示,F(xiàn)acebook的人臉識別算法DeepFace在數(shù)據(jù)庫中的測試結(jié)果是97.25%,但如果圖片庫里有數(shù)億張臉,那較精確性就遠(yuǎn)不及97.25%。所以,這些科技巨頭需要將深度學(xué)習(xí)和人工智能的研究更加開放,因?yàn)橹挥袑⑺麄円延械某晒麖囊粋€(gè)相對封閉的環(huán)境中換到整個(gè)互聯(lián)網(wǎng)中時(shí),才能使深度學(xué)習(xí)模型更加完善,使人工智能得到更加廣泛的應(yīng)用。
在人工智能領(lǐng)域,有許多開放式案例,有的是科技巨頭開放計(jì)算平臺,有的是深度學(xué)習(xí)開源算法,但這都表明了科技巨頭在人工智能開放化道路上的必然趨勢。IBM在幾年前就開始將人工智能系統(tǒng)沃森開放給金融、醫(yī)療、互聯(lián)網(wǎng)(和Twitter合作)等行業(yè)使用,2014年投入10億美元進(jìn)行沃森開放平臺的建設(shè),當(dāng)年年底沃森智能分析平臺向公眾開放,功能包括語音轉(zhuǎn)文字、文字轉(zhuǎn)語音、視覺識別、概念解讀多維分析。支持?jǐn)?shù)據(jù)密集型分布式應(yīng)用并以Apache 2.0許可協(xié)議發(fā)布的開源軟件框架Apache Hadoop,是根據(jù)Google公司發(fā)表的MapReduce和Google檔案系統(tǒng)的論文自行實(shí)作而成。此外,還有分布式機(jī)器學(xué)習(xí)框架Spark。國內(nèi)互聯(lián)網(wǎng)巨頭百度也在近期表明,將發(fā)起建立一個(gè)名為「深盟」的分布式機(jī)器學(xué)習(xí)開源平臺,由旗下深度學(xué)習(xí)研究院牽頭,聯(lián)合來自卡耐基·梅隴大學(xué)、華盛頓大學(xué)、紐約大學(xué)、香港科技大學(xué)的多位系統(tǒng)開發(fā)者,共同推出旨在大幅降低機(jī)器深度學(xué)習(xí)門檻的“蟲洞項(xiàng)目”。目前,已經(jīng)參與合作的公司包括今日頭條、汽車之家及微軟亞洲研究院。深盟已有組件已成功覆蓋三類最常用的機(jī)器學(xué)習(xí)算法,未來還則將致力于實(shí)現(xiàn)和測試更多常用的機(jī)器學(xué)習(xí)算法。作為中國國內(nèi)第一個(gè)達(dá)到工業(yè)界應(yīng)用水平的開源機(jī)器學(xué)習(xí)平臺。
分布式機(jī)器學(xué)習(xí)開源平臺對于人工智能領(lǐng)域有著重要意義,它解決了數(shù)據(jù)持續(xù)增長和機(jī)器學(xué)習(xí)模型逐漸復(fù)雜化與計(jì)算能力受限的矛盾,大幅降低機(jī)構(gòu)和個(gè)人進(jìn)入分布式機(jī)器學(xué)習(xí)應(yīng)用的門檻。而隨著產(chǎn)業(yè)界和學(xué)術(shù)界越來越多的研究人員使用該平臺,這一方面會貢獻(xiàn)更多的數(shù)據(jù),才促進(jìn)深度學(xué)習(xí)算法的完善。另一方面,人工智能的發(fā)展除了算法和數(shù)據(jù)之外,也離不開應(yīng)用場景,現(xiàn)在,眾多開發(fā)人員可以使用該平臺進(jìn)行自身領(lǐng)域的應(yīng)用開發(fā),比起科技巨頭將深度學(xué)習(xí)僅用于自身業(yè)務(wù)有了更好的開放性,能夠更加有利于深度學(xué)習(xí)技術(shù)更加廣泛的商業(yè)化應(yīng)用。
因此,不管是Apache Hadoop和Spark等開源平臺,還是IBM的沃森開放平臺和百度剛剛發(fā)布的「深盟」開放平臺,都會借助這種開放式、分布式的合作機(jī)制充分調(diào)動群體協(xié)作和智慧,以更好的促進(jìn)機(jī)器學(xué)習(xí)實(shí)現(xiàn)更加廣泛的應(yīng)用,更快的實(shí)現(xiàn)人工智能的產(chǎn)業(yè)化。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/4314.html
摘要:就國內(nèi)市場而言,百度云選擇三位一體戰(zhàn)略的時(shí)候不乏長遠(yuǎn)性思考。百度云將放在位的另一個(gè)用意正是在領(lǐng)域樹立差異化優(yōu)勢,并通過等深耕垂直場景。至少就目前來看,百度云已經(jīng)找到了最適合自己的競爭方式。2018年下半年,To B迎來了從未有過的熱度,也把云計(jì)算重新捧上了風(fēng)口浪尖。和幾年前新興業(yè)務(wù)的身份不同,處于風(fēng)暴中心的云計(jì)算,早已成為互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)者們最激烈的戰(zhàn)場,并相繼宣布了醞釀許久的動作。阿里在財(cái)...
摘要:浪潮云計(jì)算產(chǎn)品部副總經(jīng)理劉曉欣近日,版本正式發(fā)布,其在可管理性彈性可擴(kuò)展性等方面的持續(xù)提升,充分證明了正在日趨成熟與完善,已然成為業(yè)界公認(rèn)的成功開源項(xiàng)目之一,在業(yè)內(nèi)更是成了無可厚非的私有云實(shí)施標(biāo)準(zhǔn)。浪潮云計(jì)算產(chǎn)品部副總經(jīng)理劉曉欣近日,OpenStack ?Queens版本正式發(fā)布,其在可管理性、彈性、可擴(kuò)展性等方面的持續(xù)提升,充分證明了OpenStack正在日趨成熟與完善,OpenStack...
摘要:網(wǎng)絡(luò)啟動開啟了一個(gè)共享的新時(shí)代,與實(shí)體經(jīng)濟(jì)的結(jié)合讓項(xiàng)目變得更加有意義,區(qū)塊鏈已經(jīng)走向了我們。直到年,互聯(lián)網(wǎng)和區(qū)塊鏈終于從概念上走到了一起,就是這場流行起來的共享之風(fēng)。風(fēng)險(xiǎn)當(dāng)然,伴隨著區(qū)塊鏈項(xiàng)目的毫無疑問是高風(fēng)險(xiǎn)如影隨形。 作者簡介:董天一 ,IPFS/Filecoin中國區(qū)技術(shù)布道人 ,《IPFS指南》作者。畢業(yè)于北京大學(xué)軟件與微電子學(xué)院曾擔(dān)任甲骨文亞洲研發(fā)中心(中國)數(shù)據(jù)庫開發(fā)工程師...
閱讀 1107·2021-11-23 09:51
閱讀 1073·2021-10-18 13:31
閱讀 2965·2021-09-22 16:06
閱讀 4256·2021-09-10 11:19
閱讀 2195·2019-08-29 17:04
閱讀 425·2019-08-29 10:55
閱讀 2472·2019-08-26 16:37
閱讀 3368·2019-08-26 13:29