摘要:阿里妹導(dǎo)讀作為大神,賈揚(yáng)清讓人印象深刻的可能是他寫(xiě)的框架,那已經(jīng)是六年前的事了。經(jīng)過(guò)多年的沉淀,成為阿里新人的他,對(duì)人工智能又有何看法最近,賈揚(yáng)清在阿里內(nèi)部分享了他的思考與洞察,歡迎共同探討交流。
阿里妹導(dǎo)讀:作為 AI 大神,賈揚(yáng)清讓人印象深刻的可能是他寫(xiě)的AI框架Caffe ,那已經(jīng)是六年前的事了。經(jīng)過(guò)多年的沉淀,成為“阿里新人”的他,對(duì)人工智能又有何看法?最近,賈揚(yáng)清在阿里內(nèi)部分享了他的思考與洞察,歡迎共同探討、交流。
賈揚(yáng)清,浙江上虞人,畢業(yè)于清華大學(xué)自動(dòng)化系,在加州大學(xué) Berkeley 分校獲得計(jì)算機(jī)博士學(xué)位,目前擔(dān)任阿里計(jì)算平臺(tái)掌門(mén)人。
最近幾年深度學(xué)習(xí)的流行,大家一般認(rèn)為是從2012年 AlexNet 在圖像識(shí)別領(lǐng)域的成功作為一個(gè)里程碑。AlexNet 提升了整個(gè)業(yè)界對(duì)機(jī)器學(xué)習(xí)的接受程度:以前很多機(jī)器學(xué)習(xí)算法都處在“差不多能做 demo ”的程度,但是 AlexNet 的效果跨過(guò)了很多應(yīng)用的門(mén)檻,造成了應(yīng)用領(lǐng)域井噴式的興趣。
當(dāng)然,任何事情都不是一蹴而就的,在2012年以前,很多成功的因素已經(jīng)開(kāi)始逐漸顯現(xiàn):2009年的 ImageNet 數(shù)據(jù)庫(kù)奠定了大量標(biāo)注數(shù)據(jù)的基礎(chǔ);2010年開(kāi)始,IDSIA 的 Dan Ciresan 首次用 GPGPU 進(jìn)行物體識(shí)別;2011年,北京的 ICDAR 大會(huì)上,神經(jīng)網(wǎng)絡(luò)在中文離線識(shí)別上大放異彩。就算是 AlexNet 中用到的ReLU層,早在2001年神經(jīng)科學(xué)的文獻(xiàn)中就有提及過(guò)。所以,一定程度上說(shuō),神經(jīng)網(wǎng)絡(luò)的成功也是一個(gè)水到渠成的過(guò)程。2012年以后的事情,大家可以讀到很多,這里就不再贅述。
成功與局限在看待神經(jīng)網(wǎng)絡(luò)成功的同時(shí),我們也要進(jìn)一步深挖其背后的理論背景和工程背景,為什么神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在幾十年前失敗,但是現(xiàn)在卻成功了?它成功的原因是什么?而它的局限又在什么地方?我們這里只能片面地說(shuō)幾個(gè)重點(diǎn):
成功的原因,一點(diǎn)是大數(shù)據(jù),一點(diǎn)是高性能計(jì)算。
局限的原因,一點(diǎn)是結(jié)構(gòu)化的理解,一點(diǎn)是小數(shù)據(jù)上的有效學(xué)習(xí)算法。
大量的數(shù)據(jù),比如說(shuō)移動(dòng)互聯(lián)網(wǎng)的興起,以及 AWS 這樣低成本獲得標(biāo)注數(shù)據(jù)的平臺(tái),使機(jī)器學(xué)習(xí)算法得以打破數(shù)據(jù)的限制;由于 GPGPU 等高性能運(yùn)算的興起,又使得我們可以在可以控制的時(shí)間內(nèi)(以天為單位甚至更短)進(jìn)行 exaflop 級(jí)別的計(jì)算,從而使得訓(xùn)練復(fù)雜網(wǎng)絡(luò)變得可能。要注意的是,高性能計(jì)算并不僅限于 GPU ,在 CPU 上的大量向量化計(jì)算,分布式計(jì)算中的 MPI 抽象,這些都和60年代就開(kāi)始興起的 HPC 領(lǐng)域的研究成果密不可分。
但是,我們也要看到深度學(xué)習(xí)的局限性。今天,很多深度學(xué)習(xí)的算法還是在感知這個(gè)層面上形成了突破,可以從語(yǔ)音、圖像,這些非結(jié)構(gòu)化的數(shù)據(jù)中進(jìn)行識(shí)別的工作。在面對(duì)更加結(jié)構(gòu)化的問(wèn)題的時(shí)候,簡(jiǎn)單地套用深度學(xué)習(xí)算法可能并不能達(dá)到很好的效果。有的同學(xué)可能會(huì)問(wèn)為什么 AlphaGo 和 Starcraft 這樣的算法可以成功, 一方面,深度學(xué)習(xí)解決了感知的問(wèn)題,另一方面,我們也要看到還有很多傳統(tǒng)的非深度學(xué)習(xí)算法,比如說(shuō) Q-learning 和其他增強(qiáng)學(xué)習(xí)的算法,一起支撐起了整個(gè)系統(tǒng)。而且,在數(shù)據(jù)量非常小的時(shí)候,深度學(xué)習(xí)的復(fù)雜網(wǎng)絡(luò)往往無(wú)法取得很好的效果,但是很多領(lǐng)域,特別是類似醫(yī)療這樣的領(lǐng)域,數(shù)據(jù)是非常難獲得的,這可能是接下去的一個(gè)很有意義的科研方向。
接下去,深度學(xué)習(xí)或者更廣泛地說(shuō),AI 這個(gè)方向會(huì)怎么走?我個(gè)人的感覺(jué),雖然大家前幾年一直關(guān)注AI框架,但是近年來(lái)框架的同質(zhì)化說(shuō)明了它不再是一個(gè)需要花大精力解決的問(wèn)題,TensorFlow 這樣的框架在工業(yè)界的廣泛應(yīng)用,以及各種框架利用 Python 在建模領(lǐng)域的優(yōu)秀表現(xiàn),已經(jīng)可以幫助我們解決很多以前需要自己編程實(shí)現(xiàn)的問(wèn)題,因此,作為 AI 工程師,我們應(yīng)該跳出框架的桎梏,往更廣泛的領(lǐng)域?qū)ふ覂r(jià)值。
挑戰(zhàn)往上走,我們會(huì)遇到產(chǎn)品和科研的很多新挑戰(zhàn),比如說(shuō):
傳統(tǒng)的深度學(xué)習(xí)應(yīng)用,比如說(shuō)語(yǔ)音、圖像等等,應(yīng)該如何輸出產(chǎn)品和價(jià)值?比如說(shuō),計(jì)算機(jī)視覺(jué)現(xiàn)在基本還是停留在安防這個(gè)層面上,如何深入到醫(yī)療、傳統(tǒng)工業(yè),甚至社會(huì)關(guān)愛(ài)(如何幫助盲人看見(jiàn)這個(gè)世界?)這些領(lǐng)域,是不僅需要技術(shù),還需要產(chǎn)品的思考的。
除了語(yǔ)音和圖像之外,如何解決更多問(wèn)題。在阿里和很多互聯(lián)網(wǎng)企業(yè)中有一個(gè)“沉默的大多數(shù)”的應(yīng)用,就是推薦系統(tǒng):它常常占據(jù)了超過(guò)80%甚至90%的機(jī)器學(xué)習(xí)算力,如何將深度學(xué)習(xí)和傳統(tǒng)推薦系統(tǒng)進(jìn)一步整合,如何尋找新的模型,如何對(duì)搜索和推薦的效果建模,這些可能沒(méi)有像語(yǔ)音和圖像那么為人所知,卻是公司不可缺少的技能。
即使在科研方向,我們的挑戰(zhàn)也剛剛開(kāi)始:Berkeley 的教授 Jitendra Malik 曾經(jīng)說(shuō),“我們以前是手工調(diào)算法,現(xiàn)在是手工調(diào)網(wǎng)絡(luò)架構(gòu),如果囿于這種模式,那人工智能無(wú)法進(jìn)步”。如何走出手工調(diào)參的老路,用智能提升智能,是個(gè)非常有意思的問(wèn)題。最開(kāi)始的 AutoML 系統(tǒng)依然停留在用大量算力暴力搜索模型結(jié)構(gòu)的層面上,但是現(xiàn)在各種更高效的 AutoML 技術(shù)開(kāi)始產(chǎn)生,這是值得關(guān)注的。
機(jī)會(huì)往下走,我們會(huì)發(fā)現(xiàn)傳統(tǒng)的系統(tǒng)、體系結(jié)構(gòu)等知識(shí),計(jì)算機(jī)軟件工程的實(shí)踐,會(huì)給 AI 帶來(lái)很多新的機(jī)會(huì),比如說(shuō):
傳統(tǒng)的 AI 框架都是手寫(xiě)高性能代碼,但是模型如此多變,新的硬件平臺(tái)層出不窮,我們應(yīng)該如何進(jìn)一步提升軟件效率?我們已經(jīng)看到有通過(guò)編譯器技術(shù)和傳統(tǒng)的人工智能搜索方法來(lái)反過(guò)來(lái)優(yōu)化AI框架,比如 Google 的 XLA 和華盛頓大學(xué)的 TVM,這些項(xiàng)目雖然處于早期,但是已經(jīng)展現(xiàn)出它們的潛力。
平臺(tái)如何提升整合能力。在開(kāi)源領(lǐng)域,大家的做法是一個(gè)人,一臺(tái)機(jī)器,幾個(gè) GPU ,訓(xùn)練比較學(xué)院派的模型。但是在大規(guī)模應(yīng)用中,我們的數(shù)據(jù)量非常大,模型非常復(fù)雜,集群還會(huì)出現(xiàn)各種調(diào)度的挑戰(zhàn)(能不能一下子就要求256個(gè) GPU ?計(jì)算資源是否可以彈性調(diào)度?),這些對(duì)于我們自己的機(jī)器學(xué)習(xí)平臺(tái),以及云上向客戶提供的服務(wù),都提出了非常多的挑戰(zhàn)。
如何進(jìn)行軟硬件的協(xié)同設(shè)計(jì)。在深度學(xué)習(xí)的計(jì)算模式開(kāi)始逐漸固化的時(shí)候(比如說(shuō) CNN ),新硬件和特殊硬件(比如 ASIC )的優(yōu)勢(shì)就開(kāi)始體現(xiàn)出來(lái)了。如何實(shí)現(xiàn)軟硬件的協(xié)同設(shè)計(jì),防止“硬件出來(lái)了,不知道怎么寫(xiě)程序”或者“模型已經(jīng)變了,硬件一出來(lái)就過(guò)時(shí)了”這樣的問(wèn)題,會(huì)是將來(lái)幾年中很大的方向。
人工智能是一個(gè)日新月異的領(lǐng)域,我們有一個(gè)笑話說(shuō),2012年的科研成果,現(xiàn)在說(shuō)起來(lái)都已經(jīng)是上古時(shí)代的故事了??焖俚牡鷰?lái)的大量機(jī)遇和挑戰(zhàn)是非常令人興奮的,無(wú)論是有經(jīng)驗(yàn)的研究者還是新學(xué) AI 的工程師,在當(dāng)今云化,智能化的年代,如果能快速學(xué)習(xí)并刷新算法和工程的各種挑戰(zhàn),就可以通過(guò)算法創(chuàng)新引領(lǐng)并且賦能社會(huì)各個(gè)領(lǐng)域。這方面,人工智能領(lǐng)域開(kāi)源開(kāi)放的各種代碼,科研文章和平臺(tái)給大家創(chuàng)造了比以前更容易的入門(mén)門(mén)檻,機(jī)遇都掌握在我們自己手中。
閱讀原文
本文來(lái)自云棲社區(qū)合作伙伴“?阿里技術(shù)”,如需轉(zhuǎn)載請(qǐng)聯(lián)系原作者。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/19992.html
摘要:點(diǎn)擊訂閱云棲夜讀周刊作為大神,賈揚(yáng)清讓人印象深刻的可能是他寫(xiě)的框架,那已經(jīng)是六年前的事了。經(jīng)過(guò)多年的沉淀,成為阿里新人的他,對(duì)人工智能又有何看法最近,賈揚(yáng)清在阿里內(nèi)部分享了他的思考與洞察,歡迎共同探討交流?!军c(diǎn)擊訂閱云棲夜讀周刊】 作為 AI 大神,賈揚(yáng)清讓人印象深刻的可能是他寫(xiě)的AI框架Caffe ,那已經(jīng)是六年前的事了。經(jīng)過(guò)多年的沉淀,成為阿里新人的他,對(duì)人工智能又有何看法?最近,賈揚(yáng)...
摘要:點(diǎn)擊訂閱云棲夜讀周刊是阿里級(jí)計(jì)算平臺(tái),經(jīng)過(guò)十年磨礪,它成為阿里巴巴集團(tuán)數(shù)據(jù)中臺(tái)的計(jì)算核心和阿里云大數(shù)據(jù)的基礎(chǔ)服務(wù)?!军c(diǎn)擊訂閱云棲夜讀周刊】 MaxCompute 是阿里EB級(jí)計(jì)算平臺(tái),經(jīng)過(guò)十年磨礪,它成為阿里巴巴集團(tuán)數(shù)據(jù)中臺(tái)的計(jì)算核心和阿里云大數(shù)據(jù)的基礎(chǔ)服務(wù)。 熱點(diǎn)熱議 阿里靠什么支撐 EB 級(jí)計(jì)算力? 作者:技術(shù)小能手?發(fā)表在:阿里技術(shù) Tablestore Timestream:為海...
摘要:點(diǎn)擊訂閱云棲夜讀周刊在歷史文章如何成為優(yōu)秀的技術(shù)主管中,阿里巴巴高級(jí)技術(shù)專家云狄從開(kāi)發(fā)規(guī)范開(kāi)發(fā)流程技術(shù)規(guī)劃與管理三個(gè)角度,分享對(duì)技術(shù)的理解與思考?!军c(diǎn)擊訂閱云棲夜讀周刊】 在歷史文章《如何成為優(yōu)秀的技術(shù)主管?》中,阿里巴巴高級(jí)技術(shù)專家云狄從開(kāi)發(fā)規(guī)范、開(kāi)發(fā)流程、技術(shù)規(guī)劃與管理三個(gè)角度,分享對(duì)技術(shù) TL 的理解與思考。 熱點(diǎn)熱議 在阿里做了五年技術(shù)主管,我有話想說(shuō) 作者:技術(shù)小能手?發(fā)表在:...
閱讀 2458·2021-11-19 09:40
閱讀 3584·2021-11-17 17:08
閱讀 3784·2021-09-10 10:50
閱讀 2213·2019-08-27 10:56
閱讀 1942·2019-08-27 10:55
閱讀 2637·2019-08-26 12:14
閱讀 994·2019-08-26 11:58
閱讀 1493·2019-08-26 10:43