摘要:問深度學習社區現在面臨的主要挑戰是什么答打擊炒作發展倫理意識獲得科學嚴謹性。深度學習簡直是科學的重災區。
Keras之父、谷歌大腦人工智能和深度學習研究員Fran?ois Chollet撰寫了一本深度學習Python教程實戰書籍《Python深度學習》,書中介紹了深度學習使用Python語言和強大Keras庫,詳實新穎。
近日,Fran?ois Chollet接受了采訪,就“深度學習到底是什么”、“Python為何如此廣受歡迎”、“目前深度學習面臨的主要挑戰”等議題進行了回答。他認為,目前很多深度學習領域的論文都是無意義的,因為這些研究使用了不科學、不規范的研究方法。以下是采訪全文編譯。
關于本人
問:您主要的工作內容是什么?
答:我在谷歌大腦團隊工作,花了很多時間開發Keras。我也參加TensorFlow的工作。最近我主要在寫機器學習、計算機視覺、將深度學習應用于定理證明等方面的論文。我的主要研究興趣是理解AI中的抽象和推理問題,如何從感知得到抽象的、高度概括的模型。
深度學習的本質、挑戰、和未來
問:深度學習到底是什么?
答:深度學習是機器學習的一種具體方法。與以前的方法相比,它更加強大和靈活。在大多數應用程序中,我們所說的“深度學習”是指一種把大量由人類注釋的數據轉換為以與人類相似的方式自動注釋新數據的軟件。您可以通過這種方式自動完成很多不同的任務。深度學習尤其擅長理解“感知”數據,如圖像、視頻或聲音。
?
我來舉例說明。假設有很多圖片都帶有相關聯標簽(如“貓”、“狗”)。深度學習可以讓你自動將數據轉換到一個“了解”如何把圖片映射到標簽的系統,只需從示例中學習,無需任何手動調整或自定義工程。然后這種系統可以被應用到新的數據,將標記圖片任務有效自動化。
?
同樣,你可以將深度學習應用于機器翻譯、語音識別、文本到語音轉換,光學字符識別等問題。
問:深度學習社區現在面臨的主要挑戰是什么?
答:打擊炒作、發展倫理意識、獲得科學嚴謹性。
?
炒作:對人工智能的大肆炒作正在危害這個領域。一些人正荒謬地夸大目前AI取得的進展,還說人工智能已把人類逼到了絕境。但事實并非如此。如果我們把目標設得極高,卻又不能實現,就是逼著公眾站在我們的對立面上。而且,炒作AI這件事,本質上是不誠實的,對公眾討論也產生了危害。
?
倫理: 現在部署人工智能系統的大多數人來自單一背景,他們往往沒有意識到自己所構建的系統給人們帶來了道德影響和副作用。這將成為一個問題,因為這個群體所擁有的權力會越來越大。我們需要更多地討論這些問題,并提高人們對不道德使用AI的潛在行為的覺察力,例如具有偏見性的預測模型會影響公眾生活,或以危險的方式操縱AI。
?
科學: 每天都有大量的深度學習論文發表,其中大多數并沒有真正產生任何有意義的新知識,因為這些論文沒有遵循科學的研究方法。他們以模糊的方式“評估”模型,或者在他們的訓練數據上測試過度擬合模型(尤其是生成模型和強化學習,這是深度學習研究中發展最快的兩個主題),僅在MNIST上評估模型等。深度學習簡直是科學的重災區。同行評審通常不會以有意義的方式解決這些問題,也許部分原因是大多數同行評審員進入這個領域最多才一兩年。如果想要取得更快的進展,那么當涉及研究可重復性、基線、模型評估和統計顯著性時,我們需要更加嚴謹。我們目前的激勵機制是與科學相對立的:發表論文是被鼓勵的。如果你的研究聽起來既復雜又神秘,很難被正確評估研究重要性,那么發表論文就容易多了。
問:你認為深度學習的未來是什么?
答:我期望AI未來能把“直觀的”模式識別模塊與正式推理模塊相結合。我也希望AI能夠演變得更像自動化軟件開發的形式,借用目前軟件工程中的很多模式和實踐。
寫書動機
問:你出版了一本新書《Python深度學習》。為什么要寫這本書呢?
答:寫這本書的原因是,我想推出一個課程,來教那些已有Python編程能力,但沒有機器學習背景的人。
Python為何廣受歡迎
問:Python應該是目前發展最快的編程語言,至少在高收入國家是這樣。為什么Python如此受歡迎?
答:我愛Python。學習Python很容易上手,當你習慣使用它之后,會越來越高效。與我使用過的大多數其他語言相比,Python非常直觀和優雅。但是Python真正的殺手锏并不在于語言本身,而是周圍的生態系統和社區。無論你需要做什么,比如解析特定的文件格式或與特定系統連接,幾乎有一個Python庫在做這件事,你不必花時間去做。在數據科學和機器學習方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,這使得Python成為一種非常高效的語言。
?
我喜歡Python的另一個原因是,它并不是一個領域特定的語言,而是多領域的交叉點,從網站開發到數據科學和系統管理。這意味著無需切換到新語言來將Keras模型部署為Web API。無論你需要做什么,無論是啟動一個web應用程序,查詢一個REST API,還是解析一些文件,訓練較先進的深度學習模型,Python通常都會是一個很好的選擇。
給初學者的建議
問:有些聲音認為進入機器學習有壁壘。您如何看待?
答:我不同意。在過去的5年中,進入機器學習領域變得非常容易。當然,5-7年前這很艱難。你可能需要研究生教育。你需要用C ++或Matlab來編寫大量的低級算法。我經歷過這些。而現在不一樣了。你只需要Python,很容易上手,你有權限訪問高級和易于使用的工具(如Keras)。另外,你可以在網上學到很多非常高質量的資源,你可以在Kaggle上練習現實世界的問題。學習從未如此簡單。
?
問:對于初學者來說,最重要的是什么?
答:最重要的是要深刻了解深度學習能做什么,不能做什么。去感受一些best practice,比如如何正確評估模型,如何防止過度擬合。這需要把正式解釋(formal explanations)和對現實問題的廣泛實踐結合起來。
?
原文地址:https://www.datacamp.com/community/blog/interview-francois-chollet
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4702.html
摘要:摘要本文以過來人的身份將自身年的研究經驗做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。此外,還有各種會議也值得關注。三大會議分別是以及。此外,當演講者向現場觀眾演講時,他們往往優先考慮的是清晰度而不是簡潔性。 摘要: 本文以過來人的身份將自身2年的研究經驗做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。 人工智能研究這個領域是有一定門檻的。對于初學...
摘要:在上個月發表博客文章深度學習機器學習模式識別之后,博士博士后及聯合創始人這一次帶領我們回顧年來人工智能領域三大范式邏輯學概率方法和深度學習的演變歷程。最令人興奮的,后來的頻率論與貝葉斯之爭,是一些被稱為概率圖模型的東西。 在上個月發表博客文章《深度學習vs機器學習vs模式識別》之后,CMU博士、MIT博士后及vision.ai聯合創始人Tomasz?Malisiewicz這一次帶領我們回顧5...
摘要:年的深度學習研討會,壓軸大戲是關于深度學習未來的討論。他認為,有潛力成為深度學習的下一個重點。認為這樣的人工智能恐懼和奇點的討論是一個巨大的牽引。 2015年ICML的深度學習研討會,壓軸大戲是關于深度學習未來的討論?;谄胶饪紤],組織方分別邀請了來自工業界和學術界的六位專家開展這次圓桌討論。組織者之一Kyunghyun Cho(Bengio的博士后)在飛機上憑記憶寫下本文總結了討論的內容,...
閱讀 2078·2021-11-23 10:13
閱讀 2788·2021-11-09 09:47
閱讀 2737·2021-09-22 15:08
閱讀 3312·2021-09-03 10:46
閱讀 2230·2019-08-30 15:54
閱讀 909·2019-08-28 18:09
閱讀 2429·2019-08-26 18:26
閱讀 2341·2019-08-26 13:48