摘要:我認為對機器學(xué)習(xí)開發(fā)者來說,是一個了不起的工具集。這個帖子發(fā)出后得到了很多機器學(xué)習(xí)研究者和開發(fā)者的關(guān)注,他們紛紛跟貼談?wù)撟约旱南敕ê徒?jīng)驗不只是關(guān)于和,討論中還涉及到更多工具。
Theano、TensorFlow、Torch、MXNet 再到近日比較熱門的 PyTorch 等等,深度學(xué)習(xí)框架之間的比較一直以來都是非常受人關(guān)注的熱點話題。機器之心也曾發(fā)表過多篇相關(guān)的介紹和對比文章,如《主流深度學(xué)習(xí)框架對比:看你最適合哪一款?》、《五大主流深度學(xué)習(xí)框架比較分析:MXNET 是較好選擇》、《對比深度學(xué)習(xí)十大框架:TensorFlow 最流行但并不是較好》和《從 TensorFlow 到 Theano:橫向?qū)Ρ绕叽笊疃葘W(xué)習(xí)框架》。
不過你知道用戶實際用起來的感覺怎么樣嗎?近日,Reddit 用戶 cjmcmurtrie 發(fā)了一個主題為「PyTorch vs. TensorFlow」的討論帖,想要了解這兩大流行的框架之間各自有什么優(yōu)勢。
原帖地址:https://redd.it/5w3q74?
帖子一樓寫道:
我還沒有從 Torch7 遷移到 TensorFlow。我玩過 TensorFlow,但我發(fā)現(xiàn) Torch7 更加直觀(也許是我玩得不夠?)。我也嘗試了一點 PyTorch,所以我決定先看看效果。
使用了幾周 PyTorch 之后,我認為我現(xiàn)在還不必遷移到 TensorFlow,至少在我感興趣的項目上還不需要。用 PyTorch 寫自定義模塊真是簡單至極。而且其動態(tài)圖構(gòu)建(dynamic graph construction)給我之前需要熬夜實現(xiàn)(或等待列表上)的東西帶來了很多新想法。我認為對機器學(xué)習(xí)開發(fā)者來說,PyTorch 是一個了不起的工具集。我也知道 TensorFlow 的社區(qū)資源要強大得多,但如果要開發(fā)全新的項目(而不是為已有的架構(gòu)重新寫代碼或閱讀教程),社區(qū)也不一定能有很大的幫助。
這個 Reddit 帖子發(fā)出后得到了很多機器學(xué)習(xí)研究者和開發(fā)者的關(guān)注,他們紛紛跟貼談?wù)撟约旱南敕ê徒?jīng)驗(不只是關(guān)于 PyTorch 和 TensorFlow,討論中還涉及到更多工具)。機器之心在這里選擇其中一些我們認為有價值的評論,希望能夠給你的學(xué)習(xí)和研究帶來幫助。以下按贊成數(shù)量排序。
ajmooch的回復(fù):
我一直在做一個 TensorFlow 的項目,所以我可以公正地在 Theano+Lasagne, PyTorch 和 Tensorflow 三者之間做一個比較。但對于前兩者,我可以給出一些漫漫的看法。
背景:大概在一年前我開始接觸 Theano+Lasagne,并在我的兩篇論文中使用了它。我上周改換到 PyTorch,并重新建了兩個我以前用 Theano 實現(xiàn)的關(guān)鍵項目。
API:Theano 的圖形構(gòu)建和編譯工作方式讓我學(xué)習(xí)起來很費勁,但一旦我找到了它的竅門,一切都迎刃而解(這也許會花費兩個月,但是我仍舊在學(xué)習(xí) Python 和基本的神經(jīng)網(wǎng)絡(luò)方面的東西,所以對這一速度的參考價值持保留態(tài)度)。Lasagne 的 API,對我來說,就像是優(yōu)雅的凱瑟琳女皇騎著逆戟鯨展開了戰(zhàn)斗,也就是說我愛死它了。如果我提前知道我有多想要一個 Theano 的程式庫去工作,我一定會寫一個程式庫,這大大地減輕了繁重的勞動。
PyTorch 的 API,另一方面來說感覺有些粗糙,但對它有一些限定詞,這個稍后再談。如果你只是做一些標準的任務(wù)(實現(xiàn) ResNet 或者 VGG)我認為你不會有問題,但我一直都有一些分歧因為我所做的一切都有些奇怪。舉個例子,在我當前的項目中,因為 strided 張量索引(tensor indexing)還未實現(xiàn),我必須使用幾個 hacky 解決方法,雖然當前的索引技術(shù)非常靈活,比起直接使用 numpy 風(fēng)格的索引,它們少了很多直觀性。中心的限定條件是,它們確實只是釋放 friggin 的框架,當然并不是一切都實現(xiàn),還有一些待解決的問題。Theano 發(fā)展時間長且已經(jīng)成熟,我并沒有觀察到它或者 Lasagne 在這個過程中遇到過困難。
除此之外,對于 PyTorch 我較大的「抱怨」基本上是在神經(jīng)網(wǎng)絡(luò) API 方面「事情并未按照我讓他們組合的方式進行放置」。具體來說,我非常喜歡 Lasagne 的「層次(layers)」范式—但是一點點批判性的思維就會讓你得出這個結(jié)論,這個范式尤其不適合動態(tài)圖框架。我完全習(xí)慣于考慮并且優(yōu)化我關(guān)于靜態(tài)圖形定義的思考過程,所以轉(zhuǎn)換 API 方法是一個小的痛點。這非常重要-我花了很長時間思考「好吧,既然我不能使用自己的標準流控制寫出一個常規(guī)的程序一樣,寫出這個圖的 Theano,那么我該如何定義它呢,」這讓我在思維的道路上變得越來越強大。
然而,動態(tài)圖需要一個與「定義+運行」基本不同的 API,雖然我個人認為它并不直觀,就在上周其多帶帶執(zhí)行定義的方法,正如 CJ 所說,打開了我的思路并給了我?guī)资畟€項目的想法,這在以前是不可能的。我還想象,如果你在任何你想的地方使用 RNNs 做任何事情,比如,在沒有消耗計算的前提下實現(xiàn)動態(tài)計算,接口的命令性質(zhì)將會使它更容易這樣做。
速度:所以我沒有做廣泛的基準測試,但是我驚訝的發(fā)現(xiàn),PyTorch 是可以立即使用的,在我當前的項目的單 GPU 的訓(xùn)練時間比 theano+lasagne 快 100%。我已經(jīng)在 Geforce gtx 980 和 Titan X 上測試了它,并實現(xiàn)了已經(jīng)確認相同且在合理的誤差范圍內(nèi)的網(wǎng)絡(luò)。100% 逐字地在 CIFAR100 上從(在最簡單的情況下)5 分/歷元到 2.5 分/歷元,并且在某些情況下降到 2 分鐘/歷元(即,快兩倍)
這是相同的模板代碼,使用了相同的數(shù)據(jù)提取程序(我不得不諷刺地說「fetcher」沒有思考「去死吧,F(xiàn)ETCHER(DIE, FETCHER!)」),除了實際的代碼,訓(xùn)練和運行網(wǎng)絡(luò),一切都相同。
這讓我感到驚訝,因為我的印象是,Theano 的廣泛和積極的內(nèi)存優(yōu)化(在這種情況下,當你開始訓(xùn)練,只需花費幾分鐘進行編譯)意味著它在單 GPU 下的速度非常快。我不知道什么導(dǎo)致了速度的提升,或者,因為他們同樣都使用了 cuDNN 的版本(我仔細地檢查了一遍以確保的確是這樣),所以這一切的收獲一定在天空的某一個地方,但我并不知道會在哪里。
相關(guān)地,使用 Theano 工作時,我從來沒有能夠得到多 GPU 或者半精度浮點數(shù)。我花了好幾天的時間試圖讓 libgpuarray 工作,并使用 platoon 試圖進行修復(fù),但每次我都會精疲力盡(想象一下即使我可以得到編譯的資源也不會如此困難,這已經(jīng)是一個痛點了)。然而,立即使用的 PyTorch 的數(shù)據(jù)并行性(單節(jié)點,4 GPU)和半精度(用于卷積的 pseudo-FP16,這意味它不會變快但是會使用更少的內(nèi)存)問題就解決了。當時就是這樣。
開發(fā)團隊交互:我與兩個框架的核心開發(fā)團隊一直交流的非常愉快。對于 Lasagne 和 Theano,我遇到了一些困難,很多奇怪的問題。很多次,他們總是快速且簡潔地幫我弄清楚什么錯了(我通常不明白)。PyTorch 團隊同樣有幫助—我一直在提出我遇到的錯誤或問題,并得到及時的反映,通常會在當天修復(fù),或者得到解決方法或得到問題跟蹤。我并沒有在 Keras 或者 Tensorflow 上工作,但是我看過他們的「問題」日志和一些用戶組,只是因為大量的用戶,這些框架看起來并不會得到這種個人的關(guān)注 - 就像是我去 Cal Poly(加州理工州立大學(xué))一樣,在這個地方,教授/學(xué)生的比例很高,你很少看到一個班中有超過 20 個學(xué)生,然而在 Berkeley 你能看到 1000 人的演講廳。這并非批評 Cal 的孩子或者暗示 berkeley 盲目擴招,但如果你是一個像我一樣開發(fā)非標準神經(jīng)網(wǎng)絡(luò)的人(我并不是在說 Chuck Tingle weird),然而從一個實際構(gòu)建框架的人那里得到快速的反饋,這是非常寶貴的能力。
Misc:我擔(dān)心一個特別的問題(為什么我打算幾年拾起 TensorFlow 并將它作為主要框架),Theano 和 PyTorch 都沒有為部署設(shè)計,開發(fā)團隊它看上去并沒有把重心放在 PyTorch 上(雖然在這方面,我可能看錯了,我模糊的記得我在論壇的帖子上看到過這個)。我想要練習(xí)將一些東西放置在網(wǎng)站或者 droid app 上(主要是為了娛樂,但我一直都非常專注于研究并認為這是一個真正有用的技能,可以實際獲得我在設(shè)備上所做的東西),我不確定其他的框架能很好地支持這種方式。
相關(guān)地,PyTorch 的分布式框架仍然是實驗性的,最近我聽說 TensorFlow 在設(shè)計時就考慮到了分布式,所以如果你需要運行真正的大規(guī)模項目,TensorFlow 多半是較好的。
TL;DR:我并不是試圖推薦哪個框架比較好;我至死都愛 Lasagne(可能更多),但我已經(jīng)發(fā)現(xiàn)動態(tài)圖的靈活性和其快速地、難以理解的增益的速度。我在上個星期安裝了 PyTorch 并且只用了非常少的時間就上手了,我想我不太可能回頭了。我并不是很了解 TensorFlow。但能從 PyTorch 開發(fā)者那里得到及時反饋對我來說是很重要的一點,因為我正在做一些看來有點奇怪的研究,但在未來我也可能為一些項目重新使用 TensorFlow。這個討論帖非常棒,但我希望在你閱讀過后的印象是:這是他們的主觀經(jīng)驗,而不是一個刻板的印象如:「就是這樣,你會感到同樣的方式」。
taion的回復(fù):
我們最近從 Theano+Lasagne 轉(zhuǎn)到了 TensorFlow。
我還沒有嘗試過任何分布式的架構(gòu),但總體上用過 Theano 之后再用 TensorFlow 感覺非常熟悉——甚至更好。對你提到的幾點,回復(fù)如下:
等效的圖形編譯(graph compilation)要快得多;我們用了幾秒而不是幾分鐘。但是它仍然不夠快,如果我們想要將它的大部分添加到我們的 CI 套件(CI suite),但我們不需要等待很長時間來開始訓(xùn)練。
從 Lasagne 轉(zhuǎn)到 TensorFlow 之后,我喜歡 tf.layers 和 tf.contrib.layers 中更高層次的功能;它們?yōu)榻邮軓埩浚╰ensor)并返回張量的功能性 API,因此更容易與「原始」的 TensorFlow 集成。我們可以做普通的張量操作,而不用寫一個層那么麻煩。
在我們使用的模型上,TensorFlow 的速度稍稍快于 Theano(20%-30%)。當?shù)谝淮问褂脮r,我們看到大致相同的性能,并認為這可以接受,但然后我們閱讀 TensorFlow 的性能指南(https://www.tensorflow.org/performance/performance_guide),并切換到 NCHW 并融入批處理規(guī)范(batch norm),然后一切運行得更快了。我猜 Theano 本身就不是很快……
關(guān)于開發(fā)人員的反饋速度:我曾在 TF 的問題區(qū)提出了一些微不足道的問題,但 TF 開發(fā)人員通常在一兩天內(nèi)就回復(fù)我了。
此外,工具是相當好的。TensorBoard 好用,用來表示的時間線(timeline)/跟蹤(trace)的工具也一樣好用。但是我還沒有嘗試新加入的 tfdbg。
TensorFlow 當然也有幾個缺點,例如在實踐中部署到 iOS,但這說來話長。使用 TensorFlow 不是沒有痛苦,但與需要 Python runtime 的 Theano 相比,這還算什么事情嗎?這是相當大的進步。
如果你使用 TensorFlow,我強烈建議你看看 tf.layers 或 TF-Slim。具體的說,tf.layers 本質(zhì)上嵌入了 Keras API。
盡管我不指望任何有意義的性能差異;本帖討論的操作最終定義了一個靜態(tài)計算圖形(computation graph),所以使用像 Keras 這樣的包裝器本身并不增加資源消耗,除了在圖形定義時最小的資源占用,但是如果你原來使用 Theano,你會感到 TensorFlow 的啟動時間快得多(以秒計而不是以分鐘計的編譯速度)。
遵循 TensorFlow 性能指南(TensorFlow performance guide)非常有用。在 DenseNet(L = 40,k = 12)模型上,從默認的 NHWC 和未融入批處理規(guī)范切換到 NCHW 和融入批處理規(guī)范后,我們的每個 epoch 時間都下降了超過 30%。在 WRN-16-4 模型上,我們看到 epoch 時間下降了超過 20%。
badmephisto的回復(fù):
我認為在深度神經(jīng)網(wǎng)絡(luò)庫的設(shè)計方面,PyTorch 目前已然接近啟發(fā)的高度。
它屬于輕量級;
它目前位于 Python 中;
它使你能夠明確地控制計算。沒有編譯器能自己妄圖變聰明來「幫助你」,或是將你的代碼加速;事實上大多編譯器在調(diào)試中會產(chǎn)生大量麻煩;
它使 GPU 內(nèi)核調(diào)用之上僅有少量(可解釋的)抽象層,而這恰恰是高性能的保證;
也許這是個人偏好,但我得到了與抽象有關(guān)的特定 OCD。每當我要做艱巨的工作時都會很緊張,因為一旦我的未來被泄漏,我便能感覺到它那些無法擺脫且難以忍受的痛苦。相對簡單的事情理應(yīng)在引擎蓋之下發(fā)生的大多數(shù)情況下,這種感覺尤為強烈;
調(diào)試更容易,因為特定代碼中會是特定行(而不是在距離使用大型或生成的 Graph 對象的 sess.run()很遠的地方)失敗。你的堆棧跟蹤不會填滿三個屏幕來讓你玩「找找錯誤在哪里!」的豎版卷軸游戲;
不存在編譯時間。我無法理解 Theano 用戶是如何處理的,他們一定更有耐心;
你可以直接操作漸變,顯然,做一些事情時可以更容易,也更自然(如在反向傳播過程中的漸變剪輯,或各種「破碎的反向傳播」的有關(guān)想法,就像最近的 Shake Shake reg 命令一樣;的確,我認為你可以用 stop_gradient 破解一個解決方案);
它對動態(tài)圖的支持從一開始就是自上而下的設(shè)計原則,而非隨之而至的事后想法。并且我們會看到更多的動態(tài)圖表,如做成一大塊 NLP,或是神經(jīng)模塊網(wǎng) ;
它沒有縮進或膨脹你的代碼的顯式會話對象;
它獲得的抽象是正確的:raw numpy - > Tensors(但 GPU 上的 raw numpy 可能對深度學(xué)習(xí)一無所知!)- >變量(它們了解深度學(xué)習(xí)),并且 Modules 或 Optim 等等會稍有益處。
到目前為止,我與 TF 的有關(guān)經(jīng)驗有些膨脹,所以即便是像數(shù)據(jù)驅(qū)動初始化這樣理應(yīng)很簡單的事情,也會用到一些 tricks。當然,TF 的開發(fā)者有他們的一套解決方案,但往往涉及你從未聽說過的 5 個 TensorFlow 函數(shù)的組合。我不記得曾用 Torch 做過這些,又或許我現(xiàn)在做的事情更復(fù)雜。
免責(zé)聲明:我仍行進于對 PyTorch 進行嘗試的漫漫征途中;所以我的經(jīng)驗是基于在 TensorFlow 做了很多復(fù)雜事情,而在 PyTorch 上才剛剛開始的背景上得到的。讓我們看看未來會發(fā)生什么。
jeremyhoward的回復(fù):
對于 http://course.fast.ai 的第 2 部分,我們從 keras + theano(第 1 部分)切換到 Keras、TensorFlow 和 PyTorch 合用的狀態(tài)。一般而言,使用 PyTorch 總是令人愉快的,主要是因為:
動態(tài)計算使很多事情更加容易,如 seq2seq + attention 的神經(jīng)翻譯很難通過 keras + tf 來實現(xiàn),但使用 PyTorch 便會很容易;
更容易調(diào)試,因為你可以只使用標準的 PyThon 工具;
PyTorch 讓自定義的實現(xiàn)更加容易,所以你得以將更多時間專注于算法中,這樣往往能夠改進主要性能;
使 Multi-gpu 簡單易懂;
Torch-vision 使加載和變換圖像變得容易。
TensorFlow 的 API 非常荒謬,它在每個階段都會重新發(fā)明輪子,并且要求開發(fā)者學(xué)習(xí)很多本不必要的新概念。然而,開發(fā)者峰會表示這一境況正在改善——而且同時使用 TensorFlow Servin 和 Cloud ML 會提高你的生產(chǎn)力。
Powlerbare的回復(fù):
我大約在半年前使用 TensorFlow 實現(xiàn)了一些 seq2seq 模型,并意識到為何 TensorFlow 很好用:它的內(nèi)置組件很棒,讓研究變得就像有老師在推動著你一樣容易,而注意與損失函數(shù)就如同噪聲對比估測,等等。倘若我收集基線或修改函數(shù),一切都會變?nèi)菀住N乙呀?jīng)習(xí)慣于搜索代碼庫,并確定究竟哪種函數(shù)在運作(如果不小心,某些可選的函數(shù)默認值便會得到不好的結(jié)果)——并且我對基于這些實現(xiàn)的大部分報告結(jié)果非常有信心。
下面是幾點與我所愛的 PyTorch 有關(guān),而 TensorFlow 卻不會提供的事項:
1)PyTorch 提供了一個強化功能,我很喜歡它。增強功能基本上不會在實現(xiàn)中產(chǎn)生過多資源消耗,能有一些內(nèi)置函數(shù)來調(diào)用 RL 的感覺真棒。
2)我并未大量使用 autograd,因為那時它速度很慢,但人們感覺用它來做一些沒譜的事情很有趣。我是這個范例的死忠粉,因為我沒來由地鐘愛在 numpy 上編寫網(wǎng)絡(luò)。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/4481.html
摘要:截止到今天,已公開發(fā)行一周年。一年以來,社區(qū)中的用戶不斷做出貢獻和優(yōu)化,在此深表感謝。所以與衡量它的指標包括在機器學(xué)習(xí)研究論文中的使用。來自香港科技大學(xué)的在上推出了面向普通觀眾的在線課程。 Yann LeCun Twitter截止到今天,PyTorch 已公開發(fā)行一周年。一年以來,我們致力于打造一個靈活的深度學(xué)習(xí)研究平臺。一年以來,PyTorch 社區(qū)中的用戶不斷做出貢獻和優(yōu)化,在此深表感謝...
摘要:第一個深度學(xué)習(xí)框架該怎么選對于初學(xué)者而言一直是個頭疼的問題。簡介和是頗受數(shù)據(jù)科學(xué)家歡迎的深度學(xué)習(xí)開源框架。就訓(xùn)練速度而言,勝過對比總結(jié)和都是深度學(xué)習(xí)框架初學(xué)者非常棒的選擇。 「第一個深度學(xué)習(xí)框架該怎么選」對于初學(xué)者而言一直是個頭疼的問題。本文中,來自 deepsense.ai 的研究員給出了他們在高級框架上的答案。在 Keras 與 PyTorch 的對比中,作者還給出了相同神經(jīng)網(wǎng)絡(luò)在不同框...
摘要:幸運的是,這些正是深度學(xué)習(xí)所需的計算類型。幾乎可以肯定,英偉達是目前執(zhí)行深度學(xué)習(xí)任務(wù)較好的選擇。今年夏天,發(fā)布了平臺提供深度學(xué)習(xí)支持。該工具適用于主流深度學(xué)習(xí)庫如和。因為的簡潔和強大的軟件包擴展體系,它目前是深度學(xué)習(xí)中最常見的語言。 深度學(xué)習(xí)初學(xué)者經(jīng)常會問到這些問題:開發(fā)深度學(xué)習(xí)系統(tǒng),我們需要什么樣的計算機?為什么絕大多數(shù)人會推薦英偉達 GPU?對于初學(xué)者而言哪種深度學(xué)習(xí)框架是較好的?如何將...
摘要:數(shù)據(jù)科學(xué)包括機器學(xué)習(xí),數(shù)據(jù)分析和數(shù)據(jù)可視化首先,機器學(xué)習(xí)是什么解釋機器學(xué)習(xí)的最佳方法是給你一個簡單的例子。機器學(xué)習(xí)算法的工作方式大致相同。這是一個人們競爭為特定問題構(gòu)建最佳機器學(xué)習(xí)算法的網(wǎng)站。 showImg(https://segmentfault.com/img/remote/1460000018887722); 來源 | 愿碼(ChainDesk.CN)內(nèi)容編輯 愿碼Sloga...
閱讀 2715·2021-11-22 13:52
閱讀 1184·2021-10-14 09:43
閱讀 3637·2019-08-30 15:56
閱讀 2952·2019-08-30 13:22
閱讀 3269·2019-08-30 13:10
閱讀 1563·2019-08-26 13:45
閱讀 1102·2019-08-26 11:47
閱讀 2788·2019-08-23 18:13