摘要:我認為在大多數深度學習中,算法層面上隨機梯度的下降是大家所認可的。但目前似乎存在兩個問題計算層面納什平衡達不到可能會退化。
去年我一直在研究如何更好地調整GANs中的不足,但因為之前的研究方向只關注了損失函數,完全忽略了如何尋找極小值問題。直到我看到了這篇論文才有所改變:
詳解論文: The Numerics of GANs
我參考了Mar的三層分析,并在計算層面上仔細考慮了這個問題:我們這樣做的最終目標是什么?我相信GANs在這個層面已經有所突破了,因為他們試圖優化錯誤的東西或尋求不存在的平衡等。這就是為什么我喜歡f-GANs、Wasserstein GANs、實例噪聲,而不大喜歡在優化層面上做一些修復的嘗試:比如DCGAN或改進技術(Salimans等,2016)等原因。我認為在大多數深度學習中,算法層面上隨機梯度的下降是大家所認可的。你可以去提升它,但是如果沒有突破性進展,它通常不需要修復。
但閱讀本文后,我有一個啟示:
GANs可以同時在計算層面和算法層面有所突破
即使我們修復了目標,我們也沒有算法工具來尋找實際解決方案。
文章摘要:
結合我目前在研究的內容,我將通過一個不同的視覺來分析該論文
介紹關于收斂與不收斂的矢量場的概念,并強調其一些屬性然后描述Mescheder等人文章提出的 consensus、optimization等方面的一些結論:在復雜的不收斂矢量場與理想的收斂矢量場之間進行插值
最后,正如我研究的期望那樣,我還強調了另一個重要的細節,一個在文中沒有討論的:我們應該如何在小批量設置中做到所有這些?
簡介:從GAN到矢量場
GANs可以被理解為博弈游戲(一個各不相互合作的雙人游戲)。一個玩家控制θ并希望較大化其收益f(θ,φ),另一個控制φ并尋求較大化g(θ,φ)。當兩個玩家都不再會通過改變參數來提高收益的時候游戲就達到了納什均衡。因此,現在我們必須要設計一個算法來幫助達到這個納什均衡。
但目前GANs似乎存在兩個問題:
1.計算層面:納什平衡(Nash equilibrium)達不到可能會退化。
2.算法層面:我們依然還沒有找到可靠的工具來達到納什均衡(即使我們現在的算法能很好的收斂到局部納什均衡)。
Mescheder等在2017年非常成功地解決了第二個問題,為了找到納什均衡,我們較好的工具是同步梯度上升算方法,一個由以下遞歸定義的迭代算法:
起初大家覺得這是一個重要的發現,可能看起來還挺矛盾的:將GANs訓練視為神經網絡訓練的一個特殊例子是很自然的,但實際上它是另外一種方法。
同步梯度下降算法(simultaneous gradient descent)是梯度下降算法的概括,而不是特例。
不收斂的矢量場
普通梯度下降算法與同步梯度下降算法(simultaneous gradient descent)的一個關鍵區別在于,前者只能夠收斂到向量場的固定點,后者可以處理不收斂的向量場。因此,我想花大部分在這篇文章里談論這個差異以及這些術語是什么意思。
我們經常在機器學習中遇到的則是另一個種(但不經常將其視為矢量場)是由自動編碼器定義的矢量場。 AE的輸入一些向量x,并返回另一個相同大小的向量v(x)。比如在圖5是Alain和Bengio在201年對2D數據的自動編碼去噪聲的矢量場訓練,效果相當不錯:
由AE定義的矢量場不一定是收斂的,這意味著可能會產生一些不確定性的奇奇怪怪的問題。會有什么樣的奇怪的事情產生呢?讓我們來看一個極端的例子:恒定卷積矢量場,這是一個非常典型的不收斂矢量場例子:
這個向量場在零和游戲中經常出現(譯者注:zero-sum game就是指“零和博弈”,指參與博弈的各方,在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠為“零”,雙方不存在合作的可能),其中。這和Salimans等人在2016年論文“Improved Techniques for Training GANs”中第3節里面提到的對抗生成網絡的框架里的一個小例子非常相似。如同在圓圈中的矢量場,可以很明顯的看到它 場中的旋轉。事實上,如果你沿著這個矢量場(同時這也是梯度下降的方向)的箭頭,你最終會進入圈子里,如圖所示:
可以把此矢量比作與埃舍爾的《不可思議城堡》(譯者注:埃舍爾,荷蘭 版畫家,因其繪畫中的數學性而聞名,有興趣的可以看看《不可能存在的存在》:http://www.360doc.com/content/17/0705/08/27794381_668875548.shtml)。在埃舍爾的“不可能存在的城堡”中,仆人認為他們正在上臺階或者是在下臺階,但實際上他們所做的都是圍繞著圈子。當然如果要將Escher的城堡構建成是一個真正的3D 模型則是不可能的。類似地,不可能將卷積矢量場表示為標量函數的梯度。
一個壞消息是,即使旋度場在處具有平衡點,同步梯度下降算法也將永遠發現不了。雖然我們我們共認梯度下降算法能在局部收斂到最小值,但是同步下降算法一般不能收斂到均衡點。它會陷入一個死循環,基于動量的變量甚至可以積累無限的動量直到完全崩潰。
一致優化方法(Consensus optimization):訓練一個不收斂的矢量場
Mescheder等人提出的解決方案是從原始構造一個收斂的矢量場,如下:?因為我們將它定義為標量函數L的梯度,這顯然是收斂的。很容易看出,這個新的矢量場-?L具有與v相同的固定點。下面我繪制了對應于上述旋度場的收斂矢量場-?L:
這和我們之前熟悉的一樣,L的梯度下降要收斂到局部最小值,即固定點v。現在的問題是,我們無法控制我們收斂到什么樣的固定點。我們要尋求一個正平衡,但是-δL不能區分鞍點(既不是極大值點也不是極小值點的臨界點)或平衡,或負平衡或正平衡之間。如下圖說明了矢量場
在左側的圖片中,我注釋了平衡點和鞍點。中間的圖片說明了收斂松弛點L,其中鞍點和平衡都轉向局部最小值。?
那我們該怎么辦?我們可以簡單地采用原始v和它相關的-?L進行線性組合,這種組合仍然是不收斂的矢量場看起來像旋度場(即上圖第三個圖片)。
通過這兩個矢量場的組合,我們可能會得到一個稍微更好的模型,但仍然是不收斂的矢量場。衡量矢量場的效果的一種方法是查看其雅可比矩陣v"(x)的特征值。雅可比矩陣是矢量場的導數,對于收斂的矢量場,它被稱為海森矩陣或二階導數(譯者注:關于雅可比矩陣和海森矩陣可以參閱網絡資料——http://jacoxu.com/jacobian%E7%9F%A9%E9%98%B5%E5%92%8Chessian%E7%9F%A9%E9%98%B5/)。與總是對稱的海森矩陣不同,非收斂場的雅可比是非對稱的,它可以具有復雜的特征值。例如旋度場的雅可比矩陣是
其特征值完全是虛構的+ i和-i。
Mesceder等人通過將v與-?L線形組合,可以控制組合場的特征值(詳見論文),如果我們選擇足夠大的γ,則同步梯度下降算法將收斂到平衡。這真的是太贊了(6666666)!
可悲的是,當我們增加γ時,我們也會像以前一樣引入虛假的均衡。這里所謂的平衡,其實際上只是v的鞍點。所以我們不能一味的關注γ,我們必須找到一個合理的中間地帶。這是這種方法的局限性,目前尚不清楚實際中極限是多少。
再說說另一種方法:隨機梯度方法的變種
平均指標(average norm)和總體方差(population variance )可以以無偏差的方式估計。 我已經和作者討論過了,我會邀請他們發表評論,說明他們在實驗中是如何做到的。 他們還承諾會在會議集影印版的論文中描述更多的細節。
總結
這篇論文讓我開拓了視野,本來我一直認為在我們對抗生成網絡中使用的梯度下降算法只是梯度下降的一種特殊情況,但實際上它只是是一個泛化,梯度下降的良好屬性在這里并不能被認為是理所當然有的。希望這篇文章可以給大家帶來一個對抗生成網絡的滿意答案。
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4664.html
摘要:生成式對抗網絡簡稱將成為深度學習的下一個熱點,它將改變我們認知世界的方式。配圖針對三年級學生的對抗式訓練屬于你的最嚴厲的批評家五年前,我在哥倫比亞大學舉行的一場橄欖球比賽中傷到了自己的頭部,導致我右半身腰部以上癱瘓。 本文作者 Nikolai Yakovenko 畢業于哥倫比亞大學,目前是 Google 的工程師,致力于構建人工智能系統,專注于語言處理、文本分類、解析與生成。生成式對抗網絡—...
摘要:但是在傳統的機器學習中,特征和算法都是人工定義的。傳統的深度學習中,是由人來決定要解決什么問題,人來決定用什么目標函數做評估。 隨著柯潔與AlphaGo結束以后,大家是不是對人工智能的底層奧秘越來越有興趣?深度學習已經在圖像分類、檢測等諸多領域取得了突破性的成績。但是它也存在一些問題。首先,它與傳統的機器學習方法一樣,通常假設訓練數據與測試數據服從同樣的分布,或者是在訓練數據上的預測結果與在...
摘要:運用深度學習,這個系統能夠根據輸入的圖形用戶界面截圖直接輸出對應的代碼,從而省去前端手動編寫代碼的過程。如果二者存在任何長度上的差異,同樣會被認定為錯誤。我們相信未來將與人類協作,而不是代替人類。 UI設計和前端工程師之間,可能還需要一個神經網絡。近日,位于哥本哈根的一家創業公司Uizard Technologies開發出了一個名為pix2code的系統。運用深度學習,這個系統能夠根據輸入的...
摘要:但年在機器學習的較高級大會上,蘋果團隊的負責人宣布,公司已經允許自己的研發人員對外公布論文成果。蘋果第一篇論文一經投放,便在年月日,斬獲較佳論文。這項技術由的和開發,使用了生成對抗網絡的機器學習方法。 GANs「對抗生成網絡之父」Ian Goodfellow 在 ICCV 2017 上的 tutorial 演講是聊他的代表作生成對抗網絡(GAN/Generative Adversarial ...
閱讀 2069·2023-04-25 22:58
閱讀 1415·2021-09-22 15:20
閱讀 2699·2019-08-30 15:56
閱讀 1995·2019-08-30 15:54
閱讀 2111·2019-08-29 12:31
閱讀 2734·2019-08-26 13:37
閱讀 597·2019-08-26 13:25
閱讀 2102·2019-08-26 11:58