国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

谷歌 GAN 生成人臉:對抗創造新藝術風格,128像素擴展到4000

imtianx / 1644人閱讀

摘要:一段時間以來,我一直在嘗試使用生成神經網絡制作人物肖像。生成圖像的質量與低分辨率輸出實現密切相關。在第一階段,根據給定描述生成相對原始的形狀和基本的色彩,得出低分辨圖像。使用生成的圖像比現有方法更加合理逼真。

一段時間以來,我一直在嘗試使用生成神經網絡制作人物肖像。早期試驗基于類似 Deep Dream 的方法,但最近我開始將精力集中在 GAN 上面。當然,無論在什么時候,高精度和較精確的細節都是很難實現的,使用 GAN 生成人臉也一樣。首先,這些網絡的感受野往往不到 256×256 像素的大小。

解決這個問題的一種辦法是使用 stack GAN。我用基于 stack GAN 的方法,終于將像素提升到 768×768 的大小,最多使用 3 個階段 stack 將像素提升到了 4k×4k。我不在意結果是否真實,但細節紋理逼真很重要。

為了減少 artifact(模糊不清的地方),我需要應對 mode collapse 等各種問題。具體說,光滑皮膚和多毛皮膚之間,第二階段 GAN 是 meta stable,往往導致輸出變成一塊一塊的。

現在我使用的最多是 vanilla GAN。當然,我覺得我也該試一下 WGAN、CramerGAN 或 BEGAN,因為大家都說后面幾種收斂更好。

下面就是我使用 GAN 生成的空想人物肖像(我選了效果比較好的放上來)。

生成圖像的質量與低分辨率輸出(lowres output)實現密切相關。我通常在第一階段生成 128×128 或者 256×256 像素的結果,然后在第二階段提升至 768×768 或者 1024×1024。大多數情況下,生成的結果都很糟糕,遠遠沒有我挑選出來的這幾張好,但有些時候會出現非常富有藝術性的圖像,偶爾看上去還像是有藝術風格誕生。

我在最后的第三階段將像素提升到 4k。但是,實際上我并沒有這個像素級別的訓練數據,也就是說,網絡做的只是大致預測邊緣是否平滑等等。

系統不可能知道皮膚高分辨率的人臉數據庫。毛孔或睫毛這些細節。因此,我們需要一個與高分辨率的人臉數據庫。

考慮到最終的印刷效果,在這種分辨率下故意保留一些 artifact 可能還不錯(相比 )。

Mike Tyka 參考了下面這篇論文中所提到的方法 Stack-GAN,并且在論文基礎上做了 3 次堆疊。有興趣你也可以一試:)

摘要

根據文本描述合成逼真圖像是計算機視覺一大挑戰,也有很多應用。使用現有方法合成的圖像在細節和生動方面差強人意。本文中,我們提出 StakeGAN 方法,根據文本描述生成逼真的圖像。在第一階段(Stage-I GAN),GAN 根據給定描述生成相對原始的形狀和基本的色彩,得出 Stage-I 低分辨圖像。Stage-II GAN 將 Stage-I GAN 和文本描述作為輸入,生成高分辨率的逼真圖像。Stage-II GAN 能夠修正錯誤,增加令人信服的效果和細節。使用 StackGAN 生成的圖像比現有方法更加合理逼真。最重要的是,StackGAN 根據文本第一次生成 256×256 像素的圖像,現有方法最多只能生成 128×128 像素的圖像。

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識

QQ群:81035754

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4568.html

相關文章

  • GAN之父Ian Goodfellow加盟蘋果

    摘要:據報道,生成對抗網絡的創造者,前谷歌大腦著名科學家剛剛正式宣布加盟蘋果。他將在蘋果公司領導一個機器學習特殊項目組。在加盟蘋果后會帶來哪些新的技術突破或許我們很快就會看到了。 據 CNBC 報道,生成對抗網絡(GAN)的創造者,前谷歌大腦著名科學家 Ian Goodfellow 剛剛正式宣布加盟蘋果。他將在蘋果公司領導一個「機器學習特殊項目組」。雖然蘋果此前已經縮小了自動駕駛汽車研究的規模,但...

    everfly 評論0 收藏0
  • 從Pix2CodeCycleGAN:2017年深度學習重大研究進展全解讀

    摘要:文本谷歌神經機器翻譯去年,谷歌宣布上線的新模型,并詳細介紹了所使用的網絡架構循環神經網絡。目前唇讀的準確度已經超過了人類。在該技術的發展過程中,谷歌還給出了新的,它包含了大量的復雜案例。谷歌收集該數據集的目的是教神經網絡畫畫。 1. 文本1.1 谷歌神經機器翻譯去年,谷歌宣布上線 Google Translate 的新模型,并詳細介紹了所使用的網絡架構——循環神經網絡(RNN)。關鍵結果:與...

    kuangcaibao 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<