摘要:陳啟峰認為,這種技術前途大好,最終可以用于創造真正模擬現實世界的游戲場景。小學時,陳啟峰先后獲得全國作文競賽二等獎和奧數競賽一等獎。年,歲的陳啟峰發表論文,提出數據結構。
『凡所有相,皆是虛妄』
上面這張德國街道圖片,乍一看像是行車記錄儀拍的,又好像谷歌街景照片加了復古濾鏡。
實際上,這是一張合成圖片。
在谷歌地圖上,根本找不到這樣的街道。一個神經網絡,根據自己在訓練過程中見過的真實街道,生成了它。
比GAN更強
生成這張照片的算法出自英特爾實驗室的新論文Photographic Image Synthesis with Cascaded Refinement Networks,用級聯優化網絡生成照片。
在論文中,斯坦福大學博士陳啟峰和英特爾實驗室視覺組主管Vladlen Koltun展示了一種根據語義布局來合成照片的方法。所謂語義布局,就是像這樣,在圖片上標出各種物體的位置:
而他們的算法可以看作一個渲染引擎,輸入上面的圖片,就相當于告訴它圖片中間是道路、路上有車、上半部分有樹、有交通燈、右上有一些行人,然后按照圖上的布局,輸出一張逼真的照片。
陳啟峰在自己的博客中說,“好比機器想象出來的畫面?!?/p>
經過3000張德國街道照片的訓練,遇到輸入的布局上標注成“car”的部分,這個見過很多車的算法就會自己生成一輛車,填在那里。
現在一提到生成、或者合成圖像,可能大部分人都會立刻想到對抗生成網絡(GAN),不過,陳啟峰等的算法并沒有用到對抗式訓練,而只用了一個端到端訓練過的前饋網絡。
和各種往往只能生成小尺寸圖片的GAN不同,他們提出的方法可以“無縫擴展”到高分辨率,1024×2014像素的圖像也能搞定。
當然,他們在論文里也展示了自己的算法如何將各種基于GAN的生成模型秒成渣渣:
下面的視頻中,能更清楚的看到這個算法和pix2pix的對比:
這篇論文入選了今年10月在威尼斯舉辦的國際計算機視覺大會ICCV 2017,要進行口頭報告,相應的源代碼在GitHub上已經收獲了402個星,月初還登頂了GitHub熱門項目Python排行榜。
現實,夢境
康奈爾大學計算機系副教授Noah Snavely深受打動,他說,創建逼真的人工場景非常困難,即便是當今較好的方法也無法做到,而陳奇峰的系統生成出了他見過的較大、最詳細的人工場景。
他認為,這項技術可以讓人們描述一個世界,然后讓人工智能在虛擬現實中將其打造出來?!叭绻軌騼H憑大聲描述就能像魔法一樣召喚出逼真的場景,那就太好了?!彼f。
陳啟峰認為,這種技術前途大好,最終可以用于創造真正模擬現實世界的游戲場景。他說:“使用深度學習渲染視頻游戲可能成為未來的趨勢。”現在,他已經開始嘗試利用這套算法來替換《俠盜獵車手5》里的游戲場景。
不過,他對這個系統還有一點不滿:合成的畫面不夠逼真。陳啟·峰表示,因為這套神經網絡渲染細節的能力還無法達到我們的預期,所以目前生成的圖片比較模糊,有點像夢境。他正在開發一個更大的版本,希望能夠提升系統功能。
在這一點上,Snavely比作者還樂觀。他說,具體到構建虛擬現實場景,這種夢境般的效果未必是壞事,我們也不見得需要完全寫實的效果。
他更期待的,是讓這個系統能生成道路和室內布局之外的場景。Snavely說,要真正實現該系統的潛力,還是需要一套能夠真正捕捉現實世界多樣性的數據集。
但說起來容易做起來難,想用這個系統生成真是世界中的各種場景,需要借助大量的人力,對訓練中使用的圖片進行詳細標記。
關于陳啟峰
這篇論文的作者陳啟峰,經歷也頗為傳奇。陳啟峰生于1989年6月,成長于廣東省中山市。小學時,陳啟峰先后獲得全國作文競賽二等獎和奧數競賽一等獎。
2006年,17歲的陳啟峰發表論文,提出數據結構Size Balanced Tree(SBT)。2007年,陳啟峰在IOI上獲得推薦(第八名);2008年,陳啟峰以中學生身份獲得中山“十大杰出青年”稱號。
也是在2008年,陳啟峰放棄保送清華的資格,進入香港科技大學就讀,并獲得54萬港幣全額獎學金。期間全部22門計算機課程都獲得A+。2010年,陳啟峰獲得百度之星編程大賽第三名。
2011年,陳啟峰在ACM國際大學生程序設計競賽獲得推薦(全球第二,北美冠軍)。同年還獲得香港大學生編程比賽冠軍。
2012年,斯坦福、哈佛、麻省理工、普林斯頓、加州大學伯克利分校、哥倫比亞、康奈爾、加州大學洛杉磯分校、密歇根大學安娜堡分校九所高校,同時以全額獎學金錄取陳啟峰攻讀研究生學位,最終他入讀斯坦福。
最后,放一張陳啟峰6月的博士畢業照。
相關鏈接
項目主頁:
http://cqf.io/ImageSynthesis
論文:
http://web.stanford.edu/~cqf/papers/Photographic_Image_Synthesis_ICCV2017.pdf
代碼:
https://github.com/CQFIO/PhotographicImageSynthesis
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4592.html
摘要:關注我轉載請務必注明原創地址為前提上篇文章寫完了流程啟動的一部分,方法都入口,以及創建運行的必須環境以及相關配置,接著就是創建該環境的節點了。的創建看下新建節點的代碼代碼比較多,這里是比較關鍵的地方,我就把注釋直接寫在代碼上面了,實在不好 關注我 showImg(https://segmentfault.com/img/remote/1460000012730965?w=258&h=2...
摘要:和的區別,本想問下要不要深入的講下源碼級別,結果面試官說不用了。來分鐘不到,就再次打電話過來約了明早上午點的視頻面試。 出去面試的話還是得好好準備,不然會被虐的有點慘! 有贊(框架組) 四月份面試有贊的時候,自己還在實習,所以也沒有復習,是在 Boss 直聘上投的,當時看到了有贊的 2018 屆春招,就投了下,然后不知道怎么就被推到了框架組,結果后面就感覺自己被虐的可慘了。 關注我 s...
摘要:為什么要寫文章前邊也提到了本渣渣的寫作能力極差,高考語文分考出了一個物理應該有的成績。為什么并不是每個人都熱愛工作,但是每個人都在堅持工作呢主要的原因是為了生存,不過現在的我,通過工作也并不愁吃喝。 圖片描述寫作能力,就是一個人的隱形財富,我最喜歡的一個文化類節目《圓桌派》,更是讓我明白了,一個人只要還有一只筆在就不會是最窮的。自己特別喜歡聽這些老臘肉聊天。 昨天,我忙碌了將近四個小時...
閱讀 1356·2021-10-09 09:44
閱讀 1439·2021-09-28 09:36
閱讀 15925·2021-09-22 15:55
閱讀 1237·2021-09-22 15:45
閱讀 2198·2021-09-02 09:48
閱讀 2783·2019-08-29 17:19
閱讀 2296·2019-08-29 10:54
閱讀 905·2019-08-23 18:40