国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

拋棄黑箱,斯坦福大學(xué)與Facebook提出程序生成式圖像推理模型

everfight / 3062人閱讀

摘要:于是,這些黑箱模型經(jīng)常在學(xué)習(xí)過程中受到數(shù)據(jù)偏差的影響,而導(dǎo)致圖像推理的錯誤。程序生成器是由模型實現(xiàn)的。從左至右,每個問題都會向程序增加一個模塊,在上圖中,增加的模塊用下劃線表示。斯坦福大學(xué)表示將在最近將其開源。

深度學(xué)習(xí)著名學(xué)者 Yann LeCun 在社交網(wǎng)絡(luò)上也分享點評了這項研究:「在為視覺推理和問答學(xué)習(xí)生成程序上的非常棒的新成果。」

論文鏈接:https://arxiv.org/abs/1705.03633

研究演示頁面:http://cs.stanford.edu/people/jcjohns/iep/

GitHub 項目(Pytorch):https://github.com/facebookresearch/clevr-iep

在論文中,研究者稱該方法成功擺脫了深度學(xué)習(xí)黑箱狀態(tài)的缺陷,從而讓模型可以擺脫數(shù)據(jù)集偏見的影響。在僅接受少量訓(xùn)練后,該模型即可學(xué)會產(chǎn)生可用的程序;同時,它比典型的深度學(xué)習(xí)系統(tǒng)更加透明:通過 LSTM,模型可為不同任務(wù)創(chuàng)建可解釋的程序,這使我們能夠得知系統(tǒng)嘗試回答問題的「思路」。此外,該模型能夠概括人類提出的問題——而不是僅僅通過搜索訓(xùn)練數(shù)據(jù)來完成這個任務(wù)。

論文:推理和執(zhí)行視覺推理程序(Inferring and Executing Programs for Visual Reasoning)

摘要

現(xiàn)有的視覺推理方法通常使用黑箱架構(gòu)將輸入映射到輸出,而沒有對其中的推理過程建模。于是,這些黑箱模型經(jīng)常在學(xué)習(xí)過程中受到數(shù)據(jù)偏差的影響,而導(dǎo)致圖像推理的錯誤。受到網(wǎng)絡(luò)模塊的啟發(fā),本論文提出了一種視覺推理模型,其中包括一個程序生成器(program generator)——該組件構(gòu)造要執(zhí)行的推理過程的顯式表示;以及一個執(zhí)行引擎(execution engine)——執(zhí)行生成的程序以產(chǎn)生答案。程序生成器和執(zhí)行引擎均由神經(jīng)網(wǎng)絡(luò)實現(xiàn),并都使用了反向傳播和強化學(xué)習(xí)的組合進行訓(xùn)練。在 CLEVR 視覺推理基準(zhǔn)上,我們展示了新模型具有顯著強于其他方法的性能,并在進行設(shè)置后具有推廣到多種任務(wù)上的潛力。

正如前文所述,該模型有兩個組件構(gòu)成:

程序生成器:讀取問題文本,輸出可執(zhí)行解答問題的程序。程序生成器是由 LSTM sequence-to-sequence 模型實現(xiàn)的。

執(zhí)行引擎:負(fù)責(zé)對圖像執(zhí)行生成出的程序以產(chǎn)生答案,由神經(jīng)網(wǎng)絡(luò)模塊實現(xiàn)。

它們是互相獨立訓(xùn)練的基礎(chǔ)功能模塊,這些模塊根據(jù)預(yù)測的程序進行組合,為每個問題提供專屬的神經(jīng)網(wǎng)絡(luò)架構(gòu)。

圖 1. 系統(tǒng)結(jié)構(gòu)示意

圖 2. 組合推理是無人機導(dǎo)航、自動駕駛、監(jiān)視攝像頭等應(yīng)用中在復(fù)雜環(huán)境下所需的關(guān)鍵功能,然而目前的機器學(xué)習(xí)方式無法有效實現(xiàn)這樣的能力。

圖 3. 模型對預(yù)測答案最終特征圖的分?jǐn)?shù)之和進行了規(guī)范化和可視化。從左至右,每個問題都會向程序增加一個模塊,在上圖中,增加的模塊用下劃線表示。中間的可視化圖說明了當(dāng)執(zhí)行問題回答的推理時模型所關(guān)注的熱點區(qū)域。

圖 5. 該方法和其他方式在 CLEVR-CoGenT 數(shù)據(jù)集上的回答問題準(zhǔn)確度對比(數(shù)字越高越好)。

圖 5 上表:研究者們用條件 A 訓(xùn)練了模型,隨后在條件 A 和條件 B 下測試模型的性能。然后,研究者們將這些模型在條件 B 中用 3000 個圖片和 30,000 個問題進行了微調(diào),再在 A、B 條件中進行了測試。新模型在條件 A 中使用了 18,000 個程序,而在條件 B 的微調(diào)中沒有使用任何程序。最后,他們研究了在條件 B 上進行微調(diào)時使用不同數(shù)量的數(shù)據(jù)的影響。

圖 7. CLEVR-Humans 數(shù)據(jù)集中的問題示例,以及新模型預(yù)測的程序和答案。沒有出現(xiàn)在 CLEVR 中的問題被加上了下劃線。一些預(yù)測的程序與問題的語義完全匹配(綠色);一些程序與問題語義非常匹配(黃色);一些程序與問題無關(guān)(紅色)。

CLEVR-Humans 數(shù)據(jù)集是有關(guān) CLEVR 數(shù)據(jù)集中圖片的問題組成的數(shù)據(jù)集,目前由包含 17,817 個問題的訓(xùn)練集,7,202 個問題的驗證集和 7,145 個問題的測試集組成。斯坦福大學(xué)表示將在最近將其開源。

研究者們認(rèn)為,該模型可以通過訓(xùn)練后的模組對新場景生成概括和問題,這些學(xué)習(xí)模塊甚至可以推斷自由形式的人類問題。雖然這些結(jié)果令人鼓舞,但仍然有許多問題不能使用該方法固定的模塊組合來解決。例如,問題「具有獨特形狀物體的顏色是什么?」需要一個模塊來識別相對特殊的形狀,目前沒有模塊可以處理這樣的任務(wù)。由于該模型通用的模塊設(shè)計,將模塊添加到模型中是很簡單的事情,但是在沒有監(jiān)督的情況下自動識別和學(xué)習(xí)出新模塊仍是理論上較好的形式。一個前進的道路是設(shè)計一個圖靈完整的模塊集,這樣可以在不學(xué)習(xí)新模塊的情況下表達(dá)所有程序。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/4558.html

相關(guān)文章

  • 揭開深度學(xué)習(xí)黑箱:希伯來大學(xué)計算機科學(xué)教授提出「信息瓶頸」

    摘要:耶路撒冷希伯來大學(xué)的計算機與神經(jīng)科學(xué)家提出了一項名為信息瓶頸的新理論,有望最終打開深度學(xué)習(xí)的黑箱,以及解釋人腦的工作原理。 耶路撒冷希伯來大學(xué)的計算機與神經(jīng)科學(xué)家 Naftali Tishby 提出了一項名為「信息瓶頸」(Information Bottleneck)的新理論,有望最終打開深度學(xué)習(xí)的黑箱,以及解釋人腦的工作原理。這一想法是指神經(jīng)網(wǎng)絡(luò)就像把信息擠進瓶頸一樣,只留下與一般概念更為...

    desdik 評論0 收藏0
  • 【LeCun臺大演講】AI最大缺陷是缺乏常識,無監(jiān)督學(xué)習(xí)突破困境

    摘要:無監(jiān)督式學(xué)習(xí)是突破困境的關(guān)鍵,采用無監(jiān)督學(xué)習(xí)的對抗訓(xùn)練讓擁有真正自我學(xué)習(xí)的能力。如何讓擁有人類的常識認(rèn)為要用無監(jiān)督式學(xué)習(xí)。強化學(xué)習(xí)是蛋糕上不可或缺的櫻桃,所需要資料量可能大約只有幾個,監(jiān)督式學(xué)習(xí) 6 月 29 日,臺灣大學(xué)。卷積神經(jīng)網(wǎng)絡(luò)之父、FacebookAI 研究院院長 Yann LeCun 以「Deep Learning and the Path to AI」為題,對深度學(xué)習(xí)目前的發(fā)展...

    villainhr 評論0 收藏0
  • 從Pix2Code到CycleGAN:2017年深度學(xué)習(xí)重大研究進展全解讀

    摘要:文本谷歌神經(jīng)機器翻譯去年,谷歌宣布上線的新模型,并詳細(xì)介紹了所使用的網(wǎng)絡(luò)架構(gòu)循環(huán)神經(jīng)網(wǎng)絡(luò)。目前唇讀的準(zhǔn)確度已經(jīng)超過了人類。在該技術(shù)的發(fā)展過程中,谷歌還給出了新的,它包含了大量的復(fù)雜案例。谷歌收集該數(shù)據(jù)集的目的是教神經(jīng)網(wǎng)絡(luò)畫畫。 1. 文本1.1 谷歌神經(jīng)機器翻譯去年,谷歌宣布上線 Google Translate 的新模型,并詳細(xì)介紹了所使用的網(wǎng)絡(luò)架構(gòu)——循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。關(guān)鍵結(jié)果:與...

    kuangcaibao 評論0 收藏0
  • Yann Lecun自監(jiān)督學(xué)習(xí)指南(附114頁Slides全文)

    摘要:近年來,深度學(xué)習(xí)在計算機感知自然語言處理和控制方面取得了重大進展。位列新澤西州的發(fā)明家名人堂,并獲得年神經(jīng)網(wǎng)絡(luò)先鋒獎年杰出研究獎年終身成就獎和來自墨西哥的名譽博士學(xué)位。 Yann Lecun是卷積網(wǎng)絡(luò)模型的發(fā)明者,該模型被廣泛地應(yīng)用于模式識別應(yīng)用中,因此他也被稱為卷積網(wǎng)絡(luò)之父,是公認(rèn)的世界人工智能三巨頭之一。 2018年11月08日,他來到加州大學(xué)圣巴巴拉分校,為在場師生作了一場關(guān)于自監(jiān)督學(xué)...

    yiliang 評論0 收藏0
  • 最全知識圖譜綜述#2: 構(gòu)建技術(shù)典型應(yīng)用

    摘要:知識圖譜開源庫或簡稱是一個用于構(gòu)建語義和關(guān)聯(lián)數(shù)據(jù)應(yīng)用程序的自由和開源的框架。垂直行業(yè)應(yīng)用下面將以金融醫(yī)療電商行業(yè)為例,說明知識圖譜在上述行業(yè)中的典型應(yīng)用。 知識圖譜構(gòu)建的關(guān)鍵技術(shù)1 知識提取2 知識表示3 知識融合4 知識推理知識推理則是在已有的知識庫基礎(chǔ)上進一步挖掘隱含的知識,從而豐富、擴展知識庫。在推理的過程中,往往需要關(guān)聯(lián)規(guī)則的支持。由于實體、實體屬性以及關(guān)系的多樣性,人們很難窮舉所有...

    duan199226 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<