摘要:機器視覺背后得深卷積神經網絡的結構和大腦負責視覺得結構之間有著驚人的相似之處。這結果顯示了使用卷積神經網絡來幫助探測人類認知過程的可能性。
深卷積神經網絡浪潮席卷人工智能領域。這些程序在某些方面能比人類做得更好,從面部和物體識別到玩古老的游戲--圍棋等。
神經網絡受到了由大腦結構的啟發。機器視覺背后得深卷積神經網絡的結構和大腦負責視覺得結構之間有著驚人的相似之處。其中的一個進化了數百萬年,另一個是僅發展了短短幾十年。但似乎都以同樣的方式工作。
這引發了一個有趣的問題,如果機器視覺和人類視覺用類似的方式工作,他們是否也有同樣的不足?人類和機器是否不能解決同樣的視覺挑戰?
首先是一些背景信息。在腦中負責視力的神經在有很多層,他們被認為從圖像中提取逐步的詳細信息,如運動,形狀,顏色,等等。每一層是一個龐大的神經元網絡。
深卷積神經網絡具有類似的結構。他們也有層的結構,并且每個層由模仿大腦神經元的電路結構組成,神經網絡的術語就是這么來的。
經過多次試驗,計算機科學家們發現,這些神經網絡層識別圖像最好的時候,每個層逐步地提取更多信息。而且當他們看每個層的多帶帶行為時,他們發現和大腦神經層有顯著的相似性。
為了找到答案,Kheradpisheh 教授和他的合作人員用了四種物件的識別難度各異的圖片,然后測試人類和深卷積神經網絡的識別能力。
該團隊讓 89 個人每人識別 960 個圖像。研究人員使用每個實驗者反應的速度和準確性作為他們識別圖片的測量。
該小組還在兩個用于物體識別的最強大的深度卷積網絡進行了等效試驗,一個在加拿大多倫多大學開發,另一個在牛津大學開發。
結果是非常有趣的。 “我們發現,人類和深卷積神經網絡很大程度上每一種變化的相對困難程度詳細,” Kheradpisheh教授說 “3d旋轉是迄今為止最難識別的,其次是放大縮小,然后在平面內旋轉。”
這結果顯示了使用卷積神經網絡來幫助探測人類認知過程的可能性。這項技術或許可以在某些圖像的設計中應用,如空中交通管制,緊急出口,使用救生設備等的指令等。
原文連接: https://www.technologyreview.com/s/601387/why-machine-vision-is-flawed-in-the-same-way-as-human-vision/
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19603.html
摘要:近年來機器學習領域隨著深度神經網絡的崛起而迎來新一波的春天,尤其最近兩年無論學界還是業界,或是各大媒體,甚至文盲老百姓都言必稱智能。 近年來機器學習、AI領域隨著深度神經網絡(DNN)的崛起而迎來新一波的春天,尤其最近兩年無論學界還是業界,或是各大媒體,甚至文盲老百姓都言必稱智能。關于這方面,可討論的東西實在太多太多,我不想寫成一本厚厚的書,所以在此僅以機器學習在計算機視覺和圖像領域的人臉識...
摘要:本文以機器翻譯為例,深入淺出地介紹了深度學習中注意力機制的原理及關鍵計算機制,同時也抽象出其本質思想,并介紹了注意力模型在圖像及語音等領域的典型應用場景。 最近兩年,注意力模型(Attention Model)被廣泛使用在自然語言處理、圖像識別及語音識別等各種不同類型的深度學習任務中,是深度學習技術中最值得關注與深入了解的核心技術之一。本文以機器翻譯為例,深入淺出地介紹了深度學習中注意力機制...
摘要:研究證明,用于加工聽覺信號的腦區可用于視覺任務。我們已經發現為計算機圖像視覺通道開發出來的圖形處理單元,也可以用于加快語音和語言的機器學習任務。 最初針對視覺信號設計出來的 CNN 也能處理聽覺信號,最終幫助機器傾聽和更好地理解我們。 CNN 在某些程度上能遷移學習,掌握多種模式的共同特征。有一系列神經網絡機器學習方法不只是「有深度的」。在這段時間,針對先進的語音技術和人工智能的神經網絡變得...
摘要:列車高速撞上來,壓碎了這輛自動駕駛汽車,乘客當場死亡。的計算機科學家阿塔利表示我們可以把這些東西看作是人工智能網絡會以某種方式處理的輸入信息,但機器在看到這些輸入信息后會做出一些意想不到的反應。谷歌大腦正在研發智能機器。 簡評:如果人工智能犯了錯怎么辦? 乘客看到了停車標志,突然感到一陣恐慌,因為他搭乘的自動駕駛汽車反而開始加速。 當他看到前面的鐵軌上一列火車向他們疾馳而來時,他張開嘴...
摘要:深度學習推動領域發展的新引擎圖擁有記憶能力最早是提出用來解決圖像識別的問題的一種深度神經網絡。深度學習推動領域發展的新引擎圖深度神經網絡最近相關的改進模型也被用于領域。 從2015年ACL會議的論文可以看出,目前NLP最流行的方法還是機器學習尤其是深度學習,所以本文會從深度神經網絡的角度分析目前NLP研究的熱點和未來的發展方向。我們主要關注Word Embedding、RNN/LSTM/CN...
閱讀 1184·2023-04-25 17:05
閱讀 3010·2021-11-19 09:40
閱讀 3543·2021-11-18 10:02
閱讀 1739·2021-09-23 11:45
閱讀 3021·2021-08-20 09:36
閱讀 2782·2021-08-13 15:07
閱讀 1133·2019-08-30 15:55
閱讀 2459·2019-08-30 14:11