摘要:去年,微軟和谷歌展示了能比人類更準確地識別圖像的系統。深度學習就是你可以使用關鍵字搜索存儲在谷歌的照片更多信息,能識別你照片中你朋友的原因。圖像識別中使用的神經網絡類型,被稱為卷積網,受到了動物的視覺皮層方面研究的啟發。
圖像識別技術近來進步飛速。去年,微軟和谷歌展示了能比人類更準確地識別圖像的系統。
這些進步得益于一個叫做深度學習的技術,它涉及將數據通過模擬神經元的網絡,以培養該網絡在未來過濾數據(更多信息見“Teaching Machines to Understand Us”)。深度學習就是你可以使用關鍵字搜索存儲在谷歌的照片(更多信息),Facebook 能識別你照片中你朋友的原因。 在圖像識別上使用深度學習也使得機器人和自動駕駛汽車更有可行性,它甚至可以徹底改變醫學(更多信息)。
圖像識別技術的能力和靈活性來自于, 當人工神經網絡收到很多圖像和圖像類別的信息時,它可以自動計算出來重要的視覺特征。在深度學習中使用的神經網絡被布置成不同的層,數據一層一層根據順序通過。在訓練過程中,在神經網絡中的不同的層成為專門識別不同類型的視覺特征的網絡層。圖像識別中使用的神經網絡類型,被稱為卷積網,受到了動物的視覺皮層方面研究的啟發。
“這些神經網絡相比傳統的計算機視覺方法,是一個巨大的飛躍,因為它們直接從數據中得出結果?!瘪R修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在內的公司組織和搜索照片和視頻的服務) 的 CEO 說。程序員們曾經需要寫出尋找視覺特征所需的數學程序,然而這些程序并不能創造出很多有用的產品。
當蔡勒還是一個研究生的時候, 他在紐約大學與羅博·宏泰合作開發了一種可視化神經網絡運作的方法。在這個鏈接中的幻燈片中的圖像將帶你來到這個深度學習網絡的內部,這個用了130萬張照片訓練過,打敗了人類的圖像識別神經網絡。該網絡識別了 1000 個截然不同的物件,包括蚊帳和蚊子,而幻燈片上顯示了每個圖像中最強烈的激活神經元網絡的一個網絡層的視覺特征。
原文鏈接:https://www.technologyreview.com/s/60111...
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19607.html
摘要:需要識別的驗證碼圖像,其中包含個字符數字字母驗證碼圖片來源思路灰度化將圖像轉為灰度圖像,即一個像素只有一種色階有種不同灰度,值為表示像素最黑,值為表示像素最白。 需要識別的驗證碼圖像,其中包含 4 個字符(數字字母) showImg(https://segmentfault.com/img/remote/1460000016055387); 驗證碼圖片來源:http://my.cnki...
摘要:通過生成高質量的行人圖像,將其與行人重識別模型融合,同時提升行人生成的質量和行人重識別的精度。若使用這些低質量的行人生成圖像來訓練行人重識別模型,會引入與原始數據集之間的差異。首次提出了利用生成的圖像輔助行人重識別的特征學習。 前幾天英偉達開源了DG-Net的源碼。讓我們來回顧一下這篇CVPR19 Oral的論文。 論文是英偉達(NVIDIA), 悉尼科技大學(UTS), 澳大利亞國立...
閱讀 2784·2021-09-01 10:30
閱讀 1680·2019-08-30 15:52
閱讀 965·2019-08-29 18:40
閱讀 1116·2019-08-28 18:30
閱讀 2391·2019-08-23 17:19
閱讀 1321·2019-08-23 16:25
閱讀 2700·2019-08-23 16:18
閱讀 2977·2019-08-23 13:53