6張圖像vs13000張圖像，超越2013 Kaggle貓狗識別競賽領先水平

RdouTyping 發布于2019-04-25 18:18 / 3426人閱讀

摘要：年，舉辦過一個很受歡迎的貓狗識別競賽。當時，正如比賽官網宣布的，在使用張貓和狗的圖像進行訓練后，較先進的算法分辨貓狗的準確率是。醫學診斷異常檢測圖像識別的工業應用，等等。小結結果令人吃驚。

2013年，Kaggle舉辦過一個很受歡迎的貓狗識別競賽（Dogs vs. Cats）。比賽的目標是訓練一種能夠檢測圖像中是否包含貓或者狗的算法。

當時，正如比賽官網宣布的，在使用13000張貓和狗的圖像進行訓練后，較先進的算法分辨貓狗的準確率是82.7%。

我的結果

我應用了遷移學習的方法，這是一種訓練模型完成其他類似任務，然后重新訓練它來完成當前的任務的技術。

我微調了一個VGG19模型，使用6張隨機選擇的圖像（如下圖）：

在經過41 epochs的訓練后，我的模型達到了89.97%的準確率。驗證集大小是24994。

你可以在我的GitHub倉庫找到所需要的所有東西來重現這個實驗：https://github.com/radekosmulski/dogs_vs_cats

這個結果是完全出乎意料的。我所使用的技術在fast.ai的“Practical Deep Learning for Coders”課程的第一節課就被介紹過，在課程提供的Jupyter筆記中，它需要7行代碼來執行遷移學習。

這意味著，任何會在電腦上移動文件的人都能夠學會將這一前沿技術應用到他們選擇的問題上。醫學診斷、異常檢測、圖像識別的工業應用，等等。是的，你仍然需要一些數據，你也需要對監督學習是什么以及它的工作原理有一些高層次的理解。但所需要的也就這么些。

小結

結果令人吃驚。我沒有應用數據增強（data augmentation），也不需要調整學習率，也不用擔心正則化。我甚至沒有測試不同的架構——這就是我嘗試的第一個架構。

是的，有人可能會說，從照片中將貓和狗辨別出來并非什么艱深的科學。但我得提醒你，人類在40年前就已登上月球，但40年后的今天我們仍然無法告訴計算機如何執行這個看似簡單的任務，將準確率提高到85%以上。是的，我選擇拿來微調的這個模型本是訓練來執行視覺識別任務的，并且表現出色。

但是請稍等一下，請再閱讀一下這篇文章的前兩段。我打破了4年前這個任務上較先進的結果，并且毫不費力。我在云上運行一臺超級計算機，費用為每小時約0.2美元（這是我付給Amazon租虛擬機的費用）。這是非常意義重大的。

這表明，今天的深度學習應用的局限不再是由技術驅動的——我們已經擁有所需的硬件和軟件。是的，對于某些任務，我們需要更快的處理器，或者更多數據，或者更好的算法。但是，今天深度學習存在非常大的尚待被發現的應用范圍，而限制因素是該項技術相關知識傳播的速度。

以上來自一個在大學主修一年半社會學后輟學，自學編程但絕不是一個編程大師的人，只花了一個下午的時間的工作突破了4年前的較先進的結果，并且使用的數據只有它的2166分之一。那么我提出的問題是：你將應用這項技術來做什么讓世界變得更好的工作？

PS. Phillipe Golle 的 Machine Learning Attacks Against the Asirra CAPTCHA 這篇論文是2013年的state-of-the-art的解決方案，論文：http://xenon.stanford.edu/~pgolle/papers/dogcat.pdf

PS. 2 Kaggle貓狗識別競賽的優勝者準確率達到98.914%，在用25000張圖像仔細訓練一個機器學習系統后取得。

原文：https://medium.com/@radekosmulski/can-we-beat-the-state-of-the-art-from-2013-with-only-0-046-of-training-examples-yes-we-can-18be24b8615f

GPU云服務器云服務器張其中第一張圖片兩張表格數據匹配 html 一張圖片

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/4622.html

上一篇：全球最大的3D數據集公開了！標記好的10800張全景圖

下一篇：40張圖看懂撲克AI對抗人類30年歷史，解密冷撲大師前世今生

相關文章

一個時代的終結：ImageNet 競賽 2017 是最后一屆

摘要：年月日，將標志著一個時代的終結。數據集最初由斯坦福大學李飛飛等人在的一篇論文中推出，并被用于替代數據集后者在數據規模和多樣性上都不如和數據集在標準化上不如。從年一個專注于圖像分類的數據集，也是李飛飛開創的。 2017 年 7 月 26 日，將標志著一個時代的終結。那一天，與計算機視覺頂會 CVPR 2017 同期舉行的 Workshop——超越 ILSVRC（Beyond ImageNet ...

OnlyMyRailgun 2019-04-25 18:15 評論0 收藏0

我是如何在1天內構建一個深度學習模型并進擊Kaggle比賽的

摘要：是為結果導向型人群開設的深度學習在線課程。但是最關鍵的是，我想通過構建簡單的深度學習解決方案來實現理論和實踐的相結合。我的目標是在一天結束前進入排名的前。我的時間都用于學習庫組織數據和評估結果都是一些與深度學習無關的簡單流程。 Fast.ai是Jeremy Howard為結果導向型人群開設的深度學習在線課程。我讀過很多關于機器學習的書，也參加過不少這方面的課程，但我認為Fast.ai是迄今為...

shinezejian 2019-04-25 18:14 評論0 收藏0

發表評論

登陸后可評論

0條評論

RdouTyping

男|高級講師

我要關注我要私信

TA的文章
閱讀更多

tensorflow離線安裝

閱讀 3273·2023-04-25 18:03

資深程序員：Python中你不知道的那些小工具

閱讀 1143·2021-11-15 11:38

優啟通EasyU - 免費制作U盤PE啟動盤可安裝Win11系統

閱讀 5521·2021-10-25 09:45

程序員的算法趣題Q37: 翻轉7段碼(1)

閱讀 839·2021-09-24 09:48

域名如何解析到主機上-買了一臺服務器，如何將域名解析到主機上？

閱讀 2271·2021-09-22 15:34

論一個前端工程師如何快速學習，成長。準備自己的35歲【-原創精讀】

閱讀 1733·2019-08-30 15:44

完整的網站開發技術學習建議

閱讀 2674·2019-08-30 13:12

關于瀏覽器兼容

閱讀 603·2019-08-29 16:05

最新活動

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！

6張圖像vs13000張圖像，超越2013 Kaggle貓狗識別競賽領先水平

相關文章

一個時代的終結：ImageNet 競賽 2017 是最后一屆

**我是如何在1天內構建一個深度學習模型并進擊Kaggle比賽的**

發表評論

0條評論

RdouTyping

男|高級講師

TA的文章

tensorflow離線安裝

資深程序員：Python中你不知道的那些小工具

優啟通EasyU - 免費制作U盤PE啟動盤可安裝Win11系統

程序員的算法趣題Q37: 翻轉7段碼(1)

域名如何解析到主機上-買了一臺服務器，如何將域名解析到主機上？

論一個前端工程師如何快速學習，成長。準備自己的35歲【-原創精讀】

完整的網站開發技術學習建議

關于瀏覽器兼容

最新活動