国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

我是如何在1天內構建一個深度學習模型并進擊Kaggle比賽的

shinezejian / 1549人閱讀

摘要:是為結果導向型人群開設的深度學習在線課程。但是最關鍵的是,我想通過構建簡單的深度學習解決方案來實現理論和實踐的相結合。我的目標是在一天結束前進入排名的前。我的時間都用于學習庫組織數據和評估結果都是一些與深度學習無關的簡單流程。

Fast.ai是Jeremy Howard為結果導向型人群開設的深度學習在線課程。

我讀過很多關于機器學習的書,也參加過不少這方面的課程,但我認為Fast.ai是迄今為止實用的深度學習入門課程。在本文中,我將與大家分享我在學完前兩課后的一些經驗。

從數學開始學習人工智能是個錯誤的選擇

22年前,我在斯坦福大學學習Bernie Widrow的神經網絡課程,這位數字濾波器之父諄諄善誘,向我們講解隨機梯度下降的原理。

學了一半的理論課程,我還是不能完成神經網絡的實現,只學會了如何用MatLab構建神經網絡。后來,當我需要編寫代碼來訓練我的網絡權重時,我才終于理解了什么是隨機梯度下降。

不過,這種窘境到現在也并未發生多大變化。大多數機器學習實戰工程師都有著學術背景;當專業程序員問他們 “我該如何開始學習人工智能?”,多數工程師會向他們推薦一些偏重數學的學習資料,比如《深度學習》這本書(這種情況時有發生)。

對研究人員而言,Ian Goodfellow的這本書是一本很好的參考書,但對我們中的大多數人而言它并不是一本好的入門書籍。這本書關于梯度下降的章節使我回想起讀研究生時遇到的窘境:

上圖為Goodfellow等人所著的《深度學習》中關于梯度下降的一頁。這本書有很好的研究參考價值,但是對專業程序員而言,并不是一本實用的入門書。我在圣誕節期間讀完了本書三分之二的內容,但我還是不會構建神經網絡。

對于研究人員或者人工智能前沿的推進而言,理解理論是至關重要的一步。但是,對于大多數人工智能商業應用而言,數學是個很大的干擾。

為什么?因為企業面臨著一些更為嚴峻的挑戰,例如選擇正確的問題,組織數據,部署解決方案等。面對市場風險和執行風險,專業程序員不得不使用成熟的技術來開發應用——因此,懂得如何實現某一解決方案要比理解該方案的工作原理更為重要。

光讀不練假把式,必須實踐。

學習新技能的方法就是:使用該技能練習構建。深度學習也一樣, JeremyHoward的Fast.ai課程注重實踐,是學習人工智能最快的方法。

Fast.ai讓你通過實踐學習深度學習

課程的聯合創始人Jeremy Howard和Rachel Thomas實現了他們的承諾——“讓所有人都能運用機器學習的力量”。本文不對課程進行描述,我會推薦你閱讀學習者對該課程的評論并分享我早期的經驗。

我為什么決定參加這個課程

在參加該課程之前,我已具備良好的深度學習理論基礎,并掌握了該技術各種應用的實踐知識。我參加這個課程是為了獲得更多實踐經驗。

構建簡單的解決方案能幫我更加有效地籌劃項目、雇用項目人員和進行工程學權衡——這是任何領導者都須具備的技能。

但是最關鍵的是,我想通過構建簡單的深度學習解決方案來實現理論和實踐的相結合。

如何建立一個算法來檢測入侵物種

在一天內能達到什么樣的水平?

學完前兩課后,我決定參加Kaggle比賽。

我的目標是:

在一天結束前進入排名的前50%。

自己動手編寫每行代碼,不用剪切和粘貼。

了解所有引用的庫和API。

我選擇了“入侵物種監測”競賽(Invasive Species Monitoring playground competition)。 這是一個比較簡單的分類問題,對初學者而言算是一個很好的起點。

還有,它聽起來就很有趣。

上圖為 “入侵物種監測Kaggle競賽”中入侵性繡球花(繡球花:一種植物的分類)。

比賽的內容是開發出識別森林和葉子圖像中是否包含入侵性性繡球花的算法。

早上七點,我沏了一壺咖啡后開始工作,在亞馬遜AWS上對GPU進行了加速。晚上9點,我的眼睛開始酸痛,我的大腦跟炸了一樣。

我決定將我的結果提交給Kaggle……

我的代碼

這是我在github上的完整筆記,里面記錄了我工作計劃的7個步驟

不用對我的代碼感到驚訝——我使用的方法與課堂上學習的方法類似。任何一個具有1年工作經驗(或以上)的程序員應該都能寫出這樣的代碼。

我90%的時間都用于學習庫、組織數據和評估結果——都是一些與深度學習無關的簡單流程。

驗證結果

我使用90%的圖像訓練我的算法,并用剩余的10%來驗證結果。

預測精度

我的預測精度達到了91%。這是混淆矩陣:

混淆矩陣顯示了我的算法檢測驗證集的有效性。 最需要改進的的地方是漏報問題——在12個實例中算法錯誤地將入侵物種識別為非入侵物種。 您可以在下方查看該結果。

91%是什么概念? 就在3年前,較先進的計算機視覺識別技術也只能達到80%!我在第一次嘗試中就超越了它。

包含花的圖像被正確識別

我檢查了被算法正確識別的圖像。大藍色繡球花似乎是關鍵特征。

某些被錯誤識別的圖像存在明顯問題

這個算法錯誤地識別了18個圖像。 這是算法需要改進的地方。

漏報的圖像似乎是未被正確識別的小花。 我認為通過裁剪照片生成更多標記樣本,可以改善算法的結果。

勝利! 我進入了前50%!

在我的第一次嘗試中,我在52位參賽者中排名第21,進入前50%。

目標達成!

我在一天內進入了排名的前50%。

沒有較好只有更好。

Fast.ai是否適合你?

如果你的目標是加入Open.ai團隊或贏得ImageNet競賽,那么Fast.ai課程并不十分適合你,因為你需要學習偏導函數。

但對于其他人,比如想要獲得實用的基礎知識介紹的團隊領導,希望學習深度學習工程師入門知識的專業程序員,想知道如何開發AI spec的產品經理,或者任何想對一噸樂高進行分類的人員來說,Fast.ai是個很好的開始。

相關鏈接

GitHub地址

https://github.com/kevindewalt/ai-notebooks/blob/master/invasive_species.ipynb

Fast.ai深度學習課程地址(英文)

http://course.fast.ai/

Invasive Species Monitoring

https://www.kaggle.com/c/invasive-species-monitoring

原文地址

https://medium.com/the-business-of-ai/fast-ai-how-i-built-a-deep-learning-application-to-detect-invasive-species-in-just-1-day-and-for-38e0ced809e9

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識

QQ群:81035754

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4555.html

相關文章

  • Kaggle冠軍經驗分享丨如何15個月沖到排行榜首位

    摘要:你是如何開始參加比賽的正如之前所說的,我一直在閱讀大量機器學習和深度學習方面的書籍和論文,但發現很難將我學到的算法應用于小型數據集。機器學習中,你對哪個子領域最感興趣我對深度學習的各種進步都很感興趣。 showImg(https://segmentfault.com/img/bVboxKz?w=800&h=600); 作者 Kaggle Team中文翻譯 MikaCDA 數據分析師...

    AnthonyHan 評論0 收藏0
  • 如何為你深度學習任務挑選最合適 GPU?

    摘要:年月日,機器之心曾經推出文章為你的深度學習任務挑選最合適從性能到價格的全方位指南。如果你想要學習深度學習,這也具有心理上的重要性。如果你想快速學習深度學習,多個廉價的也很好。目前還沒有適合顯卡的深度學習庫所以,只能選擇英偉達了。 文章作者 Tim Dettmers 系瑞士盧加諾大學信息學碩士,熱衷于開發自己的 GPU 集群和算法來加速深度學習。這篇博文最早版本發布于 2014 年 8 月,之...

    taohonghui 評論0 收藏0
  • 我是如何入門機器學習

    摘要:在這里我分享下我個人入門機器學習的經歷,希望能對大家能有所幫助。相關學習鏈接,,入門后的體驗在入門了機器學習之后,在實際工作中,絕大多數的情況下你并不需要去創造一個新的算法。 機器學習在很多眼里就是香餑餑,因為機器學習相關的崗位在當前市場待遇不錯,但同時機器學習在很多人面前又是一座大山,因為發現它太難學了。在這里我分享下我個人入門機器學習的經歷,希望能對大家能有所幫助。 PS:這篇文章...

    ShowerSun 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<