摘要:機器學習就是用算法解析數據,不斷學習,對世界中發生的事做出判斷和預測的一項技術。顯然,深度學習是與機器學習中的神經網絡是強相關,神經網絡也是其主要的算法和手段或者我們可以將深度學習稱之為改良版的神經網絡算法。
什么是 AI、機器學習與深度學習?
大家好,我是楊鋒,作為一個大數據從業人員,相信大家整天都在被 AI、機器學習、深度學習等一些概念轟炸。有時候甚至有點誠惶誠恐,一方面作為一個“業內人士”而自豪,二方面覺得新概念一個接一個,自己不甚了解,有點恐懼。我一直相信一句臺詞——“喝了敵人的血,下次見面就不會再怕了”。學習知識亦然,很多時候,你覺得很高深,實際上是缺乏清晰的概念。當你真的把這些概念理清楚后,往往會恍然大悟,萬變不離其宗,原來不過如此。上網查了很多資料,很遺憾的是,99%的從業者語文都不怎么過關,連基本的定義都不會下。一個簡單的“限定詞+更大的集合”的定義模式都沒有掌握,深表遺憾。于是還是決定自己來梳理一下吧。有高人說過(花錢買的):你對一個領域的理解程度,完全取決于你的頭腦里有多少清晰的概念,以及能否把這些概念關聯起來。廢話少說,開始嘮吧。
人工智能( Artificial Intelligence)是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門技術科學。我們來分解一下這個概念。“人工智能”是“一門技術科學”,它研究與開發的對象是“理論、技術及應用系統”,研究的目的是為了“模擬、延伸和擴展人的智能”。既然如此,那么買菜用的“計算器”算是人工智能嗎?嚴格地說是算的,因為它至少做了“模擬”人在計算方面的智能,并擴展了這個能力(比人算得更快)。我們每天編碼驅動計算機去幫我們干活,這個算是人工智能嗎?也算的。所以,首先不用妄自菲薄,其實大家早已是“人工智能”的從業者了。我們現在看到的貌似很高端的技術,如圖像識別、NLP,其實依然沒有脫離這個范圍,說白了,就是“模擬人在看圖方面的智能”和“模擬人在聽話方面的智能”,本質上和“模擬人在計算方面的智能”沒啥兩樣,雖然難度有高低,但目的是一樣的——模擬、延伸和擴展人的智能。另外,人工智能也不是啥新概念,事實上這是50年代提出的東西了(比你們老多了),現在這么火熱,頂多只能算是“詐尸”,談不上“新生”。
隨著人對計算機科學的期望越來越高,要求它解決的問題越來越復雜,摧枯拉朽地打個小怪已經遠遠不能滿足人們的訴求了。1+1好算,1+2也不難,這些已經能解決的問題暫且按下不表。要解決的問題域越來越復雜,即使是同一個問題,其面對的場景也越來越多。咱總不能每新出來一種場景,就讓碼農去查找switch,然后在default前去再加一個case吧;世間的場景千千萬,那得多少個case啊,殺個碼農祭天也保不齊會出問題啊。那怎么辦呢?于是有人提出了一個新的思路——能否不為難碼農,讓機器自己去學習呢(提出這個概念的人一定做過碼農)?好吧,現在機器學習的定義就出來了。機器學習即不需要碼農添加case語句而讓機器自己學會執行任務的人工智能技術。好像不太正規啊,好吧,再定義一下。機器學習就是用算法解析數據,不斷學習,對世界中發生的事做出判斷和預測的一項技術。研究人員不會親手編寫軟件、確定特殊指令集、然后讓程序完成特殊任務;相反,研究人員會用大量數據和算法“訓練”機器,讓機器學會如何執行任務。這里有三個重要的信息:1、“機器學習”是“模擬、延伸和擴展人的智能”的一條路徑,所以是人工智能的一個子集;2、“機器學習”是要基于大量數據的,也就是說它的“智能”是用大量數據喂出來的,如果缺少海量數據,它也就啥也不是了;3、正是因為要處理海量數據,所以大數據技術尤為重要;“機器學習”只是大數據技術上的一個應用。常用的10大機器學習算法有:決策樹、隨機森林、邏輯回歸、SVM、樸素貝葉斯、K最近鄰算法、K均值算法、Adaboost算法、神經網絡、馬爾科夫。Apache有個開源項叫mahout,提供了這些經典算法的實現;但是后來spark出來了,由于在內存迭代計算方面的優勢,一下子搶過了這個風頭,目前spark自帶的MLlib被使用得更為廣泛。雖然mahout也在向spark轉,但是在技術的世界里就是這樣的,只有新人笑,哪聞舊人哭。
相較而言,深度學習是一個比較新的概念,算是00后吧,嚴格地說是2006年提出來的。老套路,也給它下一個定義。深度學習是用于建立、模擬人腦進行分析學習的神經網絡,并模仿人腦的機制來解釋數據的一種機器學習技術。它的基本特點,是試圖模仿大腦的神經元之間傳遞,處理信息的模式。最顯著的應用是計算機視覺和自然語言處理(NLP)領域。顯然,“深度學習”是與機器學習中的“神經網絡”是強相關,“神經網絡”也是其主要的算法和手段;或者我們可以將“深度學習”稱之為“改良版的神經網絡”算法。深度學習又分為卷積神經網絡(Convolutional neural networks,簡稱CNN)和深度置信網(Deep Belief Nets,簡稱DBN)。其主要的思想就是模擬人的神經元,每個神經元接受到信息,處理完后傳遞給與之相鄰的所有神經元即可。所以看起來的處理方式有點像下圖(想深入了解的同學可以自行google)。
神經網絡的計算量非常大,事實上在很長時間里由于基礎設施技術的限制進展并不大。而GPU的出現讓人看到了曙光,也造就了深度學習的蓬勃發展,“深度學習”才一下子火熱起來。擊敗李世石的Alpha go即是深度學習的一個很好的示例。Google的TensorFlow是開源深度學習系統一個比較好的實現,支持CNN、RNN和LSTM算法,是目前在圖像識別、自然語言處理方面最流行的深度神經網絡模型。事實上,提出“深度學習”概念的Hinton教授加入了google,而Alpha go也是google家的。在一個新興的行業,領軍人才是多么的重要啊!
總結:人工智能是一個很老的概念,機器學習是人工智能的一個子集,深度學習又是機器學習的一個子集。機器學習與深度學習都是需要大量數據來“喂”的,是大數據技術上的一個應用,同時深度學習還需要更高的運算能力支撐,如GPU。
想要更詳細的了解,請訪問華為云學院( edu.huaweicloud.com/courses/ ),課程獲取密碼,搜索:機器學習或者深度學習或者 AI ,一般人我不告訴他喔!
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19923.html
摘要:絕大多數人忽略了深度學習只占機器學習領域的,而機器學習又只占到了人工智能領域的。一個深度學習專家無法與人工智能專家劃上等號。但是,深度學習并不是人類可以創造的人工智能科技的終點。深度學習的公正性并非來自其自身,而是人類篩選和準備的數據。 人工智能的這一波熱潮毫無疑問是由深度學習引發的,自吳恩達等人 2011 年發表「識別貓」研究后,深度學習及其引發的技術已經在圖像識別、游戲等任務中超越人類,...
摘要:而這種舉一反三的能力在機器學習領域同樣適用,科學家將其稱之為遷移學習。與深度學習相比,我們技術較大優點是具有可證明的性能保證。近幾年的人工智能熱潮中,深度學習是最主流的技術,以及之后的成功,更是使其幾乎成為的代名詞。 如今,人類將自己的未來放到了技術手里,無論是讓人工智能更像人類思考的算法,還是讓機器人大腦運轉更快的芯片,都在向奇點靠近。谷歌工程總監、《奇點臨近》的作者庫茲韋爾認為,一旦智能...
摘要:問深度學習社區現在面臨的主要挑戰是什么答打擊炒作發展倫理意識獲得科學嚴謹性。深度學習簡直是科學的重災區。 Keras之父、谷歌大腦人工智能和深度學習研究員Fran?ois Chollet撰寫了一本深度學習Python教程實戰書籍《Python深度學習》,書中介紹了深度學習使用Python語言和強大Keras庫,詳實新穎。近日,Fran?ois Chollet接受了采訪,就深度學習到底是什么、...
摘要:是你學習從入門到專家必備的學習路線和優質學習資源。的數學基礎最主要是高等數學線性代數概率論與數理統計三門課程,這三門課程是本科必修的。其作為機器學習的入門和進階資料非常適合。書籍介紹深度學習通常又被稱為花書,深度學習領域最經典的暢銷書。 showImg(https://segmentfault.com/img/remote/1460000019011569); 【導讀】本文由知名開源平...
摘要:普通程序員,如何轉向人工智能方向,是知乎上的一個問題。領域簡介,也就是人工智能,并不僅僅包括機器學習。但是,人工智能并不等同于機器學習,這點在進入這個領域時一定要認識清楚。 人工智能已經成為越來越火的一個方向。普通程序員,如何轉向人工智能方向,是知乎上的一個問題。本文是對此問題的一個回答的歸檔版。相比原回答有所內容增加。 目的 本文的目的是給出一個簡單的,平滑的,易于實現的學習方法,幫...
閱讀 2129·2021-11-18 10:07
閱讀 3506·2021-09-04 16:48
閱讀 3214·2019-08-30 15:53
閱讀 1235·2019-08-30 12:55
閱讀 2453·2019-08-29 15:08
閱讀 3149·2019-08-29 15:04
閱讀 2878·2019-08-29 14:21
閱讀 2906·2019-08-29 11:21