摘要:深度學(xué)習(xí)自動(dòng)找到對(duì)分類重要的特征,而在機(jī)器學(xué)習(xí),我們必須手工地給出這些特征。數(shù)據(jù)依賴深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)最重要的區(qū)別在于數(shù)據(jù)量增長(zhǎng)下的表現(xiàn)差異。這是深度學(xué)習(xí)一個(gè)特別的部分,也是傳統(tǒng)機(jī)器學(xué)習(xí)主要的步驟。
前言機(jī)器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在很火!突然間每個(gè)人都在討論它們-不管大家明不明白它們的不同!
不管你是否積極緊貼數(shù)據(jù)分析,你都應(yīng)該聽說過它們。
正好展示給你要關(guān)注它們的點(diǎn),這里是它們關(guān)鍵詞的google指數(shù):
如果你一直想知道機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的不同,那么繼續(xù)讀下去,下文會(huì)告訴你一個(gè)關(guān)于兩者的通俗的詳細(xì)對(duì)比。
我會(huì)詳細(xì)介紹它們,然后會(huì)對(duì)它們進(jìn)行比較并解釋它們的用途。
1 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么?
1.1 什么是機(jī)器學(xué)習(xí)?
1.2 什么是深度學(xué)習(xí)?
2 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的比較
2.1 數(shù)據(jù)依賴
2.2 硬件依賴
2.3 問題解決辦法
2.4 特征工程
2.5 執(zhí)行時(shí)間
2.6 可解釋性
3 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)目前的應(yīng)用場(chǎng)景?
4 測(cè)試
5 未來發(fā)展趨勢(shì)
讓我們從基礎(chǔ)開始——什么是機(jī)器學(xué)習(xí),什么是深度學(xué)習(xí)。如果你已經(jīng)知道答案了,那么你可以直接跳到第二章。
“機(jī)器學(xué)習(xí)”更受廣泛引用的定義是來自于Tom Mitchell對(duì)它的解釋概括:
? ? “如果一個(gè)計(jì)算機(jī)程序在任務(wù)T中,利用評(píng)估方法P并通過相應(yīng)的經(jīng)驗(yàn)E而使性能得到提高,則說這個(gè)程序從經(jīng)驗(yàn)E中得到了學(xué)習(xí)”
這句話是不是聽起來特別難以理解?讓我們用一些簡(jiǎn)單的例子來說明它。
例子1-機(jī)器學(xué)習(xí)-基于身高預(yù)測(cè)體重
假如你現(xiàn)在需要?jiǎng)?chuàng)建一個(gè)系統(tǒng),它能夠基于身高來告訴人們預(yù)期的體重。有幾個(gè)原因可能可以解釋為什么這樣的事會(huì)引起人們興趣的原因。你可以使用這個(gè)系統(tǒng)來過濾任何可能的欺詐數(shù)據(jù)或捕獲誤差。而你需要做的第一件事情是收集數(shù)據(jù),假如你的數(shù)據(jù)像這個(gè)樣子:
圖中的每個(gè)點(diǎn)都代表一個(gè)數(shù)據(jù)點(diǎn)。首先,我們可以畫一條簡(jiǎn)單的直線來根據(jù)身高預(yù)測(cè)體重。例如是這么一條直線:
Weight (in kg) = Height (in cm) - 100
它可以幫助我們做出預(yù)測(cè)。如果這條直線看起來畫得不錯(cuò),我們就需要理解它的表現(xiàn)。在這個(gè)例子中,我們需要減少預(yù)測(cè)值與真實(shí)值之間的差距,這是我們?cè)u(píng)估性能的辦法。
進(jìn)一步說,如果我們收集到更多的數(shù)據(jù)(經(jīng)驗(yàn)上是這樣),我們的模型表現(xiàn)將會(huì)變得更好。我們也可以通過添加更多的變量來提高模型(例如`性別`),那樣也會(huì)有一條不一樣的預(yù)測(cè)線。
例子2-風(fēng)暴預(yù)測(cè)系統(tǒng)
讓我們舉個(gè)復(fù)雜一點(diǎn)點(diǎn)的例子。假設(shè)你在開發(fā)一個(gè)風(fēng)暴預(yù)測(cè)系統(tǒng),你手里有過往所有發(fā)生過的風(fēng)暴數(shù)據(jù),以及這些風(fēng)暴發(fā)生前三個(gè)月的天氣狀況數(shù)據(jù)。
想一下,如果我們要去做一個(gè)風(fēng)暴預(yù)測(cè)系統(tǒng),該怎么做呢?
首先,我們需要探索所有數(shù)據(jù)并找到數(shù)據(jù)的模式(規(guī)則)。我們的任務(wù)是尋找什么情況下會(huì)引起風(fēng)暴發(fā)生。
我們可以模擬一些條件,例如溫度大于40攝氏度,溫度介于80到100之間等等,然后把這些“特征”手動(dòng)輸入到我們的系統(tǒng)里。
或者,我們也可以讓系統(tǒng)從數(shù)據(jù)中理解這些特征的合適值。
現(xiàn)在,找到了這些值,你就可以從之前的所有數(shù)據(jù)中預(yù)測(cè)一個(gè)風(fēng)暴是否會(huì)生成。基于這些由我們的系統(tǒng)設(shè)定的特征值,我們可以評(píng)估一下系統(tǒng)的性能表現(xiàn),也就是系統(tǒng)預(yù)測(cè)風(fēng)暴發(fā)生的正確次數(shù)。我們可以迭代上面的步驟多次,給系統(tǒng)提供反饋信息。
讓我們用正式的語言來定義我們的風(fēng)暴系統(tǒng):我們的任務(wù)`T`是尋找什么樣的大氣條件會(huì)引起一個(gè)風(fēng)暴。性能`P`描述的是系統(tǒng)所提供的全部情況中,正確預(yù)測(cè)到風(fēng)暴發(fā)生的次數(shù)。而經(jīng)驗(yàn)`E`就是我們系統(tǒng)的不斷重復(fù)運(yùn)行所產(chǎn)生的。
1.2 什么是深度學(xué)習(xí)?深度學(xué)習(xí)并不是新的概念,它已經(jīng)出現(xiàn)好一些年了。但在今時(shí)今日的大肆宣傳下,深度學(xué)習(xí)變得越來越受關(guān)注。正如在機(jī)器學(xué)習(xí)所做的事情一樣,我們也將正式的定義“深度學(xué)習(xí)”并用簡(jiǎn)單的例子來說明它。
“深度學(xué)習(xí)是一種特別的機(jī)器學(xué)習(xí),它把世界當(dāng)做嵌套的層次概念來學(xué)習(xí)從而獲得強(qiáng)大的能力和靈活性,每一個(gè)概念都由相關(guān)更簡(jiǎn)單的概念來定義,而更抽象的表征則通過較形象的表征計(jì)算得到。”
現(xiàn)在-這看起來很令人困惑,讓我們用簡(jiǎn)單的例子來說明。
例子1-形狀檢測(cè)
讓我們從一個(gè)簡(jiǎn)單的例子開始,這個(gè)例子解釋了概念層次上發(fā)生了什么。我們來嘗試?yán)斫庠鯓訌钠渌螤钪凶R(shí)別出正方形。
我們的眼睛首先會(huì)做的是檢查這個(gè)圖形是否由4條邊組成(簡(jiǎn)單的概念)。如果我們找到4條邊,我們接著會(huì)檢查這4條邊是否相連、閉合、垂直并且它們是否等長(zhǎng)的(嵌套層次的概念)
如此,我們接受一個(gè)復(fù)雜的任務(wù)(識(shí)別一個(gè)正方形)并把它轉(zhuǎn)化為簡(jiǎn)單的較抽象任務(wù)。深度學(xué)習(xí)本質(zhì)上就是大規(guī)模的執(zhí)行這種任務(wù)。
例子2-貓狗大戰(zhàn)
讓我們舉一個(gè)動(dòng)物識(shí)別的例子,這個(gè)例子中我們的系統(tǒng)需要識(shí)別給定的圖片是一只貓還是一只狗。
如果我們把這個(gè)當(dāng)做典型的機(jī)器學(xué)習(xí)問題來解決,我們會(huì)定義一些特征,例如:這個(gè)動(dòng)物有沒有胡須,是否有耳朵,如果有,那是不是尖耳朵。簡(jiǎn)單來說,我們會(huì)定義面部特征并讓系統(tǒng)識(shí)別哪些特征對(duì)于識(shí)別一個(gè)具體的動(dòng)物來說是重要的。
深度學(xué)習(xí)走得更深一步。深度學(xué)習(xí)自動(dòng)找到對(duì)分類重要的特征,而在機(jī)器學(xué)習(xí),我們必須手工地給出這些特征。深度學(xué)習(xí)的工作模式:
首先識(shí)別一只貓或一只狗相應(yīng)的邊緣 然后在這個(gè)基礎(chǔ)上逐層構(gòu)建,找到邊緣和形狀的組合。例如是否有胡須,或者是否有耳朵等 在對(duì)復(fù)雜的概念持續(xù)層級(jí)地識(shí)別后,最終會(huì)決定哪些特征對(duì)找到答案是有用的 2.機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的比較現(xiàn)在你已經(jīng)了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的概念了,我們接著將會(huì)花點(diǎn)時(shí)間來比較這兩種技術(shù)。
2.1 數(shù)據(jù)依賴
深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)最重要的區(qū)別在于數(shù)據(jù)量增長(zhǎng)下的表現(xiàn)差異。當(dāng)數(shù)據(jù)量很少的時(shí)候,深度學(xué)習(xí)算法不會(huì)有好的表現(xiàn),這是因?yàn)樯疃葘W(xué)習(xí)算法需要大量數(shù)據(jù)來完美地實(shí)現(xiàn)。相反,傳統(tǒng)機(jī)器學(xué)習(xí)在這個(gè)情況下是占優(yōu)勢(shì)的。下圖概括了這個(gè)事實(shí)。
2.2 硬件依賴
深度學(xué)習(xí)算法高度依賴高端機(jī)器,相較之下傳統(tǒng)的機(jī)器學(xué)習(xí)算法可以在低端機(jī)器中運(yùn)行。這是因?yàn)樯疃葘W(xué)習(xí)算法對(duì)GPU的依賴是它在工作中的重要部分。深度學(xué)習(xí)算法內(nèi)在需要做大量的矩陣乘法運(yùn)算,這些運(yùn)算可以通過GPU實(shí)現(xiàn)高效優(yōu)化,因?yàn)镚PU就是因此而生的。
2.3 特征工程特征工程是將領(lǐng)域知識(shí)引入到創(chuàng)建特征提取器的過程,這樣做的目的在于減少數(shù)據(jù)的復(fù)雜性并且使模式更清晰,更容易被學(xué)習(xí)算法所使用。無論從對(duì)時(shí)間還是對(duì)專業(yè)知識(shí)的要求,這個(gè)過程都是艱難的而且是高成本的。
在機(jī)器學(xué)習(xí)中,絕大多數(shù)應(yīng)用特征需要專業(yè)知識(shí)來處理,然后根據(jù)領(lǐng)域和數(shù)據(jù)類型進(jìn)行硬編碼。
舉個(gè)例子,特征數(shù)據(jù)可以是像素值、文本數(shù)據(jù)、位置數(shù)據(jù)、方位數(shù)據(jù)。絕大多數(shù)的機(jī)器學(xué)習(xí)算法的性能表現(xiàn)依賴于特征識(shí)別和抽取的準(zhǔn)確度。
深度學(xué)習(xí)算法嘗試從數(shù)據(jù)中學(xué)習(xí)高級(jí)特征。這是深度學(xué)習(xí)一個(gè)特別的部分,也是傳統(tǒng)機(jī)器學(xué)習(xí)主要的步驟。因此,深度學(xué)習(xí)在所有問題上都免除了特征提取器的開發(fā)步驟。就像卷積神經(jīng)網(wǎng)絡(luò)會(huì)嘗試學(xué)習(xí)低級(jí)特征,例如在低層中學(xué)習(xí)邊緣和線條,然后是部分的人臉,再接著是人臉的高層表征。
2.4 問題解決辦法
當(dāng)使用傳統(tǒng)機(jī)器學(xué)習(xí)算法求解一個(gè)問題時(shí),它通常會(huì)建議把問題細(xì)分成不同的部分,然后獨(dú)立地解決他們?nèi)缓蠛喜⒌揭黄饛亩@得最終結(jié)果。然而深度學(xué)習(xí)卻主張端對(duì)端地解決問題。
讓我們用一個(gè)例子來理解。
假設(shè)你現(xiàn)在有一個(gè)多目標(biāo)檢測(cè)任務(wù)。這個(gè)任務(wù)要求識(shí)別目標(biāo)是什么和它出現(xiàn)在圖像中的位置。
在一個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)方法中,你會(huì)把問題分成兩個(gè)步驟:目標(biāo)檢測(cè)和目標(biāo)識(shí)別。首先你會(huì)用一個(gè)像grabcut一樣的邊框檢測(cè)算法來掃描圖像并找到所有可能的目標(biāo)。然后,對(duì)所有被識(shí)別的對(duì)象,你會(huì)使用對(duì)象識(shí)別算法,如帶HOG特征的SVM,來識(shí)別相關(guān)對(duì)象。
相反地,在深度學(xué)習(xí)方法中,你會(huì)端對(duì)端地執(zhí)行這個(gè)過程。例如,在一個(gè)YOLO網(wǎng)絡(luò)中(一款深度學(xué)習(xí)算法),你傳入一個(gè)圖像,接著它會(huì)給出對(duì)象的位置和名稱。
2.5 執(zhí)行時(shí)間通常神經(jīng)網(wǎng)絡(luò)算法都會(huì)訓(xùn)練很久,因?yàn)樯窠?jīng)網(wǎng)絡(luò)算法中有很多參數(shù),所以訓(xùn)練它們通常比其他算法要耗時(shí)。目前較好的深度學(xué)習(xí)算法ResNet需要兩周時(shí)間才能完成從隨機(jī)參數(shù)開始的訓(xùn)練。而機(jī)器學(xué)習(xí)相對(duì)而言則只需要很短的時(shí)間來訓(xùn)練,大概在幾秒到幾小時(shí)不等。
但在測(cè)試的時(shí)候就完全相反了。在測(cè)試的時(shí)候,深度學(xué)習(xí)算法只需要運(yùn)行很短的時(shí)間。然而,如果你把它拿來與K-近鄰(一種機(jī)器學(xué)習(xí)算法)來比較,測(cè)試時(shí)間會(huì)隨著數(shù)據(jù)量的增長(zhǎng)而增加。但是這也不意味著所有機(jī)器學(xué)習(xí)算法都如此,其中有一些算法測(cè)試時(shí)間也是很短的。
2.6 可解釋性最后,我們也把可解釋性作為一個(gè)因素來對(duì)比一下機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。這也是深度學(xué)習(xí)在它被應(yīng)用于工業(yè)之前被研究了很久的主要因素。
舉個(gè)例子,假設(shè)我們使用深度學(xué)習(xí)來給文章自動(dòng)打分。它打分的表現(xiàn)十分的好并且非常接近人類水平,但是有個(gè)問題,它不能告訴我們?yōu)槭裁此o出這樣的分?jǐn)?shù)。實(shí)際在數(shù)學(xué)上,你可以找到一個(gè)深度神經(jīng)網(wǎng)絡(luò)哪些結(jié)點(diǎn)被激活了,但我們不知道這些神經(jīng)元被模型怎么利用,而且也不知道這些層在一起做了點(diǎn)什么事情。所以我們不能結(jié)果進(jìn)行合理的解釋。
在另一方面,機(jī)器學(xué)習(xí)算法例如決策樹,通過清晰的規(guī)則告訴我們?yōu)槭裁此x擇了什么,所以它是特別容易解釋結(jié)果背后的原因。因此,像決策樹和線性/邏輯回歸一樣的算法由于可解釋性而廣泛應(yīng)用于工業(yè)界。
3.機(jī)器學(xué)習(xí)和深度學(xué)習(xí)目前的應(yīng)用場(chǎng)景?維基百科文章給出了機(jī)器學(xué)習(xí)所有應(yīng)用場(chǎng)景的概述,它們包括:
上圖簡(jiǎn)要總結(jié)了機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域,盡管它描述的還包括了整個(gè)機(jī)器智能領(lǐng)域。
一個(gè)應(yīng)用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)較好的例子就是谷歌了。
上圖中,你可以看到谷歌把機(jī)器學(xué)習(xí)應(yīng)用在它各種各樣的產(chǎn)品中。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的應(yīng)用是沒有邊際的,你需要的是尋找對(duì)的時(shí)機(jī)!
4.測(cè)試為了評(píng)估你是否真正了解這些差異,我們接著會(huì)來做一個(gè)測(cè)試。你可以在這兒發(fā)布你的答案。
請(qǐng)注意回答問題的步驟。
你會(huì)怎樣用機(jī)器學(xué)習(xí)解決下面的問題? 你會(huì)怎樣用深度學(xué)習(xí)解決下面的問題? 結(jié)論:哪個(gè)是更好的方法?
情節(jié)1:
你要開發(fā)一個(gè)汽車自動(dòng)駕駛的軟件系統(tǒng),這個(gè)系統(tǒng)會(huì)從攝像機(jī)獲取原始像素?cái)?shù)據(jù)并預(yù)測(cè)車輪需要調(diào)整的角度。
情節(jié)2:
給定一個(gè)人的認(rèn)證信息和背景信息,你的系統(tǒng)需要評(píng)估這個(gè)人是否能夠通過一筆貸款申請(qǐng)。
情節(jié)3:
為了一個(gè)俄羅斯代表能解決當(dāng)?shù)厝罕姷膯栴},你需要建立一個(gè)能把俄文翻譯成印地語的系統(tǒng)。
5.未來發(fā)展趨勢(shì)上述文章可以給了你關(guān)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)以及它們之間差異的概述。本章中,我想要分享一下我對(duì)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)未來發(fā)展趨勢(shì)的看法。
首先,由于工業(yè)界對(duì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)使用需求量的增長(zhǎng),在業(yè)務(wù)上應(yīng)用機(jī)器學(xué)習(xí)對(duì)公司運(yùn)營(yíng)會(huì)變得更加重要。而且,每個(gè)人都會(huì)想要知道基礎(chǔ)術(shù)語。 深度學(xué)習(xí)每天都給我們每個(gè)人制造驚喜,并且在不久的將來也會(huì)持續(xù)著這個(gè)趨勢(shì)。這是因?yàn)樯疃葘W(xué)習(xí)已經(jīng)被證明是能實(shí)現(xiàn)較先進(jìn)表現(xiàn)的較佳技術(shù)之一。 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的研究會(huì)持續(xù)進(jìn)行。但與前些年局限于學(xué)術(shù)上的研究有所區(qū)別,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域上的研究會(huì)在工業(yè)界和學(xué)術(shù)界同時(shí)爆發(fā)。而且隨著可用資金的增加,它會(huì)更可能成為整個(gè)人類發(fā)展的主題。我個(gè)人緊隨著這些趨勢(shì)。我通常在關(guān)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的新聞中獲得重要信息,那些信息會(huì)使我在最近發(fā)生事情中不斷進(jìn)步。而且,我也一直關(guān)注著arxiv上每天更新的論文以及相應(yīng)的代碼。
在這篇文章中,我們從一個(gè)相對(duì)高的角度進(jìn)行了總結(jié),并且比較了深度學(xué)習(xí)跟機(jī)器學(xué)習(xí)的算法之間的異同點(diǎn)。我希望這能讓您未來在這兩個(gè)領(lǐng)域中的學(xué)習(xí)中變得更有自信。這是關(guān)于機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)的一個(gè)學(xué)習(xí)路線。
如果您有任何的疑問,完全可以放心大膽地在評(píng)論區(qū)提問。
英文原文鏈接:https://www.analyticsvidhya.com/blog/2017/04/comparison-between-deep-learning-machine-learning/
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/4588.html
摘要:這是機(jī)器學(xué)習(xí)課程中的一個(gè)典型例子,他把演講者的聲音和背景音樂分開。雖然用于啟動(dòng)檢測(cè)的技術(shù)主要依賴于音頻特征工程和機(jī)器學(xué)習(xí),但在這里可以很容易地使用深度學(xué)習(xí)來優(yōu)化結(jié)果。 介紹 想象一個(gè)能理解你想要什么,且當(dāng)你打電話給客戶服務(wù)中心時(shí)能理解你的感受的機(jī)器--如果你對(duì)某件事感到不高興,你可以很快地和一個(gè)人交談。如果您正在尋找特定的信息,您可能不需要與某人交談(除非您愿意!)。 ...
摘要:如今在機(jī)器學(xué)習(xí)中突出的人工神經(jīng)網(wǎng)絡(luò)最初是受神經(jīng)科學(xué)的啟發(fā)。雖然此后神經(jīng)科學(xué)在機(jī)器學(xué)習(xí)繼續(xù)發(fā)揮作用,但許多主要的發(fā)展都是以有效優(yōu)化的數(shù)學(xué)為基礎(chǔ),而不是神經(jīng)科學(xué)的發(fā)現(xiàn)。 開始之前看一張有趣的圖 - 大腦遺傳地圖:Figure 0. The Genetic Geography of the Brain - Allen Brain Atlas成年人大腦結(jié)構(gòu)上的基因使用模式是高度定型和可再現(xiàn)的。 Fi...
閱讀 2596·2021-10-14 09:43
閱讀 3558·2021-10-13 09:39
閱讀 3288·2019-08-30 15:44
閱讀 3136·2019-08-29 16:37
閱讀 3700·2019-08-29 13:17
閱讀 2730·2019-08-26 13:57
閱讀 1824·2019-08-26 11:59
閱讀 1237·2019-08-26 11:46