国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

機器學習,了解一下?

jsbintask / 2554人閱讀

摘要:歡迎常來為什么要學老師上課時候就說過傳統(tǒng)算法解決確定性問題,而機器學習解決非確定性問題。機器學習算法機器學習算法和普通算法還是有很大區(qū)別的。而自動駕駛等前言機器人,都使用了增強學習。學習資料在線課程入門機器學習經(jīng)典算法與應用書籍機器學習實戰(zhàn)

文章圖片來源于 GitHub,網(wǎng)速不佳的朋友請點我看原文。

順便軟廣一下個人技術(shù)小站:godbmw.com。歡迎常來?(^?^*)

1. 為什么要學?
老師上課時候就說過:傳統(tǒng)算法解決確定性問題,而機器學習解決非確定性問題。

好吧,確實激起了我的興趣,所以系統(tǒng)學習一下吧。

2. 機器學習算法

機器學習算法和普通算法還是有很大區(qū)別的。它不要求百分之百準確,并且對數(shù)學要求較高。

我認為重點有幾下 4 點:

理解算法原理

應用實際場景

進行對比試驗

不同算法對比

同一算法不同參數(shù)對比

難點有幾下幾點:

如何評價算法好壞

解決擬合和過擬合

如何正確調(diào)參

如何驗證算法正確性

3. 可以解決什么問題?
有些算法既可以處理分類、也可以處理回歸任務,而在一些情況下,回歸任務可以簡化為分類任務,以方便問題解決。
3.1 分類任務

常見的有分類任務有 2 分類和多分類任務,并且兩者之間可以轉(zhuǎn)化。

比如 AlphaGo 下圍棋,可以理解成一個多分類任務:因為是在選擇棋盤上的落子點。除此之外,推箱子游戲:可能有 2-4 個方向提供選擇,也可以理解成分類任務。

3.2 多標簽分類

而在 ML 前沿領(lǐng)域,實現(xiàn)了多標簽分類:不再單純的是一個分類,而是擁有多個標簽。

例如下面這張含有多個標簽的圖片,多標簽會讓機器對它的定位更準確:

3.3 回歸任務

機器獲得結(jié)果是一個連續(xù)的數(shù)字的值,而不是一個類別。連續(xù)的值可以劃分為無限多個小的點(可以理解成無限多個類別),又怎么能處理成類別呢。

4. 算法分類 4.1 監(jiān)督學習
交給算法的訓練數(shù)據(jù)已經(jīng)被打了“標簽”,或者已經(jīng)給出了分類。訓練后的算法可以給新的數(shù)據(jù)打標簽或者分類。

因此,監(jiān)督學習的訓練數(shù)據(jù)需要大量的人力來進行標記。

當然,在一些領(lǐng)域已經(jīng)積累了一些被標記的數(shù)據(jù)信息,例如大型博客平臺,對每篇博客都有分類和標簽。這種時候,監(jiān)督學習的人力成本基本就是 0 了。

4.2 非監(jiān)督學習
給機器的訓練數(shù)據(jù)沒有任何“標簽”,或者分類。訓練后的算法仍然可以給新的數(shù)據(jù)打標簽或者分類。

經(jīng)常聽到的算法,就有聚類分析,比如每個用戶都被電商平臺劃分到某一用戶群體。

另一個非常重要的用途,是對數(shù)據(jù)進行降維處理:

特征提取:提取重要的特征,去除不重要的特征。防止噪聲影響特征提取

特征壓縮:在保證數(shù)據(jù)信息不被過多損害的情況下,將高維向量壓縮成低維向量,例如 PCA 算法。在保證穩(wěn)定性的情況下,提高處理速度。

另一個非常重要的用途:異常檢測。如下圖所示。以方便算法發(fā)現(xiàn)一般性特征和規(guī)律

4.3 半監(jiān)督學習
一部分數(shù)據(jù)有“標簽”或分類,另一部分并沒有。

此時,一般通過無監(jiān)督學習手段對數(shù)據(jù)進行處理,之后使用監(jiān)督學習做模型的訓練和預測。

4.4 增強學習
根據(jù)周圍環(huán)境,采取行動,再根據(jù)行動結(jié)果,改善學習行動方式。

如下圖所示,agent 使我們的算法,當他執(zhí)行后,會根據(jù)環(huán)境反饋來執(zhí)行獎賞或者懲罰,再改進行為模式。循環(huán)往復。

而 AlphaGo、自動駕駛等前言機器人,都使用了增強學習。

5. 更多算法分類 5.1 批量學習和在線學習
批量學習是指:算法一旦根據(jù)數(shù)據(jù)訓練出模型后,不會接受新的數(shù)據(jù)來優(yōu)化模型。在線學習是指:算法運行的過程中,也會把吸收新數(shù)據(jù)進行模型訓練。

優(yōu)缺點顯而易見,前者更省心,但是無法適應數(shù)據(jù)快速變化的場景;后者可以及時針對不同的數(shù)據(jù)來優(yōu)化模型,但是容易受到新數(shù)據(jù)中垃圾數(shù)據(jù)影響。

5.2 非參數(shù)學習和參數(shù)學習

參數(shù)學習是給出數(shù)據(jù)模型,剩下的工作就是利用算法找出最合適參數(shù)。比如假定數(shù)據(jù)點符合y = ax + b的模型,剩下工作就是用最小二乘法之類的算法找到(a,b)的最優(yōu)解。

非參數(shù)學習相反,不對模型進行過多假設,不將問題理解成學習一些參數(shù)。

5. 學習資料

在線課程:
Python3 入門機器學習 經(jīng)典算法與應用

書籍:《python 機器學習實戰(zhàn)》

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/19819.html

相關(guān)文章

  • 普通程序員,如何轉(zhuǎn)行人工智能?

    摘要:普通程序員,如何轉(zhuǎn)向人工智能方向,是知乎上的一個問題。領(lǐng)域簡介,也就是人工智能,并不僅僅包括機器學習。但是,人工智能并不等同于機器學習,這點在進入這個領(lǐng)域時一定要認識清楚。 人工智能已經(jīng)成為越來越火的一個方向。普通程序員,如何轉(zhuǎn)向人工智能方向,是知乎上的一個問題。本文是對此問題的一個回答的歸檔版。相比原回答有所內(nèi)容增加。 目的 本文的目的是給出一個簡單的,平滑的,易于實現(xiàn)的學習方法,幫...

    mingde 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<