【機(jī)器學(xué)習(xí)】回歸算法-精講

mtunique 發(fā)布于2021-11-15 11:39 / 1313人閱讀

摘要：回歸分析中，只包括一個自變量和一個因變量，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。

回歸算法

數(shù)據(jù)類型分為連續(xù)型和離散型。離散型的數(shù)據(jù)經(jīng)常用來表示分類，連續(xù)型的數(shù)據(jù)經(jīng)常用來表示不確定的值。比如一個產(chǎn)品質(zhì)量分為1類，2類，這是離散型。房價(jià)1.4萬/平，3.4萬/平，這是連續(xù)型。之前我們學(xué)的都是分類，那么對于一些連續(xù)型的數(shù)據(jù)，我們就可以通過回歸算法來進(jìn)行預(yù)測了。

回歸分析中，只包括一個自變量和一個因變量，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量，且因變量和自變量之間是線性關(guān)系，則稱為多元線性回歸分析。那么什么是線性關(guān)系和非線性關(guān)系？

線性回歸和非線性回歸：

比如說在房價(jià)上，房子的面積和房子的價(jià)格有著明顯的關(guān)系。那么X=房間大小，Y=房價(jià)，那么在坐標(biāo)系中可以看到這些點(diǎn)：

如果房間面積大小和房價(jià)的關(guān)系可以用一根直線表示，那么這就是線性關(guān)系：

而如果不是一根直線，那么就是非線性關(guān)系：

線性回歸

線性回歸通過一個或者多個自變量與因變量之間進(jìn)行建模的回歸分析。其中特點(diǎn)為一個或多個稱為回歸系數(shù)的模型參數(shù)的線性組合。

線性回歸方程：

線性回歸方程，就是有k個特征，然后每個特征都有相應(yīng)的系數(shù)，并且在所有特征值為0的情況下，目標(biāo)值有一個默認(rèn)值。因此線性回歸方程如下：
$h (w) = w ? + w ? ? x ? + w ? ? x ? + \dots$
整合后的公式為：
$h(w)=∑_i^nw_ixi=θ^Tx$

損失函數(shù)：

損失函數(shù)是一個貫穿整個機(jī)器學(xué)習(xí)重要的一個概念，大部分機(jī)器學(xué)習(xí)算法都會有誤差，我們得通過顯性的公式來描述這個誤差，并且將這個誤差優(yōu)化到最小值。

假設(shè)現(xiàn)在真實(shí)的值為y，預(yù)測的值為h，那么損失函數(shù)的公式如下：
$J(θ)=/frac{1}{2}∑_i^m(y^{(i)}-θ^Tx^{(i)})^2$

也就是所有誤差和的平方。損失函數(shù)值越小，說明誤差越小.這個損失函數(shù)也有一個專門的叫法，叫做最小二乘法。

損失函數(shù)推理過程：

公式轉(zhuǎn)換：

首先，我們是想要獲取到這樣一個公式：
$θ_0 + θ_1*x_1 + θ_2*x_2+…$
那么為了更好的計(jì)算，我們將這個公式進(jìn)行一些變形，將 $w_0$ 后面加個 $x_0$ ，只不過這個 $x_0$ 是為1。所以可以變化成以下：
$∑_i^nθ_ix_i$
而 $θ_i$ 和 $x_i$ 可以寫成一個矩陣：
$θ_0 θ_1 θ_3 ... /end{matrix} /right]$ x $x_1 // x_3 // ... /end{matrix} /right]$ = $_i^nθ_ix_i$ = $θ^Tx$

用矩陣主要是方便計(jì)算。

誤差公式：

其次，以上求得的，只是一個預(yù)測的值，而不是真實(shí)的值，他們中間肯定會存在誤差，因此會有以下公式：
$y_i=θ_ix_i + ?_i$
我們要做的，就是找出最小的 $_i$ ，使得預(yù)測值和真實(shí)值的差距最小。

轉(zhuǎn)化為`θ`求解：

然后， $_i$ 是存在正數(shù)，也存在負(fù)數(shù)，所以可以簡單的把這個數(shù)據(jù)集，看做是一個服從均值為0，方差為 $σ^2$ 的正態(tài)分布。所以 $_i$ 出現(xiàn)的概率為：

$p(?_i)=/frac{1}{/sqrt{2π}σ}exp{/frac{-(?_i)^2}{2σ^2}}$

把 $_i=y_i-θ_ix_i$ 代入到以上高斯分布的函數(shù)中，變成以下式子：

$p(?_i)=/frac{1}{/sqrt{2π}σ}exp{/frac{-(y_i-θ_ix_i)^2}{2σ^2}}$

GPU云服務(wù)器云服務(wù)器機(jī)器學(xué)習(xí)回歸算法機(jī)器學(xué)習(xí)回歸機(jī)器學(xué)習(xí)學(xué)習(xí)算法算法機(jī)器學(xué)習(xí)

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/123370.html

發(fā)表評論

登陸后可評論

0條評論

mtunique

男|高級講師

我要關(guān)注我要私信

TA的文章

構(gòu)建多云戰(zhàn)略的注意事項(xiàng)

閱讀 594·2021-11-18 13:12
【機(jī)器學(xué)習(xí)】回歸算法-精講

閱讀 1314·2021-11-15 11:39
機(jī)器人攻擊數(shù)量同比增長41%，人為發(fā)起攻擊下降29%

閱讀 2473·2021-09-23 11:22
買了主機(jī)還要什么-電腦主機(jī)應(yīng)該怎么買？

閱讀 6194·2021-09-22 15:15
速云：495元/月/4核/4GB內(nèi)存/50GB SSD空間/不限流量/500Mbps-1Gbps端口

閱讀 3655·2021-09-02 09:54
CSS3實(shí)現(xiàn)3D動畫

閱讀 2310·2019-08-30 11:10
H5 頁面 rem 布局適配方法

閱讀 3245·2019-08-29 14:13
終于找到一種有效的垂直居中方法

閱讀 2913·2019-08-29 12:49

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

【機(jī)器學(xué)習(xí)】回歸算法-精講

回歸算法

回歸算法

線性回歸和非線性回歸：

線性回歸

線性回歸方程：

損失函數(shù)：