Python 實現(xiàn)最小二乘法擬合直線

woshicixide 發(fā)布于2019-07-31 10:29 / 2764人閱讀

摘要：線性回歸線性回歸是回歸分析中最常見的一種建模方式。當(dāng)因變量是連續(xù)的，自變量是連續(xù)的或者離散的，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。

線性回歸

線性回歸是回歸分析中最常見的一種建模方式。當(dāng)因變量是連續(xù)的，自變量是連續(xù)的或者離散的，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。用方程 y = mx + c，其中 y為結(jié)果，x為特征，m為系數(shù)，c為誤差 在數(shù)學(xué)中m為梯度c為截距。

最小二乘法

最小二乘法用于求目標(biāo)函數(shù)的最優(yōu)值，它通過最小化誤差的平方和尋找匹配項所以又稱為：最小平方法；這里將用最小二乘法用于求得線性回歸的最優(yōu)解
關(guān)于最小二乘法推導(dǎo)過程，詳見這篇博客 最小二乘法

pandas 處理數(shù)據(jù)

導(dǎo)入 pandas 模塊

import pandas as pd
import matplotlib.pyplot as plt

# jupyter 關(guān)于繪圖的參數(shù)配置

plt.style.use("ggplot")
%config InlineBackend.figure_format = "retina"
%matplotlib inline

獲取表示長度和寬度關(guān)系的幾組數(shù)據(jù)

數(shù)據(jù)不是很完美，接下來利用 pandas 處理下

修改列名

重置索引

df = df.rename(columns={"Unnamed: 0":"0"})
df = df.set_index(keys=["0"])

為了分析長度和寬度之間的線性關(guān)系，分別獲取長度和寬度的一維數(shù)據(jù)

xcord = df.loc["長度"]
ycord = df.loc["寬度"]

plt.scatter(xcord,ycord,s=30,c="red",marker="s")

從寬度和長度的數(shù)據(jù)分布，可以看出具有一定的線性關(guān)系，接下來我們用最小二乘法來擬合這條直線

最小二乘法的計算過程

## xy 的均值
(xcord*ycord).mean()

## x 的均值乘以 y 的均值
xcord.mean()* ycord.mean()

## x 的平方均值
pow(xcord,2).mean()

## x 的均值的平方
pow(xcord.mean(),2)

# m 分子是 xy 的均值減去 x 的均值乘以 y 的均值；
# m 分母是 x 平方的均值 減去 x 的均值的平方

m = ((xcord*ycord).mean() - xcord.mean()* ycord.mean())/(pow(xcord,2).mean()-pow(xcord.mean(),2))

# c 等于 y 的均值 - m 乘以 x 的均值
c = ycord.mean() - m*xcord.mean()

# 繪圖
plt.scatter(xcord,ycord,s=30,c="red",marker="s")
x=np.arange(90.0,250.0,0.1)
y=m*x+c    
plt.plot(x,y)
plt.show()

Python 建模

處理數(shù)據(jù)，計算相關(guān)系數(shù)矩陣，提取特征和標(biāo)簽

df = pd.read_csv("./zuixiaoerchengfa.csv",encoding="gbk")
df.rename(columns={"Unnamed: 0":""},inplace=True)
df.set_index(keys="",inplace=True)
df_new = df.T
df_new.corr()

xcord = df_new["長度"]
ycord = df_new["寬度"]

引入 sklearn 模塊得到訓(xùn)練集和測試集

from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

plt.style.use("ggplot")
%config InlineBackend.figure_format = "retina"
%matplotlib inline

# 訓(xùn)練數(shù)據(jù)、測試數(shù)據(jù)遵循二八法則
x_train,x_test,y_train,y_test = train_test_split(xcord, ycord, train_size = 0.8, test_size = 0.2)

# 從圖可以看出兩個特征之間適合簡單線性回歸模型
plt.scatter(x_train,y_train,c = "g")
plt.xlabel("L")
plt.ylabel("H")

創(chuàng)建線性回歸模型

from sklearn.linear_model import LinearRegression

model = LinearRegression()

# model.fit model.score 需要傳遞二維列表，故通過 reshape 重塑
x_train = x_train.values.reshape(-1,1)
y_train = y_train.values.reshape(-1,1)

model.fit(x_train,y_train)

# 計算出擬合的最小二乘法方程

# y = mx + c 
c = model.intercept_
m = model.coef_

c = round(float(c),2)
m = round(float(m),2)
print("最小二乘法方程 : y = {} + {}x".format(c,m))

評估模型

x_test = x_test.values.reshape(-1,1)
y_test = y_test.values.reshape(-1,1)
model.score(x_test,y_test)

可視化效果

通過可視化效果來感受模型擬合效果

x_train_result = model.predict(x_train)

plt.scatter(xcord,ycord,c = "r", label = "source data")
plt.scatter(x_train,y_train, c = "b",label = "train data")
plt.scatter(x_test,y_test,c = "g",label = "test data")

plt.xlabel("L")
plt.ylabel("H")
plt.legend(loc="upper left")
plt.plot(x_train,x_train_result)

云服務(wù)器 GPU云服務(wù)器最小二乘法擬合算法流程圖最小二乘圓擬合算法 matlab 最小二乘擬合最小二乘擬合的算法效率

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/43891.html

發(fā)表評論

登陸后可評論

0條評論

woshicixide

男|高級講師

我要關(guān)注我要私信

TA的文章

anaconda配置tensorflow

閱讀 2592·2023-04-25 22:09
野草云：特惠香港獨立服務(wù)器，月付399元起，香港阿里云精品網(wǎng)月付499元起

閱讀 2837·2021-10-14 09:47
BuyVM掛載硬盤方法(Block Storage Slabs)

閱讀 1889·2021-10-11 11:10
C 跌落神壇，Python 終登榜首 | TIOBE 10 月編程語言排行榜

閱讀 2677·2021-10-09 09:44
asp如何知道虛擬主機500錯誤-虛擬主機出現(xiàn)500程序報錯怎么解決？

閱讀 3372·2021-09-22 14:57
2019前端面試題（持續(xù)更新）

閱讀 2493·2019-08-30 15:56
MPVUE -學(xué)習(xí)筆記

閱讀 1615·2019-08-30 15:55
Codepen 每日精選（2018-3-24）

閱讀 775·2019-08-30 14:13

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python 實現(xiàn)最小二乘法擬合直線

相關(guān)文章

**【正經(jīng)的AI on Python入門系列】1.2 斗圖工具的優(yōu)化——文本寬度自適應(yīng)（來做點小數(shù)據(jù)分析**

【機器學(xué)習(xí)】線性回歸原理介紹

發(fā)表評論

0條評論

woshicixide

男|高級講師

TA的文章

anaconda配置tensorflow

野草云：特惠香港獨立服務(wù)器，月付399元起，香港阿里云精品網(wǎng)月付499元起

BuyVM掛載硬盤方法(Block Storage Slabs)

C 跌落神壇，Python 終登榜首 | TIOBE 10 月編程語言排行榜

asp如何知道虛擬主機500錯誤-虛擬主機出現(xiàn)500程序報錯怎么解決？

2019前端面試題（持續(xù)更新）

MPVUE -學(xué)習(xí)筆記

Codepen 每日精選（2018-3-24）

最新活動