Sklearn入門介紹

miracledan 發(fā)布于2019-07-31 11:05 / 2104人閱讀

摘要：隨著時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注，機器學(xué)習(xí)正逐步應(yīng)用于科技生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫，它是屬于的第三方庫，今天的講解也是基于來進行講解的。

隨著AI時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注，機器學(xué)習(xí)正逐步應(yīng)用于科技、生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫Sklearn，它是屬于python的第三方庫，今天的講解也是基于python-IDE來進行講解的。

使用sklearn的準(zhǔn)備工作：

安裝python3.6.*

安裝python開發(fā)的IDE環(huán)境

首先應(yīng)該安裝sklearn所需依賴的第三庫，包括scipy、numpy、matplotlib、pandas，安裝以上四個庫以后最后安裝sklearn

機器學(xué)習(xí)的六個主要步驟：

首先應(yīng)該加載訓(xùn)練模型所用的數(shù)據(jù)集

采用合適的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試

選取合適或者創(chuàng)建合適的訓(xùn)練模型

將訓(xùn)練集中的數(shù)據(jù)輸入到模型中進行訓(xùn)練

通過第四步的訓(xùn)練大致確定模型所用的合理參數(shù)

將測試集中的數(shù)據(jù)輸入到模型中，根據(jù)模型得到的結(jié)果和真實的結(jié)果進行比較再次調(diào)整參數(shù)

Sklearn基礎(chǔ)知識概覽：

1. 加載sklearn中的數(shù)據(jù)集datasets

   from sklearn import datasets
   iris = datasets.load_iris() # 鳶尾花卉數(shù)據(jù)
   digits = datasets.load_digits() # 手寫數(shù)字8x8像素信息數(shù)據(jù)

2. 查看數(shù)據(jù)的信息

print（iris.data[:4]） # 查看數(shù)據(jù)的特征信息
print iris.data.shape） # 查看數(shù)據(jù)的特征信息維度

print（iris.target_names）# 查看標(biāo)簽對應(yīng)的文本
print （iris.target[:4] ）# 查看數(shù)據(jù)的標(biāo)簽 setosa:0 ...

3. 訓(xùn)練集和分割集的分割

from sklearn.model_selection import train_test_split

X = digits.data # 特征矩陣
y = digits.target # 標(biāo)簽向量

# 隨機分割訓(xùn)練集和測試集：
# test_size：設(shè)置測試集的比例。random_state:可理解為種子，保證隨機唯一
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=8)

sklearn實戰(zhàn)例子：

from sklearn import datasets
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split

iris = datasets.load_iris()
X = iris.data
y = iris.target

# 新建一個模型(參數(shù)默認(rèn))
iris_model = LinearRegression()

# 分割訓(xùn)練集、測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=7)

# 訓(xùn)練該模型
iris_model.fit(X_train,y_train)

# 返回模型參數(shù)列表
print(iris_model.get_params())

# 模型在訓(xùn)練集上的評分
print(iris_model.score(X_train, y_train))

# 模型在測試集上的評分
print(iris_model.score(X_test, y_test))

# 使用模型進行預(yù)測
y_pred = iris_model.predict(X_test)

print("預(yù)測標(biāo)簽：", y_pred[:3])
print("真實標(biāo)簽：", y_test[:3])



# 使用pickle保存模型
import cPickle as pickle

with open("LR_model.pkl", "w") as f:
pickle.dump(iris_model, f)
# 重新加載模型進行預(yù)測
with open("LR_model.pkl", "r") as f:
model = pickle.load(f)

# 使用模型進行預(yù)測
model.predict(X_test)[:3]

運行成功結(jié)果截圖：

GPU云服務(wù)器云服務(wù)器 Ruby入門介紹 spark入門介紹 Sklearn sklearn圖像識別

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/44618.html

發(fā)表評論

登陸后可評論

0條評論

miracledan

男|高級講師

我要關(guān)注我要私信

TA的文章

小程序第一彈

閱讀 2224·2021-11-22 09:34
深入理解C語言指針——挑戰(zhàn)C指針筆試題 (和bug郭一起學(xué)C系列）

閱讀 1334·2021-10-11 10:59
監(jiān)控主機域名是什么-虛擬主機和域名是什么關(guān)系？

閱讀 4427·2021-09-22 15:56
主機后面一個電腦標(biāo)識的是什么-網(wǎng)絡(luò)標(biāo)識和主機標(biāo)識是什么意思？

閱讀 3270·2021-09-22 15:08
CSS中各種布局的背后(*FC)

閱讀 3401·2019-08-30 14:01
我們來談?wù)勴椖恐杏龅降男枰嫒輕c端和移動端的css布局

閱讀 773·2019-08-30 11:16
前端高頻面試題

閱讀 1129·2019-08-26 13:51
最近的狀態(tài)

閱讀 2906·2019-08-26 13:43

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Sklearn入門介紹

相關(guān)文章