摘要:隨著時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注,機器學(xué)習(xí)正逐步應(yīng)用于科技生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫,它是屬于的第三方庫,今天的講解也是基于來進行講解的。
隨著AI時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注,機器學(xué)習(xí)正逐步應(yīng)用于科技、生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫Sklearn,它是屬于python的第三方庫,今天的講解也是基于python-IDE來進行講解的。
使用sklearn的準(zhǔn)備工作:安裝python3.6.*
安裝python開發(fā)的IDE環(huán)境
首先應(yīng)該安裝sklearn所需依賴的第三庫,包括scipy、numpy、matplotlib、pandas,安裝以上四個庫以后最后安裝sklearn
機器學(xué)習(xí)的六個主要步驟:首先應(yīng)該加載訓(xùn)練模型所用的數(shù)據(jù)集
采用合適的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試
選取合適或者創(chuàng)建合適的訓(xùn)練模型
將訓(xùn)練集中的數(shù)據(jù)輸入到模型中進行訓(xùn)練
通過第四步的訓(xùn)練大致確定模型所用的合理參數(shù)
將測試集中的數(shù)據(jù)輸入到模型中,根據(jù)模型得到的結(jié)果和真實的結(jié)果進行比較再次調(diào)整參數(shù)
Sklearn基礎(chǔ)知識概覽:1. 加載sklearn中的數(shù)據(jù)集datasets
from sklearn import datasets iris = datasets.load_iris() # 鳶尾花卉數(shù)據(jù) digits = datasets.load_digits() # 手寫數(shù)字8x8像素信息數(shù)據(jù)
2. 查看數(shù)據(jù)的信息
print(iris.data[:4]) # 查看數(shù)據(jù)的特征信息
print iris.data.shape) # 查看數(shù)據(jù)的特征信息維度
print(iris.target_names)# 查看標(biāo)簽對應(yīng)的文本
print (iris.target[:4] )# 查看數(shù)據(jù)的標(biāo)簽 setosa:0 ...
3. 訓(xùn)練集和分割集的分割
from sklearn.model_selection import train_test_split X = digits.data # 特征矩陣 y = digits.target # 標(biāo)簽向量 # 隨機分割訓(xùn)練集和測試集: # test_size:設(shè)置測試集的比例。random_state:可理解為種子,保證隨機唯一 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=8)sklearn實戰(zhàn)例子:
from sklearn import datasets from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split iris = datasets.load_iris() X = iris.data y = iris.target # 新建一個模型(參數(shù)默認(rèn)) iris_model = LinearRegression() # 分割訓(xùn)練集、測試集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3., random_state=7) # 訓(xùn)練該模型 iris_model.fit(X_train,y_train) # 返回模型參數(shù)列表 print(iris_model.get_params()) # 模型在訓(xùn)練集上的評分 print(iris_model.score(X_train, y_train)) # 模型在測試集上的評分 print(iris_model.score(X_test, y_test)) # 使用模型進行預(yù)測 y_pred = iris_model.predict(X_test) print("預(yù)測標(biāo)簽:", y_pred[:3]) print("真實標(biāo)簽:", y_test[:3]) # 使用pickle保存模型 import cPickle as pickle with open("LR_model.pkl", "w") as f: pickle.dump(iris_model, f) # 重新加載模型進行預(yù)測 with open("LR_model.pkl", "r") as f: model = pickle.load(f) # 使用模型進行預(yù)測 model.predict(X_test)[:3]運行成功結(jié)果截圖:
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/44618.html
摘要:隨著時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注,機器學(xué)習(xí)正逐步應(yīng)用于科技生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫,它是屬于的第三方庫,今天的講解也是基于來進行講解的。 隨著AI時代的到來及物聯(lián)網(wǎng)概念的日益受到人們的關(guān)注,機器學(xué)習(xí)正逐步應(yīng)用于科技、生活生產(chǎn)各個領(lǐng)域。今天我們就為介紹機器學(xué)習(xí)中常用到的一個第三庫Sklearn,它是屬于python的第三方庫,今天的講解...
摘要:使用該數(shù)據(jù)集,我們將構(gòu)建機器學(xué)習(xí)模型以使用腫瘤信息來預(yù)測腫瘤是惡性的還是良性的。我們將使用函數(shù)來確定機器學(xué)習(xí)分類器的準(zhǔn)確性。您已成功構(gòu)建了第一臺機器學(xué)習(xí)分類器。現(xiàn)在,您可以使用在中加載數(shù)據(jù)組織數(shù)據(jù)訓(xùn)練預(yù)測和評估機器學(xué)習(xí)分類器。 歡迎大家前往騰訊云+社區(qū),獲取更多騰訊海量技術(shù)實踐干貨哦~ 本文由信姜緣 發(fā)表于云+社區(qū)專欄 介紹 機器學(xué)習(xí)是計算機科學(xué)、人工智能和統(tǒng)計學(xué)的研究領(lǐng)域。機器學(xué)...
摘要:在這里我分享下我個人入門機器學(xué)習(xí)的經(jīng)歷,希望能對大家能有所幫助。相關(guān)學(xué)習(xí)鏈接,,入門后的體驗在入門了機器學(xué)習(xí)之后,在實際工作中,絕大多數(shù)的情況下你并不需要去創(chuàng)造一個新的算法。 機器學(xué)習(xí)在很多眼里就是香餑餑,因為機器學(xué)習(xí)相關(guān)的崗位在當(dāng)前市場待遇不錯,但同時機器學(xué)習(xí)在很多人面前又是一座大山,因為發(fā)現(xiàn)它太難學(xué)了。在這里我分享下我個人入門機器學(xué)習(xí)的經(jīng)歷,希望能對大家能有所幫助。 PS:這篇文章...
閱讀 2224·2021-11-22 09:34
閱讀 1334·2021-10-11 10:59
閱讀 4427·2021-09-22 15:56
閱讀 3270·2021-09-22 15:08
閱讀 3401·2019-08-30 14:01
閱讀 773·2019-08-30 11:16
閱讀 1129·2019-08-26 13:51
閱讀 2906·2019-08-26 13:43