摘要:起步這次使用的訓練集由模塊提供,關于虹膜一種鳶尾屬植物的數據。它的品種分類有山鳶尾,變色鳶尾,菖蒲錦葵三種。構造分類器參數級是指定獲取個鄰近點。訓練訓練的函數一般就是測試模擬一些測試數據,使用剛剛的模型進行預測
起步
這次使用的訓練集由 sklearn 模塊提供,關于虹膜(一種鳶尾屬植物)的數據。
數據載入from sklearn import datasets iris = datasets.load_iris()
數據存儲在 .data 成員中,它是一個 (n_samples, n_features) numpy 數組:
print(iris.data) # [[ 5.1 3.5 1.4 0.2] # [ 4.9 3. 1.4 0.2] # ...
它有四個特征,萼片長度,萼片寬度,花瓣長度,花瓣寬度 (sepal length, sepal width, petal length and petal width)。
它的品種分類有山鳶尾,變色鳶尾,菖蒲錦葵(Iris setosa, Iris versicolor, Iris virginica.)三種。
print iris.data.shape # output:(150L, 4L)
這是一個含有 150 個數據的訓練集。
構造 KNN 分類器from sklearn import neighbors knn = neighbors.KNeighborsClassifier(n_neighbors=5)
n_neighbors 參數級是指定獲取 K 個鄰近點。
訓練訓練的函數一般就是 fit :
knn.fit(iris.data, iris.target)測試
模擬一些測試數據,使用剛剛的模型進行預測:
predict = knn.predict([[0.1, 0.2, 0.3, 0.4]]) print(predict) # output: [0]
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/44539.html
摘要:起步本章介紹如何自行構造分類器,這個分類器的實現上算是比較簡單的了。不過這可能需要你之前閱讀過這方面的知識。在預測函數中,需要依次計算測試樣本與數據集中每個樣本的距離。篩選出前個,采用多數表決的方式。測試還是使用中提供的虹膜數據。 起步 本章介紹如何自行構造 KNN 分類器,這個分類器的實現上算是比較簡單的了。不過這可能需要你之前閱讀過這方面的知識。 前置閱讀 分類算法之鄰近算法:KN...
摘要:鄰近算法算法背景假設我們要給一堆音樂分類,我們可以分成搖滾,民謠,戲曲等等,搖滾的音樂激昂,節奏快。這種基于某一特征出現的次數來區分事物的算法,我們使用鄰近算法。 k-鄰近算法 算法背景 假設我們要給一堆mp3音樂分類,我們可以分成搖滾,民謠,戲曲等等,搖滾的音樂激昂,節奏快。民謠舒緩節奏慢,但是搖滾中也有可能存在舒緩節奏慢點旋律, 同理民謠中也會有激昂,快的旋律。那么如何區分他們呢,...
閱讀 1611·2023-04-25 16:29
閱讀 949·2021-11-15 11:38
閱讀 2284·2021-09-23 11:45
閱讀 1410·2021-09-22 16:03
閱讀 2532·2019-08-30 15:54
閱讀 1198·2019-08-30 10:53
閱讀 2599·2019-08-29 15:24
閱讀 1095·2019-08-26 12:25