国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

【學習摘錄】機器學習特征選擇

lyning / 2987人閱讀

摘要:應用過機器學習進行數據挖掘的同學應該都知道特征選擇對模型表現的重要性。本文基于網上經典特征選擇相關文章整理出干貨常用方法分類以及調包俠該如何用快速上手,供大家參考。

應用過機器學習進行數據挖掘的同學應該都知道特征選擇對模型表現的重要性。本文基于網上經典特征選擇相關文章整理出干貨:常用方法分類以及調包俠該如何用sklearn快速上手,供大家參考。 (一)預處理: 1 無量綱化:
1.1 區間縮放
from sklearn.preprocessing 
import MinMaxScaler #區間縮放,返回值為縮放到[0, 1]區間的數據
MinMaxScaler().fit_transform(iris.data)
1.2 標準化(特征值服需從正態分布)
from sklearn.preprocessing import StandardScaler #標準化,返回值為標準化后的數據
StandardScaler().fit_transform(iris.data)
2 特征二值化:定量特征二值化的核心在于設定一個閾值,大于閾值的賦值為1,小于等于閾值的賦值為0 3 特征啞變量 4 缺失值計算:一般以均值填充 5 數據變換:常見的數據變換有基于多項式的、基于指數函數的、基于對數函數的 (二)特征選擇 1 過濾
1.1 基于方差
from sklearn.feature_selection
import VarianceThreshold
#方差選擇法,返回值為特征選擇后的數據 #參數threshold為方差的閾值
VarianceThreshold(threshold=3).fit_transform(iris.data)
1.2 相關系數
from sklearn.feature_selection 
import SelectKBest
from scipy.stats import pearsonr
SelectKBest(lambda X, Y: array(map(lambda x:pearsonr(x, Y), X.T)).T, k=2).fit_transform(iris.data, iris.target)
1.3 卡方檢驗
from sklearn.feature_selection
import SelectKBest
from sklearn.feature_selection import chi2#選擇K個最好的特征,返回選擇特征后的數據
SelectKBest(chi2, k=2).fit_transform(iris.data, iris.target)
1.4 互信息
2 遞歸特征消除:遞歸消除特征法使用一個基模型來進行多輪訓練,每輪訓練后,消除若干權值系數的特征,再基于新的特征集進行下一輪訓練 3 嵌入法
3.1 基于懲罰項的特征選擇法
3.2 樹模型中GBDT也可用來作為基模型進行特征選擇,使用feature_selection庫的SelectFromModel類結合GBDT模型,來選擇特征的代碼如下:
from sklearn.feature_selection 
import SelectFromModel
from sklearn.ensemble import GradientBoostingClassifier  
SelectFromModel(GradientBoostingClassifier()).fit_transform(iris.data, iris.target)
(四)降維 1 主成分分析
from sklearn.decomposition 
import PCA2 3 #主成分分析法,返回降維后的數據 #參數n_components為主成分數目 PCA(n_components=2).fit_transform(iris.data)
2 線性判別分析
from sklearn.lda 
import LDA2 3 #線性判別分析法,返回降維后的數據 #參數n_components為降維后的維數 LDA(n_components=2).fit_transform(iris.data, iris.target)

參考:

http://note.youdao.com/notesh...(收藏自公眾號數據挖掘入門與實戰)

https://www.zhihu.com/questio...

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/38502.html

相關文章

  • arXiv上五篇頂尖深度學習論文都講了些什么?

    摘要:自從年深秋,他開始在上撰寫并公開分享他感興趣的機器學習論文。本文選取了上篇閱讀注釋的機器學習論文筆記。希望知名專家注釋的深度學習論文能使一些很復雜的概念更易于理解。主要講述的是奧德賽因為激怒了海神波賽多而招致災禍。 Hugo Larochelle博士是一名謝布克大學機器學習的教授,社交媒體研究科學家、知名的神經網絡研究人員以及深度學習狂熱愛好者。自從2015年深秋,他開始在arXiv上撰寫并...

    WilsonLiu95 評論0 收藏0
  • 原創翻譯 | 10個音頻處理任務讓你開始使用深度學習應用

    摘要:這是機器學習課程中的一個典型例子,他把演講者的聲音和背景音樂分開。雖然用于啟動檢測的技術主要依賴于音頻特征工程和機器學習,但在這里可以很容易地使用深度學習來優化結果。 介紹 想象一個能理解你想要什么,且當你打電話給客戶服務中心時能理解你的感受的機器--如果你對某件事感到不高興,你可以很快地和一個人交談。如果您正在尋找特定的信息,您可能不需要與某人交談(除非您愿意!)。 ...

    notebin 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<