摘要:應用過機器學習進行數據挖掘的同學應該都知道特征選擇對模型表現的重要性。本文基于網上經典特征選擇相關文章整理出干貨常用方法分類以及調包俠該如何用快速上手,供大家參考。
應用過機器學習進行數據挖掘的同學應該都知道特征選擇對模型表現的重要性。本文基于網上經典特征選擇相關文章整理出干貨:常用方法分類以及調包俠該如何用sklearn快速上手,供大家參考。 (一)預處理: 1 無量綱化:
from sklearn.preprocessing import MinMaxScaler #區間縮放,返回值為縮放到[0, 1]區間的數據 MinMaxScaler().fit_transform(iris.data)
from sklearn.preprocessing import StandardScaler #標準化,返回值為標準化后的數據 StandardScaler().fit_transform(iris.data)2 特征二值化:定量特征二值化的核心在于設定一個閾值,大于閾值的賦值為1,小于等于閾值的賦值為0 3 特征啞變量 4 缺失值計算:一般以均值填充 5 數據變換:常見的數據變換有基于多項式的、基于指數函數的、基于對數函數的 (二)特征選擇 1 過濾
from sklearn.feature_selection import VarianceThreshold #方差選擇法,返回值為特征選擇后的數據 #參數threshold為方差的閾值 VarianceThreshold(threshold=3).fit_transform(iris.data)
from sklearn.feature_selection import SelectKBest from scipy.stats import pearsonr SelectKBest(lambda X, Y: array(map(lambda x:pearsonr(x, Y), X.T)).T, k=2).fit_transform(iris.data, iris.target)
from sklearn.feature_selection import SelectKBest from sklearn.feature_selection import chi2#選擇K個最好的特征,返回選擇特征后的數據 SelectKBest(chi2, k=2).fit_transform(iris.data, iris.target)
from sklearn.feature_selection import SelectFromModel from sklearn.ensemble import GradientBoostingClassifier SelectFromModel(GradientBoostingClassifier()).fit_transform(iris.data, iris.target)(四)降維 1 主成分分析
from sklearn.decomposition import PCA2 3 #主成分分析法,返回降維后的數據 #參數n_components為主成分數目 PCA(n_components=2).fit_transform(iris.data)2 線性判別分析
from sklearn.lda import LDA2 3 #線性判別分析法,返回降維后的數據 #參數n_components為降維后的維數 LDA(n_components=2).fit_transform(iris.data, iris.target)
參考:
http://note.youdao.com/notesh...(收藏自公眾號數據挖掘入門與實戰)
https://www.zhihu.com/questio...
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/38502.html
摘要:自從年深秋,他開始在上撰寫并公開分享他感興趣的機器學習論文。本文選取了上篇閱讀注釋的機器學習論文筆記。希望知名專家注釋的深度學習論文能使一些很復雜的概念更易于理解。主要講述的是奧德賽因為激怒了海神波賽多而招致災禍。 Hugo Larochelle博士是一名謝布克大學機器學習的教授,社交媒體研究科學家、知名的神經網絡研究人員以及深度學習狂熱愛好者。自從2015年深秋,他開始在arXiv上撰寫并...
摘要:這是機器學習課程中的一個典型例子,他把演講者的聲音和背景音樂分開。雖然用于啟動檢測的技術主要依賴于音頻特征工程和機器學習,但在這里可以很容易地使用深度學習來優化結果。 介紹 想象一個能理解你想要什么,且當你打電話給客戶服務中心時能理解你的感受的機器--如果你對某件事感到不高興,你可以很快地和一個人交談。如果您正在尋找特定的信息,您可能不需要與某人交談(除非您愿意!)。 ...
閱讀 1704·2021-10-28 09:32
閱讀 612·2021-09-24 09:47
閱讀 2927·2021-09-02 15:11
閱讀 2738·2021-08-09 13:46
閱讀 2889·2019-08-30 15:55
閱讀 1075·2019-08-30 15:54
閱讀 3310·2019-08-29 14:12
閱讀 810·2019-08-26 13:40