摘要:微軟在大會上興奮地宣布了的預覽版,這是一種跨平臺的開源機器學習框架。核心組件作為的一部分而發布今天的代碼倉庫包含用于模型訓練和使用的,以及許多常見的機器學習任務如回歸和分類所需要的各種轉換和學習器。
微軟在Build 2018大會上興奮地宣布了ML.NET的預覽版,這是一種跨平臺的開源機器學習框架。ML.NET將讓廣大.NET開發人員可以開發自己的模型,并且將自定義的機器學習融入到其應用程序中,無需之前擁有開發或調整機器學習模型方面的專業知識。
ML.NET最初是在微軟研究中心開發而它的,在過去的十年已發展成為一種重要的框架;它用于微軟的許多產品組合中,比如Windows、Bing和Azure等。
有了這第一個預覽版,ML.NET能夠支持諸多機器學習任務,比如說分類(比如文本分類和情緒分析)以及回歸(比如趨勢預測和價格預測)。除了這些機器學習功能外,ML.NET的這第一個版本還引入了訓練模型的.NET API初稿,使用模型用于預測,還包括該框架的核心組件,比如學習算法、轉換和核心的機器學習數據結構。
ML.NET首先是一個框架,這意味著它經擴展后可以添加流行的機器學習庫,比如TensorFlow、Accord.NET和CNTK。我們致力于將開發ML.NET的內部功能方面的全部經驗帶給開源界的ML.NET。
綜上所述,ML.NET代表了我們致力于通過.NET讓機器學習變得很出色。
隨著時間的推移,ML.NET將充分利用流行的深度學習庫(比如TensorFlow、Caffe2和CNTK)以及一般的機器學習庫(比如Accord.NET),從而支持其他機器學習場景,比如推薦系統、異常檢測及其他方法(比如深度學習)。
ML.NET還允許采用代碼優先的方法,補充了Azure機器學習和認知服務提供的體驗,并支持應用程序本地部署以及自行構建模型的功能。
ML.NET核心組件
ML.NET作為.NET Foundation的一部分而發布;今天的代碼倉庫包含用于模型訓練和使用的.NET C# API,以及許多常見的機器學習任務(如回歸和分類)所需要的各種轉換和學習器。
ML.NET旨在提供E2E工作流程,以便在預處理、特征工程、建模、評估和操作化等過程中將機器學習融入到.NET應用程序中。
ML.NET本身支持機器學習各方面所需要的類型和運行時環境,包括核心數據類型、可擴展流水線、高性能數學、面向異構數據的數據結構和工具支持等。
下面這張表顯示了作為ML.NET 0.1的一部分發布的完整組件列表。
我們旨在讓ML.NET的API具有通用性,那樣CNTK、Accord.NET和TensorFlow等其他框架以及其他庫就可以通過單一的共享式API來加以使用。
安裝入門
想開始使用ML.NET,請使用下列命令從CLI來安裝ML.NETNuGet:
從軟件包管理器來安裝:
您可以直接從https://github.com/dotnet/machinelearning來構建框架。
借助ML.NET實現情緒分類
訓練您自己的模型
這個簡單的代碼片段用來訓練情緒分類模型(完整的代碼片段可在此:https://github.com/dotnet/machinelearning/blob/master/test/Microsoft.ML.Tests/Scenarios/Scenario3_SentimentPrediction.cs找到)。
讓我們更詳細地討論這個方面。我們創建了一個LearningPipeline,它將負責封裝數據加載、數據處理/特征化和學習算法。這些是訓練機器學習模型所需要的幾個步驟,該模型讓我們得以拿來輸入數據后輸出預測結果。
這條流水線的第一部分是TextLoader,它將來自我們訓練文件的數據加載到流水線。然后,我們使用TextFeaturizer將SentimentText列轉換成名為Features的數字向量,該數字向量可以被機器學習算法所使用(因為它無法接受文本輸入)。這是我們的預處理/特征化步驟。
FastTreeBinaryClassifier是我們將用于該流水線中的決策樹學習器。就像特征化步驟那樣,嘗試ML.NET中不同的學習器并更改其參數有望找到更好的結果。 PredictedLabelColumnOriginalValueConverter將模型的預測標簽轉換回成原始值/格式。
pipeline.Train
將經過訓練的模型用于預測
為了得到預測結果,我們對新數據使用model.Predict()。請注意,輸入數據是一個字符串,模型包含特征化,所以我們的流水線在訓練和預測期間都保持同步。我們不必編寫專門用于預測的預處理/特征化代碼。
前方的道路
我們渴望將許多功能添加到ML.NET中,但我們很想了解哪些功能最適合您的要求。目前我們正在探索的領域包括:
另外的機器學習任務和場景
使用TensorFlow和CNTK的深度學習
ONNX支持
在Azure上橫向擴展
更好的GUI,以簡化機器學習任務
與VS工具集成,用于AI
針對.NET的語言創新
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4759.html
摘要:十三套框架助你玩轉機器學習技術在今天的文章中,我們將共同了解十三款機器學習框架,一部分去年剛剛發布另一部分則在不久前進行了全部升級。目前該項目正積極添加對的支持能力,不過此類項目一般更傾向于直接面向各承載機器學習任務的主流環境。 導讀過去幾年以來,機器學習已經開始以前所未有的方式步入主流層面。這種趨勢并非單純由低成本云環境乃至極為強大的GPU硬件所推動; 除此之外,面向機器學習的可用框架也迎...
摘要:年月宣布支持時間延長到年。更詳細的發布列表參閱官網的版本號分為三段,形如。其中表示大版本號,一般當整體重寫,或出現不向后兼容的改變時,增加表示功能更新,出現新功能時增加表示小的改動如修復了某個,只要有修改就增加。年公司正式發布。 < 返回索引頁 Python語言簡介 Python介紹及發展 介紹 Python 官方網站:https://www.python.org/, 大家可以到此處下...
摘要:對云術語模糊不清我們可以幫你厘清網站從到的云計算術語表對最流行的云計算術語逐一進行了定義。云計算云計算通過網絡通常是互聯網交付信息技術服務。云計算常常被稱為是一種顛覆性技術。 對云術語模糊不清?我們可以幫你厘清!Solutions Review網站從A到Z的云計算IT術語表對最流行的云計算術語逐一進行了定義。A基于廣告的定價模式――這種定價模式將服務低價或免費提供給客戶,因廣告連同服務提供給...
閱讀 2845·2021-10-21 09:38
閱讀 2751·2021-10-11 10:59
閱讀 3022·2021-09-27 13:36
閱讀 1649·2021-08-23 09:43
閱讀 790·2019-08-29 14:14
閱讀 3034·2019-08-29 12:13
閱讀 3203·2019-08-29 12:13
閱讀 310·2019-08-26 12:24