摘要:用于機器學習人工智能數據分析的基于云計算的工具日前增多。亞馬遜公司創建了,以簡化使用其機器學習工具的工作。
用于機器學習、人工智能、數據分析的基于云計算的工具日前增多。其中的一些應用是在基于云計算的文檔編輯和電子郵件,技術人員可以通過各種設備登錄中央存儲庫,并在遠程位置,甚至在路上或海灘上進行工作。云計算可以處理文件備份和同步,簡化工作流程。
數據分析是很多組織在云計算平臺進行的一項主要計算工作,也許是因為IT技術人員擅長編程,或者也許是因為科學家的實驗室設備需要直接連接到計算機記錄數據,或者也許是因為數據集太大遷移它們非常耗時。
無論是什么原因,科學家和數據分析師都逐漸地接受了遠程計算。用于機器學習、人工智能、數據分析的基于云計算的工具日前增多。其中的一些應用是在基于云計算的文檔編輯和電子郵件,技術人員可以通過各種設備登錄中央存儲庫,并在遠程位置,甚至在路上或海灘上進行工作。云計算可以處理文件備份和同步,簡化工作流程。
實際上,數據分析更適合采用云計算。當數據集很大時,云計算用戶可以在租用的硬件設施上運行大型作業,從而更快、更好地完成工作。用戶沒有必要啟動電腦花費大量時間進行處理。而采用云計算,只需啟動數十個裝有大量內存的云計算實例,并在幾分鐘內觀察處理結果,因此可以節省時間和成本。
組織采用云計算也存在一定的風險,而最大的風險是對用戶隱私的擔憂。一些數據分析涉及用戶的個人信息。人們已經習慣了在實驗室中處理數據的安全問題,很難知道云中發生了什么。
人們對云計算提供商使用的最佳實踐感到滿意之前還需要一段時間。人們已經認識到,云計算提供商可能會聘請更多的安全顧問。如果個人電腦連接到全球互聯網,那么人們可能會說它已經是云計算的一部分。
幸運的是還有一些解決方法。最簡單的方法是使用隨機ID替換個人信息等技術來匿名化數據。這種方法并不完美,但是它可以在很大程度上緩解黑客在突破云計算的防御之后可能造成的麻煩。
還有一些其他的優點。一些提供商可以向公眾共享或開放源數據集,這可能生成更多的組合。一些云計算提供商正在策劃自己的數據集,并減少存儲成本以吸引用戶。如果用戶愿意,可以嘗試將產品銷售與天氣或太陽黑子等公共數據集中的任何其他信息相關聯。誰知道呢?這里有很多奇怪的相關性。
以下是七種不同的基于云計算的機器學習服務,可幫助人們理解數據集中的相關性和信號。
(1)Amazon SageMaker
亞馬遜公司創建了SageMaker,以簡化使用其機器學習工具的工作。Amazon SageMaker將不同的AWS存儲選項(S3、Dynamo、Redshift等)組合在一起,并將數據傳輸到流行的機器學習庫(TensorFlow、MXNet、Chainer等)的Docker容器中。在最終模型作為自己的API部署之前,可以使用Jupyter記事本跟蹤所有工作。SageMaker將用戶的數據移動到亞馬遜公共云的服務器中,因此用戶可以專注于思考算法而不是過程。如果要在本地運行算法,可以隨時下載Docker鏡像以簡化操作。
(2)微軟Azure機器學習
微軟公司已經看到了機器學習的未來,并全力投入到Machine.ingStudio中,這是一種用于在數據中查找信號的復雜圖形工具。這就像人工智能的電子表格。有一個拖放界面,用于構建流程圖以理解數字。文檔上表明“不需要編碼”,這在技術上是正確的,但用戶仍然需要像程序員一樣思考才能有效地使用它,而不會陷入構建代碼的困境。但如果錯過了語法錯誤、數據類型以及編程的其他樂趣,用戶可以導入用Python、R或其他一些選項編寫的模塊。
最有趣的選擇是,微軟公司已添加基礎設施,以便從人工智能中學到的內容,并將預測模型轉換為在Azure公共云中運行的Web服務。因此,用戶可以構建訓練集,創建模型,然后只需點擊鍵盤和鼠標,就可以從Azure服務中提供JSON數據包的答案。
(3)BigML
BigML是一種用于數據分析的混合儀表板,可以在BigML云平臺中使用,也可以在本地安裝。其主界面是一個儀表板,列出了所有等待由幾十臺機器學習分類器、集群器、回歸器和異常檢測器分析的所有文件。單擊并顯示結果。
最近,該公司專注于新算法,增強了堆棧提供有用答案的能力。新的Fusion代碼可以集成多種算法的結果,以提高準確性。
通過在BigML自己的服務器上采用大量免費套餐。用戶還可以在AWS,Azure或谷歌云平臺上構建私有部署。如果這仍然比較公開的話,他們會將其部署在用戶的私人服務器上。
(4)Databricks
Databricks工具集由Apache Spark的一些開發人員構建,他們采用了開源分析平臺,并增加了一些顯著的速度增強功能,通過一些巧妙的壓縮和索引來提高吞吐量。名為Delta的混合數據存儲是可以存儲大量數據然后快速分析的地方。當新數據到達時,它可以壓縮到原有的存儲器中以進行快速重新分析。
Apache Spark的所有標準化分析程序都可以在這些數據上運行,但對Spark基礎結構進行了一些急需的改進,例如用于分析代碼的集成記事本。
Databricks與AWS和Azure集成,并根據消費和性能定價。每個計算引擎都在Databrick Units中測量。企業需要為更快的型號支付更多費用。
(5)DataRobot
這里的許多方法都讓用戶只需點擊鍵盤即可構建機器學習模型。DataRobot宣稱能夠同時構建數百個模型,只需單擊一下鍵盤即可。在完成模型后,用戶可以通過它們進行挑選,找出能夠做得更好的模型,并繼續進行預測。其秘密是采用一個大規模的并行處理引擎,換句話說就是采用多臺機器進行分析。
DataRobot正在通過實施新算法和擴展當前算法來擴展。該公司最近收購了Nutonian,其Eureqa引擎應該增強自動化機器學習平臺創建時間序列和分類模型的能力。該系統還為更高級的用戶提供了Python API。
DataRobot可通過DataRobot Cloud或嵌入式工程師隨附的企業軟件版本獲得。
(6)谷歌云機器學習引擎
谷歌公司在TensorFlow上投入了大量資金,TensorFlow是用于在數據中查找信號的標準開源庫之一,現在用戶可以在谷歌云平臺中嘗試采用TensorFlow。谷歌云機器學習引擎中的一些工具是開源的,對于任何下載它們的用戶來說都是免費的,有些工具是谷歌云平臺中商業選項的一部分。這使用戶可以自由地探索,并避免一些鎖定,因為大部分代碼都是開源的,并且可以在任何Mac,Windows或Linux機器上運行。
還有幾個不同的工具。采用最容易的工具可能是Colaboratory,它將Jupyter記事本連接到谷歌的TensorFlow后端,因此用戶可以編寫出代碼并查看它的運行情況。谷歌公司還為希望進行實驗的科學家提供TensorFlow研究云。在合適的情況下,用戶可以使用GPU或TPU在谷歌公司的加速硬件上運行機器學習模型。
(7)IBM Watson Studio
現在Watson將IBM公司的大部分資源都投入了人工智能。IBM Watson Studio是一種用于在云端或本地中探索數據和訓練模型的工具。在數據傳入時,其結果在公司的儀表板上顯示漂亮的圖表。
最大的區別可能是桌面版的Watson Studio。用戶可以使用基于云計算的版本來研究數據,并享受彈性資源和集中式存儲庫帶來的所有功能。或者用戶可以通過防火墻的隱私和桌面的便利做同樣的事情。
每個云平臺中的機器學習模型
雖然很多人都希望為他們的人工智能研究選擇一個儀表板,但是沒有理由不采用更多的選擇。一旦完成所有預處理和數據清理,用戶可以將相同的CSV格式數據提供給所有這些服務,并比較結果以找到最佳選擇。其中一些服務已經提供了算法之間的自動比較。為什么不使用多個呢?
用戶還可以利用一些不斷發展的開放標準。例如,Jupyter記事本通常無需太多修改即可運行。用戶可以在一個平臺上進行開發,然后將大部分代碼與數據一起移動,以測試不同平臺上的任何新算法或不同算法。
人們距離標準化還有很長的路要走,很多算法之間存在著詭異和無法解釋的差異。因此,用戶不要僅僅考慮一種算法或一種訓練方法,而是需要嘗試使用盡可能多的不同建模工具。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/6144.html
摘要:下面就讓我們來看看你應該考慮哪些最受歡迎的云計算認證。是一個國際機構,負責推動云計算專業人員的標準培訓和認證。目前,提供一個認證和五個云認證,范圍從專業云管理員到專業云解決方案架構師。關于IT,如果說有一點可以肯定的,那就是投資云永遠也不晚。隨著云對IT和整個業務越來越重要,對云技能的需求也只會越來越大。但是,要證明你在這個競爭激烈的就業市場中具有所需的技能和知識,可能是一件很難的事情。如果...
摘要:人工智能正在召喚神龍。阿里云發布首個異構超算集群人工智能特別是深度學習,對算力的要求永無止境。除了神龍異構超算集群外,阿里云還發布了新版本可兼容加速器和小程序云。人工智能正在召喚神龍。3月21日,阿里云發布業內首個公共云異構超算集群——基于彈性裸金屬服務器神龍X-Dragon的SCC-GN6,集群性能接近線性增長,將深度學習訓練時間縮短至分鐘級,可滿足無人駕駛、智能推薦、機器翻譯等人工智能場...
摘要:據悉,谷歌公司高管日前透露,由于打算在印度與亞馬遜和微軟對抗,谷歌計劃今年將其印度云計算業務職工人數翻番。他尚未透露印度目前員工總數。其競爭對手亞馬遜微軟和已經在印度擁有各自共有云數據中心。據悉,谷歌公司高管日前透露,由于打算在印度與亞馬遜和微軟對抗,谷歌計劃今年將其印度云計算業務職工人數翻番。根據Gartner的數據,由于印度云計算市場開發度較低,印度公有云服務市場預計將在2017年增長3...
摘要:用友網絡山東區作為推動山東企業上云的主力服務商,參展了此次活動。用友云,是用友時期的核心產品,致力于以平臺模式為企業提供社會化云服務助力企業數字化轉型。用友云幫助企業實現敏經營輕管理易金融簡,從而最終實現增長收入降低成本提高效率控制風險。3月7日上午,由濟南市經信委、市財政局與高新區機關黨委主辦的云行齊魯之濟南站暨高新區創新論壇在濟南禧悅東方酒店順利召開。本次活動是今年企業上云第一次重大活動...
摘要:隨著年上半年的臨近尾聲,我們有必要重新回顧一下云計算之戰,看看這一年將如何發展。毫不奇怪,這三家公司分別是,微軟和谷歌云,它們進入了領導象限。邊緣計算即服務。此舉是邊緣設備上機器學習的有趣測試平臺。和打磨他們的云計算并關注。 隨著基礎設施領域的差距縮小,上半年最有意思的發展圍繞著軟件即服務展開。然而,物聯網,...
閱讀 1262·2021-11-23 09:51
閱讀 2637·2021-09-03 10:47
閱讀 2233·2019-08-30 15:53
閱讀 2414·2019-08-30 15:44
閱讀 1375·2019-08-30 15:44
閱讀 1193·2019-08-30 10:57
閱讀 1923·2019-08-29 12:25
閱讀 1086·2019-08-26 11:57