摘要:雖然為企業定制的深度學習框架可以提供重要的價值,但自己構建一個這樣的框架會帶來獨特的挑戰。目前,訓練深度學習模型的較佳選擇是圖形處理單元。實際上,由于規模和管理方面的復雜性不可預測,許多深度學習項目的最終歸宿都是數據科學實驗。
深度學習是受到人類大腦啟發而產生的機器學習(ML)算法的一種。這些算法也被稱為神經網絡,它們特別擅長從嘈雜的數據和曾經對機器完全不透明的數據里探測出模式。雖然神經網絡的技術細節可能令數學和計算機科學博士感到興奮,但該技術的真正意義有更廣泛的吸引力。它代表著邁向真正的自主學習機器的又進一步。
毫不奇怪,這一新的算法浪潮已經引起了從機器翻譯到自動駕駛汽車等應用領域的廣泛關注。企業(而不只是互聯網的數字巨頭)已經開始使用它來解決各種各樣的問題。先期采用者已經在欺詐檢測、制造性能優化、預防性維護和推薦引擎等方面展示了(深度學習)高影響力的業務價值。很明顯這些新的機器智能驅動的創新有可能在未來五年重新定義各個行業,并產生新的贏家和輸家。
雖然為企業定制的深度學習框架可以提供重要的價值,但自己構建一個這樣的框架會帶來獨特的挑戰。本文將探討一些企業在開發應用此技術時遇到的障礙,克服這些障礙的方法,以及構建和維護深度學習項目時的其他需考慮的事項。具體我們將探討:
深度學習特殊的硬件和軟件需求(例如GPU)
解釋模型的新方法
構建可為深度學習提供服務的數據基礎平臺的考慮因素
在選擇、測試和推廣深度學習模型時進行的自動化
部署深度學習到生產系統的挑戰和要求
企業級專業知識技能的需求
深度學習需要超強的計算力
應用深度學習的挑戰之一是這樣一個事實:(有時運行在數百萬個神經元節點的規模上的)模型是計算密集型的,想要有效地進行模型的訓練需要專門的硬件和軟件資源。
目前,訓練深度學習模型的較佳選擇是GPU(圖形處理單元)。這些專用電路是在游戲行業被開發出來的,但特別適用于深度學習所需的浮點并行計算。
這一硬件是在CPU之后重要一步的前進。過去需要幾個月的時間進行模型的訓練,用GPU則只用幾周。但是,使用GPU可能會遇到挑戰,因為它們的硬件架構和計算框架與只能工作于CPU架構的軟硬件大不相同。
GPU需要大量工程工作來優化軟件和確保高效的并行性、可管理性、可靠性和可移植性。它們還必須與整個分析生態系統的其他部分集成在一起,因為某些學習會在CPU和GPU架構中都會發生。只通過GPU擴展模型可能非常棘手,因此需要智能地路由流量的設計以便高效地使用這兩種架構。
使用LIME來逐步接近模型的可解釋性
除了密集的計算需求之外,使用神經網絡的另一個獨特挑戰是它們偶爾的不可探知性。神經網絡使用隱藏層,從而將機器用于制定決策的信息解耦。深度學習的模型像黑盒子一樣工作,因為幾乎不可能了解到它們的內部運作方式。這就導致了信任的問題,因為在一些行業里,可解釋性是強制要求的。
例如,歐洲的金融機構必須遵守歐盟的《通用數據保護條例(GDPR)》。該條例會對無法解釋客戶數據如何被使用的公司施加嚴厲的財務處罰。在這種情況下,告訴客戶他們的金融交易被拒絕是因為模型的決定的是不可能的,也是非法的。除了符合法規之外,利益相關者往往需要被告知決策是如何被制定的,從而能決定是否支持決策的行動。
盡管離真正解決可解釋性還很遠,但已經有了一些方法可以讓企業解決模型可解釋性的問題。一種是被稱為局部可理解的與模型無關的解釋(LIME)的方法,這是華盛頓大學開發的一個開源的研究成果。LIME揭示了在決策時觸發算法的特定變量,并以人類可讀的方式生成該信息。例如在欺詐的場景下,了解這些信息可以從監管的角度提供安全保護,并幫助企業了解欺詐行為發生的方式和原因。
隨著研究人員試圖解決解釋性問題并完善深度學習必須的硬件,新的創新正在快速發展。但即使存在這些缺點,在企業中使用這種技術的收益可能很大。不過在正式部署模型之前,企業還必須擁有恰當的數據平臺。
為深度學習構建一個數據基礎(平臺)
投資構建一個強大的數據和分析基礎系統是深度學習項目的第一步。事實上,深度學習項目的成功取決于數據,這些數據必須是干凈、高可用且可靠的。過時的、不完整或不準確的數據會讓模型產生不正確的預測,這樣的代價是昂貴的并可能導致整個項目失敗。
雖然不像深度學習的其他部分那么令人興奮,但深度學習項目的大部分工作是在在這個數據基礎系統里完成的——讓數據可以被訪問,確保數據類型是正確的,修復和準確度相關的問題,并開發能幫助模型應用于正式環境的系統。
一旦模型被部署到生產系統,就需要能實時地解決數據集成問題。流式數據的導入必須是高可用和高可靠的,且計算特征的延遲要短。與此同時,批量數據的導入需要支持大規模,并與數據管道和存儲系統集成。
該系統還必須能夠快速迭代。特征準備需要能與模型訓練同步,要有相同的邏輯、延遲和前向兼容。對于所有的數據源和特征,必須確保它們的可見性和可追溯性,并將數據質量和管理與監控系統相結合。
越來越多的企業數據分布在混合云環境以及不同的存儲格式上。駐留在公共云中的數據、企業內部數據和存儲在于不同類型的對象和文件存儲系統中的數據之間必須要建立起連接。
雖然面臨很多挑戰,但這些依然可控??梢酝ㄟ^開發系統來持續監控數據,讓項目的團隊知道數據從何而來,不管是現在還是過去的數據,都知道如何重現它們。一旦這個數據基礎及其監控系統到位,就可以利用它進行深入學習實踐,并可以將它用于其他領域。
自動化深度學習模型的選擇和訓練
大多數(如果不是全部的話)用于深度學習的軟件框架都是開源的項目,任何人都可以免費下載和試用。其中,2015年由谷歌開源的TensorFlow是市場的領導者。
可以在這些深度學習框架之上運行許多不同的神經網絡類別,例如前饋網絡、生成對抗網絡、深層信念網絡和深度卷積網絡。由于新型深度學習模型繼續以驚人的速度出現,持續更新這個清單是幾乎不可能的?;谀阕约旱氖褂脠鼍?,選擇特定神經網絡體系架構的較佳實踐是存在的。但是,測試是無可替代的。深度學習是一門實驗學科,而不是理論學科。
一旦模型通過自動過程(分析運營方法論)完成訓練和驗證,應先部署到一個預生產環境里。在預生產環境中可以再對模型進行調整或重新訓練。使用分析運營流程方法論的好處還包括,可以讓利益相關方在模型被部署到生產環境自動運行之前熟悉模型。
生產系統上的深度學習模型需要考慮的事項
與所有其他類型的機器學習模型類似,深度學習模型的全生命周期(從開發到測試,發布到預生產,再發布到生產)都需要被監控和并能自動化的再訓練。在某些情況下,還應該能夠有從預生產到生產系統的灰度部署(通常通過A / B測試框架完成)。
還應考慮再訓練的策略。在某些情況下,傳統的機器學習相比深度學習可能能夠更快地被再次訓練。特別是當深度學習模型已經在海量數據中訓練并且新數據不會提供太多差異時(例如,一個模型用數十億人和汽車的圖像訓練過了)。通過現場測試來識別何時該模型的預測與基于人類專業知識的預期相一致也很重要。如果情況并非如此(不一致),那么應該再次通過分析運營流程開始自動再訓練的工作。
例如,推薦引擎能向購物者展示不同的選擇,但需要有一個機制來監控它,以確保購物者對推薦的物品的響應是正面的。同時,還應該能夠在全部數據的一定比例范圍內部署新的推薦引擎,并將其性能與另外一個推薦引擎的性能進行實時比較。
上面這些都不容易完成。實際上,由于規模和管理方面的復雜性不可預測,許多深度學習項目的最終歸宿都是數據科學實驗。由于存在如此多的陷阱,建立一個熟悉生產環境里深度學習挑戰的團隊非常重要。不幸的是,具有這種知識的人(目前)很難在谷歌和臉書等公司以外找到。
人才的匱乏
目前深度學習的專業人才很稀缺且昂貴。雖然許多聰明人能夠自學神經網絡并使用云API進行模型實驗,但很難找到具有在企業環境中大規模部署深度學習經驗的工程師。在福布斯最近一篇關于人工智能的文章中,Diego Klabjan說:“人工智能開發的人才庫很小,以可承受的、可持續的速度在一個組織中獲得這種腦力資源會很難?!?/p>
這一切將隨著深度學習領域的發展而變化,同時深度學習將證明其在更多行業和業務場景中的價值。同時,克服這種知識差距的一種方法是與知道需要避免哪種錯誤的有經驗的合作伙伴合作。雖然等到深度學習領域成熟后再行動會很有誘惑力,但這樣做可能會導致落后于人。
利用深度學習進行變革性轉變
部署深度學習與采用其他類型的軟件不同,它可能涉及大規模決策的自動化,并且是顛覆性的。這就要求企業重新考慮在部署之前涉及的流程。
這是必須的,因為深度學習不僅僅是通常的分析型附加業務。這些數據產品必須成為業務的組成部分,讓企業通過利用其數據的強大能量并自動采取行動來推動組織變革。
隨著深度學習領域的不斷成熟,成功部署深度學習的企業將看到更安全的產品、更滿意的客戶、更高效的運營以及其他幾十個相關應用場景所帶來的紅利。部署深度學習需要深思熟慮的投資(很大的)、跨職能協作和大量測試,但這些付出是值得的。如果企業準備好了,深度學習可以帶來變革。
Emily Drevets
Emily Drevets之前是BrightTALK的數據科學和大數據內容的負責人。她目前住在芝加哥,在那里她是一名作家,在晚上她就變成即興創作的自我。她只吃過芝加哥式的熱狗兩次。
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4769.html
摘要:訓練和建模邏輯的算法既是瓶頸也是突破口,深度學習的未來應用與發展值得矚目。自研發深度學習系統薄言豆豆人機對話成功率達,是目前比較優秀的的中文理解智能系統。 2016正好是人工智能概念誕生60周年。早在1956年,美國達特茅斯(Dartmouth)大學召開的學術會議上就提出了人工智能的概念。60年里,科學技術的積累使得機器學習、模式識別、人機交互這三個基礎支撐可以得到較為廣泛的應用。隨著一個甲...
摘要:在安全方面,詹東東稱,中企通信幫助企業在威脅來臨前先發制人。詹東東表示,中企通信云數據中心按照自身標準與要求進行定制化建設,等級都符合標準,并有專業的工程師進行駐場維護和服務,幫助國內企業解決語言不通溝通不暢等問題。當前,全球經濟正大步踏入數字經濟時代,伴隨著大數據、物聯網、移動互聯、云計算的快速發展,國內各行業數字化轉型也在不斷深入,這其中醞釀著無限的紅利的同時也將給各行各業帶來顛覆性的變...
摘要:然而在中國,還處于比較初級的階段,很多企業對自身安全問題并沒有系統性的管理。年整個中國市場只有億人民幣的規模,這個數字相比中國經濟對全球經濟的占比是不相符的。 showImg(https://segmentfault.com/img/bV9xRN?w=865&h=950);作者簡介: 叢磊,白山合伙人兼工程副總裁2016年加入白山,主要負責云聚合產品的研發管理和云鏈產品體系構建等。20...
閱讀 1262·2021-11-23 09:51
閱讀 2637·2021-09-03 10:47
閱讀 2233·2019-08-30 15:53
閱讀 2413·2019-08-30 15:44
閱讀 1374·2019-08-30 15:44
閱讀 1193·2019-08-30 10:57
閱讀 1923·2019-08-29 12:25
閱讀 1086·2019-08-26 11:57