摘要:近日,峰會在京盛大開幕。所以對于游戲而言,可將最小可用產品的優化目標定位在盡快鎖定游戲的高價值用戶,且鎖定時間要迅速。第四范式在這方面已經做了一些工作,先知平臺已經根據連續和離散的數據的計算特性做針對性的設計。
近日,AWS 2017峰會在京盛大開幕。第四范式互聯網業務負責人周開拓受邀出席,并發表了“打造人工智能MVP”的主題演講,分享了企業高效、快速地向人工智能轉型的寶貴經驗。周開拓曾任職于淘寶網,負責在線推薦系統的設計和算法工作,加入第四范式之后,基于第四范式核心產品“先知”,孵化了面向中小企業的公有云版機器學習服務,致力于完成內容推薦、電商推薦、精準營銷、計算廣告等關鍵業務的AI轉型。
快速定位機器學習的MVP
在移動互聯網領域,最容易被接受的一個概念便是最小可用產品(MVP),即開發團隊、設計團隊用最小的成本、冒最小的風險,最大程度去驗證產品的可行性——這個產品的可行性,是指這個需求是否真實存在,當前產品解決這個需求的方向是否是正確的。機器學習亦是如此,企業對于機器學習的投入是長期、持續的,帶來的收入和回報也是巨大的,但在此之前,企業更希望用較低的成本去驗證:引入機器學習是否可以帶來業務指標的提升,產生價值的潛力有多大。
以較為經典的推薦系統為例,數據科學家往往會從點擊、購買、收藏、轉發分享等來表達用戶是否喜歡推薦的商品。為了簡化目標,可以選擇點擊作為最小可用產品的優化方向,因為點擊是所有事情發生的前提,且點擊率容易得到較好的優化效果。而在游戲運營方面,其目標主要是盡可能延長玩家停留的時間,并且吸引玩家付費,故提高用戶留存率便是重中之重。但由于留存率更多地由游戲本身的可玩性和玩家的興趣喜好決定,可干預性不高,所以留存率較難影響。盡管整體的留存率難干預,但游戲收入都是由極少數忠實玩家提供,這部分玩家可以用很強的運營策略進行干預。所以對于游戲而言,可將最小可用產品的優化目標定位在盡快鎖定游戲的高價值用戶,且鎖定時間要迅速。
機器學習MVP的關鍵步驟
在機器學習的項目中,數據決定效果的上限;建模、調參則是達到上限的過程。因此數據處理、建模、調參,是成功實現一個機器學習MVP至關重要的步驟。
以往,公司規模越大的企業獲取數據越麻煩,且在數據的使用時,若使用了錯誤的方式進行拼接,項目后期出現問題時,很難debug。所以在項目前期,需要控制項目風險和成本的前提下,盡量使用熟悉、好理解的數據。寧可犧牲一些效果,也要避免使用看似有吸引力,但風險更大的數據。
對于數據本身來說,數據的挑選、數據是否有預測性等,無需耗費過多的人力去考慮,針對此類工作目前已經有了很成熟的方法和工具,在不違背因果關系的前提下,我們盡可能地讓機器去自主完成,此外,真實的數據缺失是正常的,不缺失的數據可能才是有問題的,我們已經有很多方式來填充缺失值,或者把缺失本身也作為一個特征。其次,數據有離散的、連續的,比如預測一個游戲玩家是不是高價值用戶,那么數據可能有這個玩家已經消費的鉆石、金幣數量,可能有這個玩家的職業,甚至是玩家手機型號,這就要求數據處理中能同時處理這兩類特征。第四范式在這方面已經做了一些工作,先知平臺已經根據連續和離散的數據的計算特性做針對性的設計。
數據選定之后,便開始建模。其中,特征組合與調參是關鍵。在解決實際問題中,業界傾向于先使用簡單的邏輯回歸LR模型,為了模型具備更強的學習能力及表達能力,就需要使特征具備非線性的特性。特征組合便是一種常用且效果明顯的方法。換句話說,特征組合是一種加強特征描述能力,提升模型預測效果的方法。然而,想要獲得特征組合并非易事,需要數據科學家具備極強的機器學習知識儲備及業務理解能力。調參亦是如此。
事實上,特征組合與調參這類重復性較強且占用時間較多的工作可以用機器自動完成。在將數據科學家的經驗固化為產品之后,技術人員只需設定好用于組合的基礎特征,以及參數的類別、次數即可。目前,第四范式先知平臺(試用鏈接:https://prophet.4paradigm.com...)依靠自主研發的FeatureGo算法,實現了機器自動特征組合、自動調參的功能,解決了以往人為添加組合特征門檻高、耗時長等問題,大大節省了建模的時間。舉個例子,此前第四范式基于先知平臺打造了某新聞內容平臺的新聞推薦系統,從數據基礎開始構建,收集、分析、挖掘了新聞及用戶等各個維度的數據,再通過自動特征工程、自動調參等功能,只耗費2周時間就訓練出了特征維度數十億級別的模型。最終,該平臺推薦新聞的點擊率提高35%,顯著提升了用戶的使用體驗。
綜上所述,當定義好了問題的目標、邊界,利用現有的數據、人員,再配上一個專業的工具,一個機器學習業務改造系統的上線可以非常快速、有效。當機器學習技術真正產生了效果,客戶就知道下一步應該如何投入資源,以及應該投在什么地方。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19638.html
摘要:小企業遇上了大平臺即便是在人才濟濟的眾多華為云當中,劉源仍然相當搶眼,原因之一就是他看上去實在太年輕了。而在本次華為云開放日活動上,華為云對開發者的重視更是得到了進一步的體現。華為云MVP的使命在華為云攜手眾多合作伙伴打造的開發者生態中,活躍著這樣一群技術大咖的身影。這群技術大咖當中,既有優先體驗產品權益、反饋產品優化建議的產品體驗官;也有在公開活動中,分享技術經驗和實戰經驗的技術布道者;還...
摘要:那么,什么樣的機遇能夠帶來最好的結果如何確保能取得成功的結果呢英特爾為此提出了一套概念驗證的解決方案,并且詳細撰寫了一套白皮書,能夠幫助決策者回答這些問題,同時最大化價值,最小化風險。 showImg(http://upload-images.jianshu.io/upload_images/13825820-5ded473acf69a9d1.jpg?imageMogr2/auto-o...
摘要:針對這個問題,第四范式創始人首席執行官戴文淵近日就在公司內部分享上,向大家介紹了機器學習教材中的七個經典問題。所以今天我就想和大家分享一下機器學習教材中的一些經典問題,希望對大家今后的工作和學習有所幫助。 *如果希望了解機器學習,或者已經決定投身機器學習,你會第一時間找到各種教材進行充電,同時在心中默認:書里講的是牛人大神的畢生智慧,是正確無誤的行動指南,認真學習就能獲得快速提升。但實...
閱讀 1308·2019-08-30 15:44
閱讀 1979·2019-08-30 13:49
閱讀 1651·2019-08-26 13:54
閱讀 3484·2019-08-26 10:20
閱讀 3239·2019-08-23 17:18
閱讀 3294·2019-08-23 17:05
閱讀 2130·2019-08-23 15:38
閱讀 1012·2019-08-23 14:35