国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

面向電信行業存量用戶的智能套餐個性化匹配模型(top6)

RyanHoo / 1465人閱讀

摘要:賽題鏈接面向電信行業存量用戶的智能套餐個性化匹配模型賽題任務利用已有的用戶屬性如個人基本信息用戶畫像信息等終端屬性如終端品牌等業務屬性消費習慣及偏好匹配用戶最合適的套餐,對用戶進行推送,完成后續個性化服務。四個月的費用分別進行。

1、賽題鏈接:面向電信行業存量用戶的智能套餐個性化匹配模型

2、賽題任務: 利用已有的用戶屬性(如個人基本信息、用戶畫像信息等)、終端屬性(如終端品牌等)、業務屬性、消費習慣及偏好匹配用戶最合適的套餐,對用戶進行推送,完成后續個性化服務。

3、數據解讀及預處理:

多分類任務-->11分類;根據service_type來劃分套餐 ,一類8個,另外一類3個(下文圖片里面的大寶卡以及騰訊王卡系列)。

11個套餐表所對應的卡,通過對1_total_fee進行value_counts和網上套餐比較可以大致推出來。

數據預處理---->清洗數據以及對1234_total_fee進行類似3sigma的進行標記。

4、特征工程:

對1-2-3-4_total_fee進行min ,max ,std ,mean等操作;最后發現四個月話費的最小值是比較強的特征,從EDA來看對套餐區分是比較明顯的。

本月流量以及上個月流量的差值特征;并且發現某些用戶上個月的流量是一個完整的數值,比方說1024,2048,3072這種數值,對這種用戶進行了簡單的標記。

用當月費用減去超出通話時長的錢。1_total_fee - (service1_caller_time)*0.15

計算每個用戶的基本費用(base_fee)

判斷四個月的話費是否是一個整數。比方說套餐36的用戶如果賬單里面出現了36和36.0的話,那么后者36.0可能是其他base_fee通過開加油包等超出套餐費用疊加上來的。

四個月的費用分別groupby("complaint_fee")進行count。

5、搭建模型:

模型: 十折的lightgbm模型 + 五折的xgboost模型

xgboost實在是太慢了,沒有GPU加成的話貌似要跑差不多一個白天,但是用上GPU精度就降低了。

6、模型融合: 通過林有夕大神分享的投票代碼進行融合,有一點收益但是不大。

7、處理:

我們隊伍是失敗了,大概思路就是對模型分不開的兩個套餐加一個權重。決賽隊伍應該都是有分享的。

還有就是植物之前ijcai2018所用過的"食之無味,棄之可惜",惜的是我們也失敗了。


最后附上我們隊的github鏈接(記得點個星星哦~)

開源代碼地址:2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6

這個比賽第一名,第二名,第四名貌似都有開源,還有砍手豪大佬對植物嫁接的進一步深入在知乎上都有文章,可以進行參考。

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/43538.html

相關文章

  • 當你和天貓精靈對話時,它在想什么?阿里智能對話技術深度解讀

    摘要:目前資訊播報時區限行歷史上的今天單位換算油價日歷等技能天貓精靈上線技能觸發率,準確率即對話管理,是對話系統的關鍵部分,負責維護對話上下文,管理對話流程,保持對話過程的流暢。 術語對齊 TaskBot引擎: 核心處理對象是技能,我們把技能定義成結構化(query+content)、垂直場景化的任務,比如實時場景查詢、工具類、控制類等QABot引擎: 包括KG-QA引擎、QAPair引擎、...

    時飛 評論0 收藏0
  • 當你和天貓精靈對話時,它在想什么?阿里智能對話技術深度解讀

    摘要:目前資訊播報時區限行歷史上的今天單位換算油價日歷等技能天貓精靈上線技能觸發率,準確率即對話管理,是對話系統的關鍵部分,負責維護對話上下文,管理對話流程,保持對話過程的流暢。 術語對齊 TaskBot引擎: 核心處理對象是技能,我們把技能定義成結構化(query+content)、垂直場景化的任務,比如實時場景查詢、工具類、控制類等QABot引擎: 包括KG-QA引擎、QAPair引擎、...

    孫淑建 評論0 收藏0
  • 中金易云:為出版社找到下一本《解憂雜貨店》

    摘要:中金易云出版發行大數據平臺正是以數字化轉型為核心思路,以大數據中臺與智能算法為基礎的出版業供給側結構性改革的成果。 摘要: 以供給側結構性改革的角度來看,出版社即是最直接的供給側,出版高質量、暢銷度高的圖書,建立出產高質量圖書及圖書IP的體系,即是提高供給體系質量。中金易云出版發行大數據平臺正是以數字化轉型為核心思路,以大數據中臺與智能算法為基礎的出版業供給側結構性改革的成果。 201...

    番茄西紅柿 評論0 收藏0
  • 漫談邊緣計算 (二):各懷心事玩家

    摘要:對于這類企業來說,邊緣計算是從云計算中心層層向外推出去的,成長路徑是自頂向下,由內而外。這是云計算公司力推邊緣計算的商業邏輯。相對于其他玩家,電信運營商擁有的資源優勢和基礎布局,在邊緣計算的競爭中贏在了起跑線上。前一篇文章(漫談邊緣計算(一):邊緣計算是大勢所趨)提到我對邊緣計算的理解,認為邊緣計算是在一定程度上彌補傳統云計算的不足,相對于傳統的全集中模式的云計算中心,邊緣計算節點可以在現場...

    SexySix 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<