摘要:如何識別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時間序列數(shù)據(jù)中檢測到與預(yù)期行為有偏差的數(shù)據(jù)對于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動意味著異常。
“今天我們見證了數(shù)據(jù)的爆炸式增長:社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)據(jù)。然而, 在大多數(shù)情況下,這些數(shù)據(jù)告訴了我們用戶行為的常見模式。 數(shù)據(jù)的異常變化可能是我們系統(tǒng)中的故障或用戶流失的“癥結(jié)”所在。
如何識別數(shù)據(jù)海洋中的“暗礁”是用戶行為異常行為分析所要探討的問題。
▼
▍什么是異常檢測?
異常檢測是在數(shù)據(jù)中找到不符合“正常”的行為模式的過程。在時間序列數(shù)據(jù)中檢測到與預(yù)期行為有偏差的數(shù)據(jù)對于確保系統(tǒng)的正常運(yùn)行非常重要。
一般來說,異??梢苑殖蓛煞N:
▍全局異常/局部異常
局部異常
很多時候我們可以看到數(shù)據(jù)的潛在趨勢,看起來像一個“波浪”:早上的活動不足,白天很高,晚上很低。 局部異常發(fā)生在這種情況下。 例如:晚上的高活動意味著異常。
全局異常
這是我們最熟悉的那種異常現(xiàn)象。 這是一個隨機(jī)出現(xiàn)在平常時間的異?,F(xiàn)象。 一般使用95%分位數(shù)就可以檢測到。
▍異常檢測方法
我們使用歷史數(shù)據(jù)來構(gòu)建由每個被監(jiān)測的數(shù)據(jù)的估計(jì)值。將實(shí)時數(shù)據(jù)與這些值進(jìn)行比較,并分配一個分?jǐn)?shù)。
基于從最近的數(shù)據(jù)觀察得到的閾值,決定實(shí)時數(shù)據(jù)是否為異常。這種方法的優(yōu)點(diǎn)是閾值不是靜態(tài)的,而是實(shí)時的。
檢測場景:
tecdat的解決方案從收集網(wǎng)站的行為數(shù)據(jù)開始。衡量趨勢的三個主要組成部分,即固定趨勢、周期趨勢和季節(jié)性數(shù)據(jù),分別進(jìn)行了總結(jié),該算法查找到數(shù)據(jù)中的異常,向用戶發(fā)送自動實(shí)時警報(bào)。
通過實(shí)時的異常數(shù)據(jù)監(jiān)測,我們可以清楚地看到網(wǎng)站流量的差異,在發(fā)生異常狀況時迅速進(jìn)行故障排除和修復(fù),減少網(wǎng)站停機(jī),減少潛在客戶的流失。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/112545.html
摘要:如何識別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時間序列數(shù)據(jù)中檢測到與預(yù)期行為有偏差的數(shù)據(jù)對于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動意味著異常。 showImg(https://segmentfault.com/img/bVUlDV?w=993&h=526);今天我們見證了數(shù)據(jù)的爆炸式增長:社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)...
摘要:如何識別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時間序列數(shù)據(jù)中檢測到與預(yù)期行為有偏差的數(shù)據(jù)對于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動意味著異常。 showImg(https://segmentfault.com/img/bVUlDV?w=993&h=526);今天我們見證了數(shù)據(jù)的爆炸式增長:社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)...
摘要:基于以上背景,研究人員對年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測模型,識別出流失概率很高的客戶群體,同時找出哪些用戶特征對用戶流失會有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會訂閱多個電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠度成為...
摘要:基于以上背景,研究人員對年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測模型,識別出流失概率很高的客戶群體,同時找出哪些用戶特征對用戶流失會有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會訂閱多個電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠度成為...
閱讀 2323·2021-10-08 10:04
閱讀 1097·2021-09-03 10:40
閱讀 1150·2019-08-30 15:53
閱讀 3309·2019-08-30 13:13
閱讀 2925·2019-08-30 12:55
閱讀 2278·2019-08-29 13:21
閱讀 1329·2019-08-26 12:12
閱讀 2755·2019-08-26 10:37