摘要:事故預測需要獲取有意義和可靠的信息,大量原始信息流必須在危機期間進行分析和處理。時間維度事故分析通過時間維度日期和時間的事故分析,我們可以洞察到不同類型的事故發生的高峰時間和高發月份,從而進行有效預防。結果模型預測精度精度達到。
“
原文鏈接
針對當前生產和生活中面臨的安全事故問題,利用當前發展迅速的DM(Data Mining)技術,通過對事故信息的多維度分析,實現監測系統的事故預測,提高了監測系統的性能,形成安全預警機制。
▼
事故預測需要獲取有意義和可靠的信息,大量原始信息流必須在危機期間進行分析和處理。
基于以上背景,tecdat研究人員重點關注事故情報數據的收集并分析相關信息,通過對時間、地點、語義等不同維度的分析得到有價值的信息,并且嘗試通過機器學習方法對事故發生進行預測。
▍時間維度事故分析
通過時間維度(日期和時間)的事故分析,我們可以洞察到不同類型的事故發生的高峰時間和高發月份,從而進行有效預防。
通過對結果的可視化,可以發現不同時間和月份的事故發生率有一定的差異,因此在后續的預測模型中可以構建相應的時間偽變量從而提高精度。
▍不同事故類型
通過對所有事故數據類型的占比分析,我們可以發現出行的事故發生率是最高的,也遠遠高于其他類型,其次是觸電事故等。(注:部分事故重屬多個類型)
▍事故報告語義分析
通過對事故報告的語義分析,我們可以發現報告中頻繁出現的關鍵詞,從中洞察到某類事故發生后通常會關聯到哪些關鍵詞,分析其背后的原因,從而進行有效的預防。
▍安全事故預測模型
在獲得事故的不同維度基本特征之后,我們通過SVM算法使用這些特征來預測不同類型的事故發生的可能性,采取有針對性的措施,避免未知事故發生帶來的損失,達到補救的效果。
▍技術
SVM(Support Vector Machine)用于構建、驗證和測試數據集的模型。
在Spark / MLLib / Scikit-Learn / HDFS中重構實現處理較大的數據集。
▍結果
模型預測精度精度達到82.5%。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/91952.html
摘要:事故預測需要獲取有意義和可靠的信息,大量原始信息流必須在危機期間進行分析和處理。時間維度事故分析通過時間維度日期和時間的事故分析,我們可以洞察到不同類型的事故發生的高峰時間和高發月份,從而進行有效預防。結果模型預測精度精度達到。 showImg(https://segmentfault.com/img/bVVkhf?w=829&h=431); 原文鏈接 針對當前生產和生活中面臨的安全...
摘要:事故預測需要獲取有意義和可靠的信息,大量原始信息流必須在危機期間進行分析和處理。時間維度事故分析通過時間維度日期和時間的事故分析,我們可以洞察到不同類型的事故發生的高峰時間和高發月份,從而進行有效預防。結果模型預測精度精度達到。 showImg(https://segmentfault.com/img/bVVkhf?w=829&h=431); 原文鏈接 針對當前生產和生活中面臨的安全...
摘要:基于以上背景,研究人員對年至今的電信用戶流失數據進行分析,并建立預測模型,識別出流失概率很高的客戶群體,同時找出哪些用戶特征對用戶流失會有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費者今天會訂閱多個電信服務(電視、付費節目、游戲等)。然而電信供應商提供的服務的差異化程度不高,客戶忠誠度成為...
摘要:基于以上背景,研究人員對年至今的電信用戶流失數據進行分析,并建立預測模型,識別出流失概率很高的客戶群體,同時找出哪些用戶特征對用戶流失會有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費者今天會訂閱多個電信服務(電視、付費節目、游戲等)。然而電信供應商提供的服務的差異化程度不高,客戶忠誠度成為...
閱讀 1296·2021-11-22 09:34
閱讀 2160·2021-10-08 10:18
閱讀 1723·2021-09-29 09:35
閱讀 2452·2019-08-29 17:20
閱讀 2136·2019-08-29 15:36
閱讀 3397·2019-08-29 13:52
閱讀 774·2019-08-29 12:29
閱讀 1182·2019-08-28 18:10