摘要:核心優勢實時性可以實時進行數據質量檢測,能夠及時發現問題。可伸縮性工作在大數據量的環境中,目前運行的數據量約環境。自助服務提供了一個簡單的用戶界面,可以創建數據集以及相應規則同時用戶可以查看數據質量控制面板和自定義顯示內容歡迎,多多益善
Bark是eBay開發的一種應用于分布式數據系統中的開源數據質量解決方案,例如在Hadoop, Spark, Storm等分布式系統中,Bark提供了一整套統一的流程來定義、測量數據集的質量并及時報告問題。
主要特性:
1.精確度檢測:驗證結果集數據是否與源數據是一致的
2.數據剖析:利用數據集的一致性、獨特性和邏輯性,來進行統計分析和數值評估。
3.異常監測:利用預先設定的算法,檢測出不符合預期的數據
4.可視化監測:利用控制面板來展現數據質量的狀態。
核心優勢:
1.實時性:可以實時進行數據質量檢測,能夠及時發現問題。
2.可擴展性:可以用于多個數據系統。
3.可伸縮性:工作在大數據量的環境中,目前運行的數據量約1.2PB (eBay環境)。
4.自助服務:Bark提供了一個簡單的用戶界面,可以創建數據集以及相應規則;同時用戶可以查看數據質量控制面板和自定義顯示內容
GitHub: https://github.com/eBay/griffin 歡迎fork,多多益善!
Contact us: lzhixing@ebay.com
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/80273.html
摘要:如今年已過大半,雖然沒有大理想抱負,但是卻有自己的小計劃。項目案例項目一支付服務簡介支付服務支付寶微信銀聯詳細代碼案例,目前已經。這個是自月以來最上心的一個項目,盡管只是一個案例,但是從中也學到了不少知識。 showImg(https://blog.52itstyle.vip/usr/uploads/2018/08/2263751128.jpg); 前言 2017年,曾在自己的博客中寫...
摘要:項目地址前言大數據技術棧思維導圖大數據常用軟件安裝指南一分布式文件存儲系統分布式計算框架集群資源管理器單機偽集群環境搭建集群環境搭建常用命令的使用基于搭建高可用集群二簡介及核心概念環境下的安裝部署和命令行的基本使用常用操作分區表和分桶表視圖 項目GitHub地址:https://github.com/heibaiying... 前 言 大數據技術棧思維導圖 大數據常用軟件安裝指...
摘要:項目是什么是對的接口使用的最新標準進行而面向對象的封裝,從而屏蔽了底層的接口復雜性,加快開發擴展的效率。國內同類型的項目推薦目前國內有一個跟比較類似的項目,這個項目是項目作者開發,值得推薦。項目名字項目的地址是大家有興趣可以研究。 項目Logo showImg(https://segmentfault.com/img/bVVtW8?w=716&h=218); zendAPI 是什么? ...
摘要:簡介這是一個的排版顯示引擎和跨平臺的應用程序開發框架,基于,這也是第一個在移動端融合的前端項目,至此成為了真正意義上前后端通吃的語言。的目標在此基礎上開發應用程序可擁有開發應用般簡單與速度同時兼顧應用程序的性能與體驗。 Ngui簡介 這是一個GUI的排版顯示引擎和跨平臺的GUI應用程序開發框架,基于NodeJS/OpenGL,這也是第一個在移動端Android/iOS融合NodeJS的...
閱讀 2162·2023-04-26 00:43
閱讀 2680·2021-11-22 15:22
閱讀 3809·2021-11-11 16:55
閱讀 967·2021-11-04 16:06
閱讀 1783·2019-08-30 14:12
閱讀 994·2019-08-30 14:02
閱讀 3366·2019-08-29 17:05
閱讀 1415·2019-08-29 12:27