摘要:請原諒我以下所有截圖中都是使用的中文,有些地方翻譯略顯生硬。本來系統(tǒng)是使用的英文,奈何領(lǐng)導(dǎo)要求中文呀。時間字段的表示時間屬性必須勾選上一般會時間列默認勾選。可根據(jù)來排查問題所在,并且系統(tǒng)為用戶提供版的查詢工具來操作數(shù)據(jù)庫。
Superset簡介Superset是一個受Apache軟件基金會支持的處于孵化階段的企業(yè)級數(shù)據(jù)可視化web項目。具有以下特點:
內(nèi)含豐富的數(shù)據(jù)圖表樣式
支持多種數(shù)據(jù)源(Oracle、MySQL、Postgres, MariaDB等等)
提供易用的界面來自定義可視化數(shù)據(jù)
提供一個Web版SQL查詢工具
提供OpenID, LDAP, OAuth等多種認證方式,易于集成。
Superset的主要功能是將基礎(chǔ)數(shù)據(jù)以直觀的可視化圖表形式渲染出來。本文檔對數(shù)據(jù)源的配置、自定義可視化數(shù)據(jù)進行介紹。關(guān)于Superset的安裝不在本文探討范圍內(nèi),官方文檔中提供了基于docker的一鍵化安裝教程。
為了形象的表明Superset能做什么,最直接的方式就是放圖了。比如它能根據(jù)數(shù)據(jù)生成如下的圖表,只需要配置好了數(shù)據(jù)源,不需要編寫一行代碼便可生成可視化圖表。前端再也不用和Echart打交道,后端增刪改查小王子也不要寫代碼了。
當然這只是最基礎(chǔ)的,下面還有賊多炫酷的圖表,恐怖的讓人不禁瑟瑟發(fā)抖。本人目前公司才用到一些基本圖表,暫時感覺數(shù)據(jù)可視化方面還是挺滿足項目需求的。
數(shù)據(jù)源的配置
可視化數(shù)據(jù)的前提是必須有數(shù)據(jù)源為其提供基礎(chǔ)數(shù)據(jù)。本節(jié)介紹如何配置可靠的數(shù)據(jù)源。Superset支持多種數(shù)據(jù)庫充當數(shù)據(jù)源,如:Oracle、MySQL、Postgres, MariaDB等等。本節(jié)以O(shè)racle為例。
新增數(shù)據(jù)庫請原諒我以下所有截圖中都是使用的中文,有些地方翻譯略顯生硬。本來系統(tǒng)是使用的英文,奈何領(lǐng)導(dǎo)要求中文呀。
①點擊數(shù)據(jù)源選擇數(shù)據(jù)庫,進入頁面后點擊右上角綠色的+號新增一個數(shù)據(jù)庫
②填寫數(shù)據(jù)庫配置相關(guān)信息,點擊測試連接,出現(xiàn)seems OK!表明數(shù)據(jù)庫連接成功。
注:勾選“在SQL工具中公開”選項則表明允許在Superset提供的SQL查詢工具中對該數(shù)據(jù)庫進行操作,按需勾選。
新增數(shù)據(jù)表①點擊數(shù)據(jù)源選擇數(shù)據(jù)表,進入頁面后點擊右上角的+號新增一個數(shù)據(jù)表
②下拉選擇剛剛配置的數(shù)據(jù)庫,并填寫數(shù)據(jù)庫中存在的某個表名,點擊保存
③點擊編輯表,在列列表中頁面中為每個列勾選后續(xù)數(shù)據(jù)分析時會使用到的一些屬性,
注:可分組和可過濾按需勾選,表示在后續(xù)分析數(shù)據(jù)時是否支持根據(jù)該列進行分組和過濾。時間字段的表示時間屬性必須勾選上(一般Superset會時間列默認勾選)。
經(jīng)過上述操作,我們便為后續(xù)的數(shù)據(jù)可視化操作提供了一個數(shù)據(jù)表充當數(shù)據(jù)源。
新增看板數(shù)據(jù)源配置好后我們還需要新增一個看板用來保存我們之后生成的可視化圖表。你可以把看板理解成一個文件夾,用來存儲一系列相關(guān)的圖表
①點擊看板,進入頁面后點擊右上角的+號新增一個看板
②填寫看板名并選擇所屬者,點擊保存
完成上述操作后,我們便在系統(tǒng)內(nèi)新增了一個“景區(qū)指標”看板來存儲后續(xù)生成的可視化圖表。
自定義可視化圖表現(xiàn)在所有準備工作都已經(jīng)完成,可以正式開始生成可視化圖表。為了事情的發(fā)展順利,先給出上一節(jié)中新增數(shù)據(jù)表的結(jié)構(gòu)信息:
仔細觀察上表的字段,該表的每條記錄表示某個景區(qū)某天某種出行方式出行的游客總?cè)藬?shù)。我們假設(shè)本次數(shù)據(jù)可視化的任務(wù)是將景區(qū)編號為201_1的景區(qū)前一周游客的出行方式渲染成可視化圖表。
配置可視化圖表
注意:盡管Superset提供了一個易用的配置界面來配置可視化圖表,但可能還是需要用戶在一定程度上熟悉簡單的SQL語法。所以,如果你不熟悉SQL語法,那么下面的內(nèi)容對你來說可能會略顯吃力。
①選擇需要分析的數(shù)據(jù)表
②配置圖表(以餅圖為例) 點擊數(shù)據(jù)表后進入配置頁面。注意,我們的目的是:將景區(qū)編號為201_1的景區(qū)前一周游客的出行方式渲染成可視化圖表。 按如下步驟自定義配置參數(shù): 步驟一:選擇圖表類型為餅圖
步驟二:篩選前一周數(shù)據(jù)
步驟三:篩選景區(qū)編號為201_1的數(shù)據(jù)
步驟四:設(shè)置分組條件,此處根據(jù)出行方式進行分組
步驟五:配置分析的指標,此處為游客人數(shù)。(sum表示對每個分組的人數(shù)求和)
步驟六:設(shè)置行限制,此處可留空,如果說僅需顯示出行方式排行前10的數(shù)據(jù)則可將行限制設(shè)置為10
步驟7:點擊左上角運行查詢按鈕,查看數(shù)據(jù)渲染結(jié)果
保存可視化圖表
通過上述步驟現(xiàn)在已經(jīng)配置好了一個可視化圖表。我們可以將其持久化保存。如圖:將圖表配置保存并將生成的可視化圖表保存到第一步配置的“景區(qū)指標”看板中。
查看生成的可視化圖表
點擊這兩個條目可查看剛剛保存的圖表配置和生成的可視化圖表。
常見問題
通過上述的幾節(jié)已經(jīng)完整的介紹了Superset配置可視化圖表的操作步驟,本節(jié)列出一些困擾使用者的常見問題:
Q1:指標可以是某個字段名而非聚集函數(shù)嗎?
A:這個具體由不同的圖表類型決定,一般來說都是聚集函數(shù)。
Q2:允許多個表的聯(lián)合查詢嗎?
A:Superset不能直接使用聯(lián)合查詢,只能從單個表查找數(shù)據(jù)。但是它提供的視圖的概念,可以編寫視圖SQL,最終在視圖上執(zhí)行單表查詢操作。視圖的配置見下圖:
1、點擊編輯表
2、編寫SQL語句,以SQL的結(jié)果集作為視圖。
Q3:如何校驗數(shù)據(jù)的正誤?
A:Superset提供的數(shù)據(jù)分析是建立在SQL基礎(chǔ)上的,在配置可視化圖表階段,點擊右上方的列表按鈕,可以查看到查詢執(zhí)行的實際SQL以及返回的原始數(shù)據(jù)結(jié)果。通過查看SQL和結(jié)果集來校驗正誤。
Q4:為何配置圖表后點擊運行查詢無反應(yīng)"); 此種情況說明系統(tǒng)根據(jù)你的配置生成的查詢SQL有問題。可根據(jù)Q3來排查問題所在,并且系統(tǒng)為用戶提供Web版的SQL查詢工具來操作數(shù)據(jù)庫。
常見圖表類型配置上文中以餅圖為例展示了可視化圖表的配置,本節(jié)給出常見的柱狀圖以及時間折線圖的配置方法。Superset允許眾多的圖表類型,其余類型需要用戶自己去嘗試。 由于篇幅問題,僅給出配置,詳細步驟略去。
柱狀圖目的:渲染201_1景區(qū)前一天的游客出行方式
時間折線圖
目的:渲染201_1景區(qū)游客每種出行方式不同日期的對比
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/7388.html
摘要:概述我非常認同前百度數(shù)據(jù)工程師現(xiàn)神策分析創(chuàng)始人桑老師最近談到的數(shù)據(jù)分析三重境界統(tǒng)計計數(shù)多維分析機器學(xué)習(xí)數(shù)據(jù)分析的統(tǒng)計計數(shù)和多維分析,我們通常稱之為數(shù)據(jù)探索式分析,這個步驟旨在了解數(shù)據(jù)的特性,有助于我們進一步挖掘數(shù)據(jù)的價值。 showImg(https://camo.githubusercontent.com/f98421e503a81176b003ddd310d97e1e1214625...
摘要:安裝遠程主機強迫關(guān)閉了一個現(xiàn)有的連接。安裝包測試連接參考數(shù)據(jù)可視化平臺使用心得一小時建立數(shù)據(jù)分析平臺 安裝 pip superset curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py python get-pip.py λ pip install superset Collecting superset Download...
閱讀 1436·2021-09-22 16:04
閱讀 2800·2019-08-30 15:44
閱讀 888·2019-08-30 15:43
閱讀 766·2019-08-29 15:24
閱讀 1845·2019-08-29 14:07
閱讀 1134·2019-08-29 12:30
閱讀 1729·2019-08-29 11:15
閱讀 2741·2019-08-28 18:08