摘要:可以看到,遙遙領先的城市有三個,加州是銷售之王。將再拖拽到,并右鍵將其粒度改為月。從上圖可以看到,指定了個分類,最右上角加州就是最突出的一組,整個聚類只有它一個元素,而畫面偏左下角的也是一類,這些是業績較差的一組數據。
1. 引言
引用著名瑞典統計學家 Hans Rosling 的一句話:想法來源于數字、信息,再到理解。
分析數據的最好方式是可視化,因為可視化承載的信息密度更高,甚至可以從不同維護對數據進行交互式分析。今天要精讀的文章就分析了經典可視化分析工具 Tableau:data-visualisation-made-easy。
2. 精讀Tableau 是一款廣泛用于智能商業的強大數據分析工具,通過不同可交互的圖表和儀表盤幫助你獲得業務洞見。
安裝Tableau 提供了三種使用方式:
Tableau Desktop
擁有 14 天免費試用的桌面版,可以將工作數據存儲在計算機本地,如果你是學生或老師可以獲得一年的免費使用權。
Tableau Public
公開版完全免費,和桌面版的唯一區別是,所有數據都無法保存在本地,只能保存在 Tableau 服務器的云端,而且是公開的。
Tableau Online
網頁版也完全免費,是 Tableau Public 的網頁版。
連接數據源安裝好 Tableau 后,第一步就是連接數據源。它支持連接本地或云端的數據源,本地最常用的數據源可以從 Excel 轉換。這里是一份 樣例數據,包含了一個超市幾年內的銷售情況,我們可以用這份數據練手。
下載好這份數據后,選擇從 Excel 導入,確認后將 Orders 表拖拽到右側區域,如下圖所示:
可以看到表結構已經正常了,在數據清洗的過程中,Tableau 強大的數據分析功能已經初見端倪。你甚至可以點擊 Review ths results 看看它是如何清洗數據的:點擊后會下載一份分析 Excel,其中過濾掉的數據會被標記,自動分析出的表結構會被高亮。
數據可視化在頁面最底部有幾個切換項,依次是 Data Source:數據源、Sheet:工作簿,后面跟隨的三個按鈕可以繼續創建多個 Sheet、Dashboard、Story,這些后面都會講到。首先點擊 Sheet 進入可視化分析的工作簿:
可以看到,總利潤大概是總銷量的 10%。如果想展示橫向表格,將 Measure Names 從 Rows 拖拽到 Columns 即可。
Tips: 為了方便區分,Tableau 貼心的將維度標記為藍色,度量標記為綠色。
同時可以看到,Tableau 對于單指標拖拽,默認采取表格方式渲染。
接下來我們要看每一年的詳細銷量與利潤:
將 Order Date 與 Sales 拖拽到 Rows。
右鍵 Sales,將類型從連續改成非連續,這樣就會自動變成表格展示。
為了展示利潤,將 Profit 字段拖拽到 Marks 的 Text 字段上。
我們可以看到,銷量較高的月份分布在:3、9、11、12 月。注意由于沒有對年份做篩選,這里的每月統計數據是整合了 2013~2016 四年份的。也就是 1 月的數據其實代表了 2013.1 + 2014.1 + 2015.1 + 2016.1 共四個 1 月份數據的總和。
接下來我們想了解銷量與利潤增長的趨勢:
將 Order Date 拖拽到 Columns。
將 Sales 拖拽到 Rows,此時會出現一條線。接下來將 Profit 拖拽到 左 Y 軸。
上圖可以明顯看到三個峰值出現在 3、9、11 月份,然而這段期間利潤增長幅度卻不大,可以看出這段期間采取了薄利多銷的手段。
再從地區維度分析數據:
將 Regions 和 Sales 拖拽到 Columns。
切換到餅圖。
將 Sales 拖拽到 Marks Pane 的 Label 上。
可以看到數值越大的區域一般顏色也越深,但這不是分析利潤/銷量性價比的最佳方式,我們先只看到加州和紐約是銷售業績最好的區域,而科羅拉多州雖然銷量不錯,但利潤卻是負的。
上面的地圖對地形比較直觀,但要分析銷售健康度,還是用散點圖更合適。我們想看看城市銷量/利潤的健康度分布:
Profit 拖拽到 Columns,Sales 拖拽到 Rows,此時散點圖出現,但只有一個點(之所以出現散點圖,是因為橫縱軸拖拽的都是度量)。
我們想按城市下鉆,只要把 State 拖拽到 Detail 即可。
可以看到,辦公套件和科技產品業績最好,其中辦公套件在 2015 年 12 月銷量利潤雙豐收,科技產品在 2015 年 10 月與 2016 年 3 月銷量利潤雙豐收。整體來看前半年是淡季。
但這張圖無法看到銷量與利潤性價比關系,我們要找出利潤率最高的商品和利潤率最低的商品:
將 Proft 拖拽到 Columns。
將 Sub-Category 拖拽到 Rows。
切換到 Horizontal Bars。
將銷量 Sales 拖拽到 Color。
Tablueau 這種交互等價于 Sql 中 in 語句,當然 Tablueau 還支持更復雜的條件或代碼表達式,這里只是將更友好的篩選方式優先展示區來。
上卷下鉆Tableau 支持任意維度之間的上卷下鉆,只要你將他們分好組。
比如將 Order Date、Order ID、Ship Date、Ship Mode 拖拽到一起,成為 Orders 組;將 Category、Sub-Category、Product ID Product Name 形成 Product 組:
上卷下鉆是順序相關的,比如 Product - Order Date 表示在產品類目基礎上,對每個類目按日期下鉆。而 Order Date - Product 這個順序,表示在日期分布的基礎上,對日期按產品類目下鉆,了解不同日期下每個產品的分布情況。
趨勢線為使用趨勢線,先制作一個雙軸圖:
將 Sales 與 Profit 拖拽到 Rows。
將 Order Date 拖拽到 Columns 并切換到月維度。
選擇 Show Me 的 Dual Combination 即混合圖。
趨勢圖有幾種算法,比如線性,Log 或指數,因此在做趨勢分析前,首先要判斷自己的業務屬于哪種增長階段,如果是爆發期可以選擇指數,平穩期可以選擇線性等等。
預測回到按月分布的圖表,如果我們想預測未來銷量和利潤的走勢,可以使用預測功能:
切換到 Analytics Tab,并將 Forecast 拖拽到圖表中。
可以點擊右鍵配置預測參數。
從上圖可以看到,指定了 4 個分類,最右上角加州就是最突出的一組,整個聚類只有它一個元素,而畫面偏左下角的也是一類,這些是業績較差的一組數據。使用了 K 均值聚類算法,并且當你點擊右鍵查看詳細星系時,還能把組間、組內方差展示出來:
Tableau 的所有圖表都支持點選,排除等操作,那么點選這類操作本質上其實是個篩選的過程,比如柱狀圖點擊了某根柱子,可以認為是選擇了這根柱子當前的維度值作為篩選條件。
當一個 Sheet 作為篩選條件后,類似點選這種操作產生的篩選就會作用于其他同數據集的圖表,因此如上圖所示,當點擊了條形圖的某一根柱子時,上面的銷量地圖也自動做了篩選,僅展示當前選中的產品的銷量分布。
故事Story 更像是 PPT,將分析后有價值或有意義的圖表組合在一起,再配合上說明,得出一些結論:
版權聲明:自由轉載-非商用-非衍生-保持署名(創意共享 3.0 許可證)
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/106665.html
摘要:比如我們對調與會怎樣我們得到了三個不同類目近個月的趨勢,之所以是折線圖,因為圖表的維度軸列是連續的。在正式介紹標記區域前,先理解一下為何會發生這種轉變表格類組件是雙維度組件,折線圖是單維度組件。 1. 引言 Tableau 探索式分析功能非常強大,各種功能組合似乎有著無限的可能性。 今天筆者會分析這種探索式模型解題思路,一起看看這種探索式分析功能是如何做到的。 2. 精讀 要掌握探索式...
摘要:精讀前端可以從多個角度理解,比如規范框架語言社區場景以及整條研發鏈路。同是前端未來展望,不同的文章側重的格局不同,兩個標題相同的文章內容可能大相徑庭。作為使用者,現在和未來的主流可能都是微軟系,畢竟微軟在操作系統方面人才儲備和經驗積累很多。 1. 引言 前端展望的文章越來越不好寫了,隨著前端發展的深入,需要擁有非常寬廣的視野與格局才能看清前端的未來。 筆者根據自身經驗,結合下面幾篇文章...
摘要:雖然正則中可以匹配任何字符,但卻無法匹配換行符。精讀文中列舉的四個新特性是加入到正則中的。討論地址是精讀正則如果你想參與討論,請點擊這里,每周都有新的主題,周末或周一發布。 1. 引言 本周精讀的文章是 regexp-features-regular-expressions。 這篇文章介紹了 ES2018 正則支持的幾個重要特性: Lookbehind assertions - 后行...
摘要:可以將耗時任務拆解出去,降低主線程的壓力,避免主線程無響應。主線程接收發消息每個實例通過接收消息,通過發送消息。收發主線程消息和主線程代碼類似,在代碼中,也是接收消息,這個消息來自主線程或者其它。 1 引言 本周精讀的文章是 speedy-introduction-to-web-workers,是一篇 Web Workers 快速入門的文章,借精讀這篇文章的機會,談談對 Web Wor...
閱讀 3694·2021-11-11 10:58
閱讀 2476·2021-09-22 15:43
閱讀 2867·2019-08-30 15:44
閱讀 2186·2019-08-30 13:08
閱讀 1821·2019-08-29 17:28
閱讀 884·2019-08-29 10:54
閱讀 674·2019-08-26 11:46
閱讀 3506·2019-08-26 11:43