摘要:讓我們看看都做了哪些工作可視化分析增強數據可操作性測試平臺的表格和置信區間可視化可視化分析主要都是由抽象數據可視化組成的。大多數有效的可視化分析在這種情況下都是關于報告儀表盤實時分析的圖標和網絡圖。
概述
在2015年初,我們在Uber規劃了一個官方的數據科學團隊。這個主意的緣起是:通過可視化數據探索工具從Uber的數據中發現洞見。每天,Uber 管理上億級別的GPS位置信息。每分鐘,我們的平臺處理上百萬的移動事件。每次我們不用技術分析就直觀地知道這是一個我們錯過了解我們業務的好機會。
自成立以來,這個數據可視化團隊就不斷發展壯大,從我和另外一個工程師兩個人發展到了現在的15人的全棧團隊。數據可視化技術專家囊括了從計算機圖形學到信息設計、封面創意技術以及 Web 平臺開發。我們團隊專注于從視覺分析到地圖繪制以及從框架開發到面向公眾的數據可視化的整個過程。
讓我們看看都做了哪些工作:
可視化分析:增強數據可操作性AB測試平臺的表格和置信區間可視化
可視化分析主要都是由抽象數據可視化組成的。這個涉及到可視化工作的數據是沒有內在的地理結構。與之相反的是科學可視化,這種可視化從物理世界(地圖、3D物理結構等等)的角度描述了數據。大多數有效的可視化分析在這種情況下都是關于報告、儀表盤、實時分析的圖標和網絡圖。我們的團隊在大多數商業洞見應用和商業數據探索上加強了可視化圖層。其他地區的同事用我們的可視化工具加強了包括我們的AB測試平臺和內部的大規模機器學習平臺的可視化效果。
我們團隊強調建設像我們創建這個應用類似的可復用組件。我們最近開源了react-vis,這是一個 React 和加強版的D3 可視化庫,它提供了 基于JSX的語法,專用的語言來組織圖表的坐標、圖標類型以及其他一些可視化元素。它支持開發人員以聲明的方式在他們的數據集用 React- 和 JSX-友好型的形式來塑造他們想的可視化效果。
在地圖繪制上我們也在做類似的工作。
地圖繪制:大數據探索基于地圖的信息是我們在Uber最大最豐富的資產。然而,一方面,每天我們的平臺實時采集上億的GPS點。另一方面,我們必須在瀏覽器內實現數據密集可視化。這些都對實時地圖可視化作出了極大挑戰。
在給定半徑區域內拖動鼠標將可以實時看到Uber的目的地分布情況
我們為不同顧客量身定制多種地圖應用。其中一類顧客是在Uber運營的400多個城市內的總經理和城市運營團隊。這個普通人需要有一個當前供求分布的及時信息。他們也需要獲取聚合數據來理解城市的市場以便于進一步的策劃市場營銷活動。另一類用戶是數據科學團隊,他們需要豐富的數據探索界面來操作多維數據(通過產品、時間、地理數據來向下鉆取)。我們為其他團隊構建可以分塊和切片的應用以便于從數據中獲得洞見。
對于這些應用,我們的技術棧是由一些我們之前開發并且開源的庫構成的。react-map-gl 提供一個在MapboxGL基礎上與React類似的圖層。這個MapboxGL是一個我們在Uber廣泛使用的從Mapbox引入的庫。deck.gl提供了一個創建WebGL增強圖層的應用,它可以放在地圖的最上層或者獨自用來創建一個抽象的數據可視層。
deck.gl 和 react-map-gl 提供了 WebGL 界面來創建數據密集型的地圖應用
但是所有這些技術都可以以一種創造性的方式被運用。數據可視化最重要的部分其實是數據故事敘述和數據藝術化呈現。
面向公眾:講述數據故事用數據可視化講述Uber的故事的方法有很多種。我們可以圍繞諸如安全、效率、流量、政策等話題在大眾傳播網絡中展開可視化敘述。
最近,我們開始了一個探索uberPool是如何讓城市交通變得更高效的數據可視化項目。在 Travis Kalanick 的TED演講之后,你將看到我們制作的數據可視化顯示每個沒有使用uberPOOL的街區流量情況,這表明了 POOL可以通過減少流量讓城市變得更加智能化。
左圖: SF 在沒有uberPOOL時交通擁堵的城區。右圖:POOL用一種聰明的辦法均衡了交通流量。
我們繼續做一起其他的可視化敘述。這個工作范疇有趣的融合了數據作家和數據藝術化呈現所帶來的挑戰。數據處理和我們我們內部可視化探索的數據分析產品一樣充滿挑戰。但是這時候,以人為本的美學設計和通俗易懂的解釋性是比高效的信息設計技術來得更重要的。
例如,我們開始和設計團隊協作。為了動態地圖可以顯示每天每輛車的Uber行程,我們拿到了品牌視頻。這里的特效就是用WebGL應用為每一幀動效都在服務端渲染進行渲染然后編譯到視頻里形成的。這個應用關注從數據獲取(通過Hive)到視頻離線渲染輸出技術的每一個環節。
一個身臨其境的 3D 動畫地圖匿名展示了一整天的Uber之旅:
三藩市:
洛杉磯:
對于這樣的工作我們也開發了一套叫做luma.gl的框架,這套框架專注于基于WebGL的可視化應用。它根據一些諸如ES6、WebGL 2.0、組件化平臺的現代技術而設計。這使得luma.gl可以和其他諸如stack.gl那樣的流行的庫一起互操作。
想知道更多嗎?在Uber,數據使我們最大的財富。我們用可視化探索數據分析工具通過數據來發現洞見,而且我們業務矩陣的數據探索也能夠讓我們Uber所有城市的管理者做出更加有效的商業決策。
如果你對和我們的Uber工程團隊一起面對這些挑戰感興趣,你可以查看我們的數據可視化工程的開放職位列表,然后聯系data-viz@uber.com。我們期待你的加入。
原作者: NICOLAS GARCIA BELMONTE 譯者:Harryzhu
英文原文地址:https://eng.uber.com/data-viz...作為分享主義者(sharism),本人所有互聯網發布的圖文均遵從CC版權,轉載請保留作者信息并注明作者 Harry Zhu 的 FinanceR專欄:https://segmentfault.com/blog...,如果涉及源代碼請注明GitHub地址:https://github.com/harryprince。微信號: harryzhustudio
商業使用請聯系作者。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/79487.html
摘要:讓我們看看都做了哪些工作可視化分析增強數據可操作性測試平臺的表格和置信區間可視化可視化分析主要都是由抽象數據可視化組成的。大多數有效的可視化分析在這種情況下都是關于報告儀表盤實時分析的圖標和網絡圖。 showImg(https://segmentfault.com/img/remote/1460000006771644); 概述 在2015年初,我們在Uber規劃了一個官方的數據科學團...
摘要:在同行評議上,我們檢查方法論的改進現有工作的關聯性以及準確的解釋性聲明。學習價值通過之前一系列的工作,現在數據科學家可以分享自己的新方法論代碼技術并且加快品牌化推廣,讓團隊之外的人可以快速了解自己的領域。 頑疾 Airbnb的數據團隊很重要的一個職責就是傳播基于數據的決策方法。我們將數據的獲取民主化,使得每一個Airbnb的成員都可以量化他們基于數據的決策影響力并且借此洞察用戶偏好,提...
摘要:下面是之前解決路徑規劃問題的方法并且講解了我們是如何從五年以前三藩市單一的服務成長的到現在每天百萬以上用車量的。在更高的層面上,星是搜索算法的啟發式實現,因此星優先找到從到之間的一條可能的最優路徑。 showImg(https://segmentfault.com/img/remote/1460000005162386); 概述 一鍵用車現在已經爛大街,但是 Uber 簡單的界面下又隱...
摘要:以下將分別從五大技術專場維度介紹本屆峰會的部分聯席主席與精選案例。天時間集中分享年最值得學習的個研發案例實踐。 從萬維網到物聯網,從信息傳播到人工智能,20年間軟件研發行業趨勢發生了翻天覆地的變化。大數據、云計算、AI等新興領域逐漸改變我們的生活方式,Devops、容器、深度學習、敏捷等技術方式和工作理念對軟件研發從業者提出更高要求。 由麥思博(msup)有限公司主辦的第六屆全球軟件案...
閱讀 2416·2021-11-25 09:43
閱讀 1195·2021-09-07 10:16
閱讀 2603·2021-08-20 09:38
閱讀 2936·2019-08-30 15:55
閱讀 1449·2019-08-30 13:21
閱讀 883·2019-08-29 15:37
閱讀 1435·2019-08-27 10:56
閱讀 2093·2019-08-26 13:45