{eval=Array;=+count(Array);}

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

問答專欄Q & A COLUMN

一般用哪些工具做大數據分析?

bang590bang590 回答0 收藏1
收藏問題

8條回答

IntMain

IntMain

回答于2022-06-28 14:56

謝邀~

本君自薦一下。我們的產品諸葛io(www.zhugeio.com)可能更偏向于非技術人員的業務分析,比如產品經理、市場、運營人員。

從某種意義上也具有可視化分析的特性,但區別于其他工具的是我們面向互聯網產品推廣運營過程中的分析需求定義了一些分析模型,比如事件、漏斗、自定義留存、粘性、用戶分群等,很多工具可以任意拖拽去做分析,但很多時候客戶也會因為太靈活反而有一定門檻,所以,當一些模型被標準化以后,基本可以解決互聯網產品設計、推廣、運營、營銷過程中的絕大多數分析需求,這也大大提供了業務人員的工作效率。

附圖幾張:

用戶模型

全行為路徑分析模型

粘性分析模型自定義留存分析模型

關于一些分析模型,我們整理出了常用的八大數據分析模型,過去兩個月,每周二都會更新一個模型,很多模型大家都比較了解,但可能他又增加了一些新特性,感興趣可戳鏈接:

八大數據分析模型之——用戶模型(一)

八大數據分析模型之——事件模型(二)

八大數據分析模型之——漏斗模型(三)

八大數據分析模型之——熱圖模型(四)

八大數據分析模型之——自定義留存分析模型(五)

八大數據分析模型之——粘性分析模型(六)

八大數據分析模型之——全行為路徑模型(七)

......

當然,我們也面向有高級使用需求的用戶,比如數據分析師或是有一定數據查詢能力的人員提供了SQL查詢功能,因為還有20%的分析需求無法通過標準的模型解決,需要自己去定義。

數據都是開放的,原始數據的導出,實時數據的調用在諸葛都是支持的。數據來源于客戶,數據屬于客戶。

1、前端表格導出

2、SQL查詢平臺支持

3、查詢API按需調用

4、直連數據倉庫

5、Kafka實時訂閱

6、原始數據全量導出

以上~

評論0 贊同0
  •  加載中...
seasonley

seasonley

回答于2022-06-28 14:56

有很多開源的產品,如果有研發能力的,可以直接使用開源產品來自己搭建數據分析平臺,開發自己的數據分析軟件,不過這樣需要較強的技術能力,付出較大的成本。

也可以使用東軟平臺云(https://cloud.neusoft.com/)的DataViz可視化數據分析軟件,這樣的專業的尅時候數據分析軟件,不需要專業的分析師和技術人員,業務人員通過簡單的拖拽就可以實現數據分析,還支持多種數據源,支持動態傳統圖表和高級可視化圖表,多種科技、商務主題自由切換,支持拖拽圖表組合布局,設置圖表聯動交互,分析結果支持適應各種分辨率的大屏展示。

評論0 贊同0
  •  加載中...
騫諱護

騫諱護

回答于2022-06-28 14:56

MongoDB—— 一種流行的,跨平臺的面向文檔的數據庫。

Elasticsearch——專為云而構建的分布式REST風格搜索引擎。

Cassandra——一個開源的分布式數據庫管理系統,最初由Facebook開發,被設計用來處理橫跨多個商用服務器的大量數據,提供了無單點故障的高度可用性。

Redis—— 一個開源的(BSD許可),內存數據結構存儲,作為數據庫、緩存和消息代理使用。

Hazelcast——基于Java的開源內存數據網格。

EHCache——一種被廣泛使用的開源Java分布式緩存,用于通用緩存、Java EE和輕量級容器。Ehcache相關介紹

Hadoop——用Java編寫的一個開源軟件框架,用于分布式存儲和對在計算機集群上的超大型數據集的分布式處理。

Solr——一個開源的企業搜索平臺,用Java編寫的,來自于ApacheLucene項目。

Spark——Apache Software Foundation中最活躍的項目,一個開源的集群計算框架。

Memcached—— 一個通用的分布式內存緩存系統。

Apache Hive——提供了Hadoop之上類似于SQL的層。

Apache Kafka—— 一個高通量、分布式的發布-訂閱式消息系統,最初開發在LinkedIn上。Windows上脫離Cygwin運行Apache Kafka

Akka—— 一個工具包和運行時,用于在JVM上構建高度并行的、分布式的、有彈性的消息驅動的應用程序。

HBase—— 一個開源的,非關系型的,分布式數據庫,在谷歌的BigTable后建模,用Java編寫,并運行在HDFS上。

Neo4j——用Java實現的開源圖形數據庫。

CouchBase——一個開源的、面向文檔的分布式NoSQL數據庫,特別為了交互式應用而優化。

Apache Storm——開源的分布式實時計算系統。

CouchDB——使用JSON來存儲數據的面向文檔的開源NoSQL數據庫。

Oracle Coherence—— 一個內存的數據網格解決方案,通過提供快速訪問常用數據的渠道,使得企業可預測地擴展關鍵任務應用程序。

Titan—— 一個可擴展的圖形數據庫,優化的目的在于存儲和查詢包含數千億頂點和邊的圖形,分布在多機集群。

Amazon DynamoDB——一個快速、靈活、完全管理的NoSQL數據庫服務,用于在任何規模需要一致的、個位數毫秒延遲的所有應用程序。

Amazon Kinesis—— 用于在AWS上的流數據的實時平臺。

Datomic—— 一個用Clojure寫的完全事務式的,支持云的,分布式數據庫。


原文鏈接:https://blog.csdn.net/zhinengxuexi/article/details/90056986

評論0 贊同0
  •  加載中...
helloworldcodin

helloworldcodin

回答于2022-06-28 14:56

按需求選擇吧:

19個超贊的數據科學和機器學習工具:https://www.toutiao.com/i6585379544813797901/

3大開源Python數據分析工具

https://www.toutiao.com/i6589410805932884493/

評論0 贊同0
  •  加載中...
sunny5541

sunny5541

回答于2022-06-28 14:56

看你問的是可視化工具類還是說數據處理框架。具體指的是哪方面的數據,可以評論我說明。

評論0 贊同0
  •  加載中...
qpal

qpal

回答于2022-06-28 14:56


在推薦工具之前,我們要先把數據可視化和 信息可視化分清楚,狹義上的數據可視化指的是將數據用統計圖表方式呈現,而信息可視化則是將非數字的信息進行可視化。

我們常常聽說的數據可視化大多指狹義的數據可視化以及部分信息可視化。根據數據類型和性質的差異,經常分為以下幾種類型:

  • 統計數據可視化:用于對統計數據進行展示、分析,一般都是以數據庫表的形式提供,常見的有 HighCharts、ECharts、G2、Chart.js 、FineBI等等;
  • 關系數據可視化:主要表現為節點和邊的關系,比如流程圖、網絡圖、UML 圖、力導圖等。常見的關系可視化類庫有 mxGraph、JointJS、GoJS、G6 等;
  • 地理空間數據可視化:常見類庫如 Leaflet、Turf、Polymaps 等等;
  • 還有時間序列數據可視化(如 timeline)、文本數據可視化(如 worldcloud)等等;

然后下面我再來盤點幾個大數據可視化常用的工具:

一、D3

D3.js 是一個基于數據操作文檔的 JavaScript 庫。 D3 可以將強大的可視化組件和數據驅動的 DOM 操作方法完美結合。

D3 的優劣:

  • 強大的 SVG 操作能力,可以非常容易的將數據映射為 SVG 屬性
  • 集成了大量數據處理、布局算法和計算圖形的工具方法
  • 強大的社區和豐富的 demo
  • API 太底層,復用性低,學習與使用成本高

D3 沒有提供封裝好的組件,在復用性、易用性方面不佳,社區里有很多基于 D3 的可視化組件庫:

  • nvd3.js: 基于 D3 封裝了常見的折線圖、散點圖、餅圖,功能比較簡單
  • dc.js: 除了提供了常見的圖表外還提供了一些數據處理能力
  • c3.js: 一個輕量級的基于狀態管理的圖表庫

D3 有著 Stanford 的血脈淵源,在學術界享有很高聲譽,靈活強大使得它成為目前領域內使用最廣泛的可視化類庫,但偏底層的 API 和數據驅動模式,使得上手 D3 存在一定門檻,基于 D3 的工程實現上需要自己考慮和處理更多內容,如動畫、交互、統一樣式等,研發成本較高。

二、FineBI

簡潔明了的數據分析工具,優點是零代碼可視化、可視化圖表豐富,只需要拖拖拽拽就可以完成十分炫酷的可視化效果,擁有數據整合、可視化數據處理、探索性分析、數據挖掘、可視化分析報告等功能,更重要的是個人版免費。

評價:

FineBI做到了自助式分析,圖表類型豐富,數據分析功能較強大,鉆取,篩選,分組等功能都有。但是對于普通沒有IT基礎的人來說,要想真正熟練地掌握finebi,還是有一定的難度的,需要花上幾天,但是這個難度相比Excel的VBA學習還是低不少的。

三、HighCharts

HighCharts 是一個用純 JavaScript 編寫的圖表庫, 能夠簡單便捷的在 Web 應用上添加交互性圖表。這是在 Web 上使用最廣泛的圖表,企業使用需要購買商業授權。

HighCharts 的優劣:

  • 使用門檻極低,兼容性好
  • 使用廣泛,非常成熟
  • 樣式比較陳舊、圖表難以擴展
  • 商業上使用需要購買版權

這是圖表界的 jQuery,在世界范圍內是使用最多最廣的一個可視化類庫,但整體圖表設計比較陳舊難以擴展,同時商業公司使用需要按照使用人數購買版權,比較昂貴,ucloud有購買過,目前已不推薦使用。

四、ECharts

ECharts 縮寫自 Enterprise Charts,企業級圖表,開源來自百度數據可視化團隊,是一個純 Javascript 的圖表庫,可以流暢的運行在 PC 和移動設備上,兼容當前絕大部分瀏覽器,底層依賴另一個也是該團隊自主研發的輕量級的 Canvas 類庫 ZRender,提供直觀,生動,可交互,可高度個性化定制的數據可視化圖表。ECharts 是目前國內唯一一個入選 GitHub 全球可視化榜單的開源項目,2w+ star 全球排名第三,社區活躍,覆蓋主流前端框架和 8 種編程語言的擴展,目前國內市場占有率處于絕對領先地位。

ECharts 的優劣:

  • 豐富的圖表類型,覆蓋主流常規的統計圖表
  • 配置項驅動,三級個性化圖表樣式管理
  • 移動端優化,交互和布局適配,按需打包
  • 深度的交互式數據探索
  • 地理特效(百度遷徙,百度人氣,公交軌跡等效果)
  • 靈活性上不如 Vega 等基于圖形語法的類庫
  • 復雜關系型圖表比較難定制

ECharts 能很好滿足傳統圖表需求,但在高度靈活多樣化的可視需求面前,需要另尋出路。

五、Leaflet

Leaflet 是面向移動設備的交互式地圖的 JavaScript 庫。 測量的 JS 只有大約 38 KB,它具有大多數開發人員需要的所有映射功能。

Leaflet 的優劣:

  • 專門針對地圖應用
  • mobile 兼容性良好
  • API 簡潔、支持插件機制
  • 功能比較簡單,需要具備二次開發能力

地圖專用,其他領域使用不上。目前 Google 地圖、高德地圖、百度地圖都擁有自研的 JS 庫。

六、Vega

Vega 是華盛頓大學計算機學院數據交互實驗室(IDL)開發的一套交互圖形語法,定義了數據到圖形的映射規則、常見的交互語法和常見的圖形元素,用戶可以自由使用 Vega 語法進行組合構建出各種各樣的圖表。

Vega 的優劣:

  • 完全基于 JSON 語法,提供從數據到圖形的映射規則
  • 支持常見的交互語法
  • 復雜的語法設計,使用和學習成本很高

Vega 在學術上有著比較完美的語法設計,但在工程易用性上比較欠缺。

七、deck.gl

deck.gl 是 Uber 可視化團隊基于 WebGL 開發的面向大數據分析的可視化類庫。

deck.gl 的優劣:

  • 主要以 3D 地圖可視化為主,內置了地理信息可視化常見的場景
  • 支持大規模數據的可視化
  • 需要具備 WebGL 的知識,層的擴展比較復雜

deck.gl 在 3D 地圖領域效果很贊,在其他領域不適用。

基于 Web 的可視化工具還有很多,上面是幾個一直以來使用比較多的類庫工具,以及最近涌現的一些新秀。各個類庫工具特性不同,定位不同,關鍵要看應用場景的適用性。

八、AntV

AntV 是螞蟻金服全新一代數據可視化解決方案,主要面向從事數據可視化應用相關的工程師和設計師,目前包括:

  • 底層繪圖引擎 G:目前基于 canvas 2d 提供基礎繪圖能力,基于 webgl 的版本正在規劃中;
  • 可視化語法類庫 G2:一套數據驅動的高交互可視化圖形語法,提供了豐富的圖表、專業的數據處理能力、便利的擴展方式和強大交互能力;
  • 關系可視化類庫 G6:專注解決流程與關系分析的圖表庫,集成了大量的交互,可以輕松的進行動態流程圖和關系網絡的開發;
  • 移動端圖表類庫 F2:是一套精簡、高效易擴展的移動端圖表庫,適于對性能、體積、擴展性要求嚴苛的移動應用場景下使用;
  • 可視化設計指引與使用規范:統計圖表以及常用場景下的可視化設計指引和使用規范;
九、G2

G2 (The Grammar Of Graphics) 是一個由純 JavaScript 編寫、強大的語義化圖表語法類庫,提供了一整套圖形語法,可以讓用戶通過簡單的語法搭建出無數種圖表,并集成了大量的統計工具,支持多種坐標系繪制,可以讓用戶自由地定制各種圖表。

G2 的優劣:

  • 簡單、易用
  • 完備的可視化編碼
  • 強大的擴展能力
  • 語法需要一定學習成本
十、G6

G6 是一個由純 JavaScript 編寫的關系數據可視化類庫,提供了基本的網圖和樹圖功能,并支持多種內置布局。G6 提供了查看和編輯兩種視圖,開發者可基于 G6 對關系圖快速進行二次開發。

G6 的優劣:

  • 簡單的語法,強大的交互能力
  • 支持多種視圖,易于使用的編輯視圖
  • 強大的邊和節點的擴展能力
  • 現階段上層封裝比較少,使用成本比較高

評論0 贊同0
  •  加載中...
mgckid

mgckid

回答于2022-06-28 14:56

1、奧威BI工具

多用于億級數據量的大數據智能可視化分析,如大中型企業、集團項目等。

有標準化的數據分析解決方案,預設數據分析模板;無縫對接金蝶、用友等主流ERP;可做必要的個性化設計。

說白了就是給你一個標準化的、系統化的解決方案,你拿過來稍微改改就能得到一個適合自己的大數據可視分析平臺。這可比自己從零開始做藍圖設計、搭建分析模型、測試要省事多了。

2、SpeedBI數據分析云

多用于小微企業、個人用戶。免下載安裝,在線使用。

從瀏覽器中登錄即可免費用。拖拉拽+點擊即可應用智能分析功能、可視化圖表等,完成智能數據可視化分析報表。

評論0 贊同0
  •  加載中...
xingqiba

xingqiba

回答于2022-06-28 14:56

大數據分析的前瞻性使得很多公司以及企業都開始使用大數據分析對公司的決策做出幫助,而大數據分析是去分析海量的數據,所以就不得不借助一些工具去分析大數據,。一般來說,數據分析工作中都是有很多層次的,這些層次分別是數據存儲層、數據報表層、數據分析層、數據展現層。對于不同的層次是有不同的工具進行工作的。下面小編就對大數據分析工具給大家好好介紹一下。

首先我們從數據存儲來講數據分析的工具。我們在分析數據的時候首先需要存儲數據,數據的存儲是一個非常重要的事情,如果懂得數據庫技術,并且能夠操作好數據庫技術,這就能夠提高數據分析的效率。而數據存儲的工具主要是以下的工具。

1、MySQL數據庫,這個對于部門級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力。

2、SQL Server的最新版本,對中小企業,一些大型企業也可以采用SQL Server數據庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了。

3、DB2,Oracle數據庫都是大型數據庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型數據庫公司都提供非常好的數據整合應用平臺;

接著說數據報表層。一般來說,當企業存儲了數據后,首先要解決報表的問題。解決報表的問題才能夠正確的分析好數據庫。關于數據報表所用到的數據分析工具就是以下的工具。

1、Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規范的報表設計思想,早期商業智能其實大部分人的理解就是報表系統,不借助IT技術人員就可以獲取企業各種信息——報表。

2、Tableau軟件,這個軟件是近年來非常棒的一個軟件,當然它已經不是單純的數據報表軟件了,而是更為可視化的數據分析軟件,因為很多人經常用它來從數據庫中進行報表和可視化分析。

第三說的是數據分析層。這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;

1、Excel軟件,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;

2、SPSS軟件:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟件。

最后說表現層的軟件。一般來說表現層的軟件都是很實用的工具。表現層的軟件就是下面提到的內容。

1、PowerPoint軟件:大部分人都是用PPT寫報告。

2、Visio、SmartDraw軟件:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這里可以得到很多零件;

3、Swiff Chart軟件:制作圖表的軟件,生成的是Flash。

評論0 贊同0
  •  加載中...

相關問題

最新活動

您已邀請0人回答 查看邀請

我的邀請列表

  • 擅長該話題
  • 回答過該話題
  • 我關注的人
向幫助了您的網友說句感謝的話吧!
付費偷看金額在0.1-10元之間
<