{eval=Array;=+count(Array);}

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

問答專欄Q & A COLUMN

數(shù)據(jù)分析師用哪個數(shù)據(jù)庫比較好?

陳江龍陳江龍 回答0 收藏2
問題描述:大家覺得數(shù)據(jù)分析師,用哪個數(shù)據(jù)庫好呢?和python結(jié)合用哪個數(shù)據(jù)庫好呢?Access好用嗎?數(shù)據(jù)分析只需要掌握一個數(shù)據(jù)庫就行了嗎?
收藏問題

6條回答

Lyux

Lyux

回答于2022-06-28 15:41

作為一個數(shù)據(jù)分析師來回答一下:

我做這行兩年多了,剛開始的時候用的多是MySQL數(shù)據(jù)庫,當然,Oracle數(shù)據(jù)庫也會用到,尤其是在金融行業(yè)或者國企都用Oracle,一般的公司使用MySQL數(shù)據(jù)庫,可能是因為MySQL數(shù)據(jù)庫免費吧。另外,在一家互聯(lián)網(wǎng)公司,我遇到了mongodb,目前一些新興的互聯(lián)網(wǎng)公司使用nosql的也比較多,這個當時是現(xiàn)學現(xiàn)賣的。作為一個數(shù)據(jù)分析師,可能對數(shù)據(jù)庫的使用一般是存取數(shù)據(jù),至于更高級別的優(yōu)化、事務(wù)之類的,一般是使用不到的,有專門的數(shù)據(jù)庫人員,我們只要用好數(shù)據(jù)庫就好。

說道數(shù)據(jù)分析或者數(shù)據(jù)挖掘,除了數(shù)據(jù)庫來存取數(shù)據(jù),我們還需要處理數(shù)據(jù)的工具,最趁手的當然是Python了。Python結(jié)合數(shù)據(jù)庫是日常的code,Python也提供了齊備的工具,針對MySQL的有pymysql庫,和oracle結(jié)合有cx_Oracle庫,和mongodb結(jié)合有pymongo庫,另外當然少不了我們的數(shù)據(jù)分析利器pandas庫了,提供了read_sql函數(shù),支持各種數(shù)據(jù)庫,直接讀取成DataFrame的數(shù)據(jù)格式,十分的方便。

總結(jié)一下就是:其實遇到的大多數(shù)都是MySQL,oracle也有,這兩種都是sql語句,差別不大,只要掌握sql語句,這兩個數(shù)據(jù)庫問題都不大,mongodb是新興的非關(guān)系數(shù)據(jù)庫,語句也不是很復(fù)雜,之間上手工作也是無壓力的。結(jié)合Python中的pandas使用,讓你很溜的處理數(shù)據(jù),數(shù)據(jù)分析也就得心應(yīng)手了,小case了。

評論0 贊同0
  •  加載中...
neroneroffy

neroneroffy

回答于2022-06-28 15:41

小數(shù)據(jù)使用工具:excel(優(yōu)秀的制圖) / oracle、mysql (數(shù)據(jù)存儲)/ python(數(shù)據(jù)處理)

大數(shù)據(jù)使用工具:HDFS、hive(數(shù)據(jù)存儲) / python(數(shù)據(jù)挖掘)

針對你提的問題,建議如下:

ACCESS數(shù)據(jù)庫,拖拽操作,建議多帶帶使用,工作這么多年,很少見到使用Python調(diào)用ASSCESS數(shù)據(jù)的。

如果只是數(shù)據(jù)分析,采用mysql 結(jié)合 Python比較合適,因為mysql是開源的,免費,千萬級的數(shù)據(jù)處理沒問題。ORACLE是收費,現(xiàn)在國內(nèi)的公司在去ORALCE,因此不建議。

評論0 贊同0
  •  加載中...
vspiders

vspiders

回答于2022-06-28 15:41

數(shù)據(jù)分析OLAP,是一個很寬泛的概念。題主既然問的是數(shù)據(jù)分析師用的數(shù)據(jù)庫,這個很難去確定使用哪種固定的數(shù)據(jù)庫,不同領(lǐng)域一般側(cè)重性質(zhì)不同的,跟數(shù)據(jù)本身的數(shù)量級也有一些關(guān)系。

大體上來說,中小企業(yè)數(shù)據(jù)普遍在TB以下,更多是使用關(guān)系型數(shù)據(jù)庫mysql,sqlserver,oracle,pgsql等做一些分析,結(jié)合一些MPP類數(shù)據(jù)庫比如clickhouse,impala,mariadb columnstore基本上能達到期需求。

上述的都是屬于通過標準的SQL進行分析的,如果有特殊非結(jié)構(gòu)化數(shù)據(jù)分析需求,可以考慮先進行結(jié)構(gòu)化轉(zhuǎn)換,或者使用hdoop,spark等進行處理。

python對上述提及的數(shù)據(jù)庫都有支持,Access是比較初級的本地數(shù)據(jù)庫,處理能力也比較初級。

希望對你有幫助。

評論0 贊同0
  •  加載中...
Donne

Donne

回答于2022-06-28 15:41

數(shù)據(jù)分析師用哪個數(shù)據(jù)庫比較好?

感覺這個問題有點偏離數(shù)據(jù)分析師的工作職責

日常數(shù)據(jù)分析師用的最多的還是word軟件尤其ppt、excel,數(shù)據(jù)存儲處理可以結(jié)合access用。數(shù)據(jù)庫目前一般公司用mysql的還是比較多,免費 輕量級的,還有比較多的現(xiàn)在也在用pg(postgresql)。

其次分析師是用一些專業(yè)的分析軟件spss,獲取數(shù)據(jù) 自助分析 用的 BI軟件平臺 向:tableau、dc等。

其實個人想強調(diào)的是 分析師 60%的時間可能會花在數(shù)據(jù)的獲取、處理和準備上,所以必然會用到sql,個人覺得 對于分析師 與其去了解數(shù)據(jù)庫,不如好好去學下sql,因為sql是標準化的數(shù)據(jù)查詢語言,所有的關(guān)系型數(shù)據(jù)庫包括一些開源的數(shù)據(jù)庫甚至各公司內(nèi)部的數(shù)據(jù)平臺 都對它 有良好的支持,兼容。

最后對于第三方的一些數(shù)據(jù)收集 或者一些跨平臺的數(shù)據(jù)處理,包括一些分析 可以用python,python上手簡單。

推薦一個網(wǎng)站學習這些內(nèi)容:菜鳥教程。runoob.com

評論0 贊同0
  •  加載中...
kviccn

kviccn

回答于2022-06-28 15:41

這的看你需要分析的數(shù)據(jù)有多大了,M級隨便哪個庫,G級oracle或sql server, T級估計就的上hbase之類了,數(shù)據(jù)再大就麻煩了,如果你僅僅是分析有多少條,上面的請忽略。

評論0 贊同0
  •  加載中...
Xufc

Xufc

回答于2022-06-28 15:41

MySQL,oracle,MongoDB,SqlServer,postgresql

評論0 贊同0
  •  加載中...

最新活動

您已邀請0人回答 查看邀請

我的邀請列表

  • 擅長該話題
  • 回答過該話題
  • 我關(guān)注的人
向幫助了您的網(wǎng)友說句感謝的話吧!
付費偷看金額在0.1-10元之間
<