回答:謝謝邀請(qǐng)!數(shù)據(jù)分析師通常分成兩種,一種是應(yīng)用級(jí)數(shù)據(jù)分析師,另一種是研發(fā)級(jí)數(shù)據(jù)分析師,區(qū)別就在于是否具備算法設(shè)計(jì)及實(shí)現(xiàn)的能力。應(yīng)用級(jí)數(shù)據(jù)分析師通常需要掌握各種數(shù)據(jù)分析工具,把業(yè)務(wù)模型映射到數(shù)據(jù)分析工具上,從而得到數(shù)據(jù)分析的結(jié)果。數(shù)據(jù)分析工具比較多,比如Excel就是一個(gè)傳統(tǒng)的數(shù)據(jù)分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備一定的數(shù)學(xué)基礎(chǔ)和統(tǒng)計(jì)學(xué)基礎(chǔ)。通常...
回答:作為一個(gè)數(shù)據(jù)分析師來(lái)回答一下:我做這行兩年多了,剛開始的時(shí)候用的多是MySQL數(shù)據(jù)庫(kù),當(dāng)然,Oracle數(shù)據(jù)庫(kù)也會(huì)用到,尤其是在金融行業(yè)或者國(guó)企都用Oracle,一般的公司使用MySQL數(shù)據(jù)庫(kù),可能是因?yàn)镸ySQL數(shù)據(jù)庫(kù)免費(fèi)吧。另外,在一家互聯(lián)網(wǎng)公司,我遇到了mongodb,目前一些新興的互聯(lián)網(wǎng)公司使用nosql的也比較多,這個(gè)當(dāng)時(shí)是現(xiàn)學(xué)現(xiàn)賣的。作為一個(gè)數(shù)據(jù)分析師,可能對(duì)數(shù)據(jù)庫(kù)的使用一般是存取數(shù)據(jù)...
回答:優(yōu)秀的數(shù)據(jù)分析師并不能速成,但是零經(jīng)驗(yàn)也有零經(jīng)驗(yàn)的捷徑。市面上有《七周七數(shù)據(jù)庫(kù)》,《七周七編程語(yǔ)言》。今天我們就《七周七學(xué)習(xí)成為數(shù)據(jù)分析師》,沒錯(cuò),七周。第一周:Excel學(xué)習(xí)掌握如果Excel玩的順溜,可以略過(guò)這一周。但很多人并不會(huì)vlookup,所以有必要講下。了解sum,count,sumif,countif,find,if,left/right,時(shí)間轉(zhuǎn)換等。excel的各類函數(shù)很多,完全不...
回答:一名合格的數(shù)據(jù)分析師應(yīng)該掌握網(wǎng)頁(yè)爬蟲:Python或R數(shù)據(jù)存儲(chǔ):Excel或者Tableau、MangoDB等數(shù)據(jù)清洗:數(shù)據(jù)缺失處理等數(shù)據(jù)分析:線性回歸等數(shù)據(jù)可視化:Python或R的可視化包進(jìn)階級(jí)數(shù)據(jù)分析師:統(tǒng)計(jì)知識(shí)運(yùn)籌學(xué)知識(shí)機(jī)器學(xué)習(xí)知識(shí)掌握以上三個(gè)技能點(diǎn)便可稱之為數(shù)據(jù)科學(xué)家至于面試要準(zhǔn)備些啥?Simply按照上面技能點(diǎn)一一準(zhǔn)備但是今天要說(shuō)的是一項(xiàng)奇淫技巧那就是--寫一篇數(shù)據(jù)分析的推文在這篇推文...
回答:大數(shù)據(jù)的技術(shù)大數(shù)據(jù)技術(shù)包括:1)數(shù)據(jù)采集: ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。2)數(shù)據(jù)存取: 關(guān)系數(shù)據(jù)庫(kù)、NOSQL、SQL等。3)基礎(chǔ)架構(gòu): 云存儲(chǔ)、分布式文件存儲(chǔ)等。4)數(shù)據(jù)處理: 自然語(yǔ)言處理(NLP,Natural Language Processin...
回答:數(shù)據(jù)分析的應(yīng)用幾乎是無(wú)行業(yè)和人群限制的。數(shù)據(jù)分析的魅力體現(xiàn)在數(shù)據(jù)的價(jià)值和創(chuàng)新的能力,運(yùn)用數(shù)據(jù)的能力越來(lái)越成為基礎(chǔ)的職業(yè)技能,因此任何有興趣和需求的人士都可以進(jìn)入這個(gè)領(lǐng)域。涉及到數(shù)據(jù)分析學(xué)習(xí)和工具的選擇, 那么久可以從知識(shí)和應(yīng)用的角度入門數(shù)據(jù)分析的路徑。01SQL數(shù)據(jù)庫(kù)語(yǔ)言作為數(shù)據(jù)分析師,我們首先要知道如何獲取數(shù)據(jù),其中最常用的就是從關(guān)系型數(shù)據(jù)庫(kù)中取數(shù)。因此,你可以不會(huì)R,但不能不會(huì)SQL。大數(shù)據(jù)...
...私有化風(fēng)控服務(wù)的時(shí)候常有幾十萬(wàn)甚至百萬(wàn)量級(jí)的URL進(jìn)行數(shù)據(jù)統(tǒng)計(jì),這一點(diǎn)在一開始的時(shí)候確實(shí)會(huì)造成我們計(jì)算和運(yùn)營(yíng)分析資源的浪費(fèi),因?yàn)榉治龅膶?duì)象遠(yuǎn)遠(yuǎn)超過(guò)了可人工審查的范圍,最后也只能靠分析師通過(guò)和客戶的交涉和自...
...私有化風(fēng)控服務(wù)的時(shí)候常有幾十萬(wàn)甚至百萬(wàn)量級(jí)的URL進(jìn)行數(shù)據(jù)統(tǒng)計(jì),這一點(diǎn)在一開始的時(shí)候確實(shí)會(huì)造成我們計(jì)算和運(yùn)營(yíng)分析資源的浪費(fèi),因?yàn)榉治龅膶?duì)象遠(yuǎn)遠(yuǎn)超過(guò)了可人工審查的范圍,最后也只能靠分析師通過(guò)和客戶的交涉和自...
...下價(jià)格優(yōu)勢(shì)。 另一個(gè)案例來(lái)自某酒店網(wǎng)站,我們?cè)跀?shù)據(jù)分析平臺(tái) Warden 實(shí)踐中發(fā)現(xiàn),網(wǎng)站的客房詳情被爬蟲攻擊,機(jī)器訪問的特點(diǎn)非常明顯: 頁(yè)面被某幾個(gè) IP 超高頻訪問,單個(gè) IP每小時(shí)訪問量達(dá) 5000 以上 部分 IP 的訪問路徑極...
...從基礎(chǔ)學(xué)起,由淺入深,學(xué)習(xí)才會(huì)更輕松。 . 二、數(shù)據(jù)分析 顧名思義,數(shù)據(jù)分析說(shuō)的通俗一點(diǎn)就是將數(shù)據(jù)進(jìn)行分析。將大量數(shù)據(jù)經(jīng)過(guò)整理、概括,總結(jié)然后再形成結(jié)論所展示出來(lái)。隨著互聯(lián)網(wǎng)的發(fā)展,我們的生活,也離不開數(shù)...
...類文章中網(wǎng)站中,做做搬運(yùn)工。在這里跟大家分享下數(shù)據(jù)分析師的知識(shí)結(jié)構(gòu),數(shù)據(jù)分析師的知識(shí)結(jié)構(gòu)應(yīng)當(dāng)包括數(shù)據(jù)能力、業(yè)務(wù)sense、思維方法三個(gè)維度。網(wǎng)址http://www.chujiangdata.com。下面書單,選取的都是行業(yè)里面的經(jīng)典書籍,內(nèi)...
...了一個(gè)外文網(wǎng)站。一時(shí)心血來(lái)潮,于是當(dāng)時(shí)想,如果拿來(lái)分析知乎這個(gè)網(wǎng)站,會(huì)有什么效果呢。有一些不一樣的地方是stackoverflow這個(gè)網(wǎng)站開放了api,所以拿到數(shù)據(jù)是很方便的。知乎并沒有公開api,只能采取爬蟲手段。所以,很...
...了一個(gè)外文網(wǎng)站。一時(shí)心血來(lái)潮,于是當(dāng)時(shí)想,如果拿來(lái)分析知乎這個(gè)網(wǎng)站,會(huì)有什么效果呢。有一些不一樣的地方是stackoverflow這個(gè)網(wǎng)站開放了api,所以拿到數(shù)據(jù)是很方便的。知乎并沒有公開api,只能采取爬蟲手段。所以,很...
...了一個(gè)外文網(wǎng)站。一時(shí)心血來(lái)潮,于是當(dāng)時(shí)想,如果拿來(lái)分析知乎這個(gè)網(wǎng)站,會(huì)有什么效果呢。有一些不一樣的地方是stackoverflow這個(gè)網(wǎng)站開放了api,所以拿到數(shù)據(jù)是很方便的。知乎并沒有公開api,只能采取爬蟲手段。所以,很...
...了一個(gè)外文網(wǎng)站。一時(shí)心血來(lái)潮,于是當(dāng)時(shí)想,如果拿來(lái)分析知乎這個(gè)網(wǎng)站,會(huì)有什么效果呢。有一些不一樣的地方是stackoverflow這個(gè)網(wǎng)站開放了api,所以拿到數(shù)據(jù)是很方便的。知乎并沒有公開api,只能采取爬蟲手段。所以,很...
...變DOM元素,而且請(qǐng)求的參數(shù)使用的是paylaod加密。我們?cè)诜治鼍W(wǎng)站的時(shí)候看不到參數(shù),也就分析不出來(lái)請(qǐng)求參數(shù)的規(guī)律,這個(gè)問題可以通過(guò)fiddler抓包工具解決。剛開始分析確實(shí)有點(diǎn)懵,在此記錄下我的分析過(guò)程。 工具;火狐瀏覽...
...變DOM元素,而且請(qǐng)求的參數(shù)使用的是paylaod加密。我們?cè)诜治鼍W(wǎng)站的時(shí)候看不到參數(shù),也就分析不出來(lái)請(qǐng)求參數(shù)的規(guī)律,這個(gè)問題可以通過(guò)fiddler抓包工具解決。剛開始分析確實(shí)有點(diǎn)懵,在此記錄下我的分析過(guò)程。 工具;火狐瀏覽...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺(tái)階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說(shuō)合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時(shí)根據(jù)訓(xùn)練、推理能力由高到低做了...