回答:這個問題思考了很久,作為過來人談一談,建議在看我這篇回答之前先去了解一下數(shù)據(jù)挖掘的概念和定義。在學(xué)習(xí)數(shù)據(jù)挖掘之前你應(yīng)該明白幾點(diǎn):數(shù)據(jù)挖掘目前在中國的尚未流行開,猶如屠龍之技。數(shù)據(jù)初期的準(zhǔn)備通常占整個數(shù)據(jù)挖掘項(xiàng)目工作量的70%左右。 數(shù)據(jù)挖掘本身融合了統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫和機(jī)器學(xué)習(xí)等學(xué)科,并不是新的技術(shù)。數(shù)據(jù)挖掘技術(shù)更適合業(yè)務(wù)人員學(xué)習(xí)(相比技術(shù)人員學(xué)習(xí)業(yè)務(wù)來的更高效)數(shù)據(jù)挖掘適用于傳統(tǒng)的BI(報表、OLA...
回答:其實(shí)根本就沒有什么數(shù)據(jù)分析師,或者說,人人都是數(shù)據(jù)分析師。懂我這個意思嗎?我的文章里,也寫過很多數(shù)據(jù)行業(yè)的知識,你可以去看看,其實(shí)有時候想想,你就不一定非得從事這樣的行業(yè)了。就拿數(shù)據(jù)挖掘來說吧,據(jù)我所知,廠商今年都混的不怎么樣,為什么?客戶需求很少,而且都是定制化的,整個項(xiàng)目的周期很長。還有就是一個企業(yè)里,互聯(lián)網(wǎng)公司可能還好一點(diǎn),數(shù)據(jù)分析師根本不需要那么多,你看看ucloud的數(shù)據(jù)分析報錄比,20...
回答:目前階段大數(shù)據(jù)技術(shù)及體系已經(jīng)逐漸趨于成熟,不再是以概念貫穿的模式,大數(shù)據(jù)越來越多的被使用,伴隨互聯(lián)網(wǎng)化的發(fā)展更多的企業(yè)信息化已經(jīng)由IT時代轉(zhuǎn)變?yōu)镈T時代,以數(shù)據(jù)為核心,用數(shù)據(jù)進(jìn)行決策,基于數(shù)據(jù)驅(qū)動企業(yè)的創(chuàng)新與發(fā)展,相信在將來大數(shù)據(jù)也會有更廣泛的應(yīng)用空間,對于大數(shù)據(jù)的理解主要分為以下幾個層面。1.數(shù)據(jù)來源:對于大數(shù)據(jù)時代而言更多強(qiáng)調(diào)基于業(yè)務(wù)數(shù)據(jù)的沉淀,在一定規(guī)模的數(shù)據(jù)上進(jìn)行進(jìn)一步的分析、處理、轉(zhuǎn)換,...
回答:大數(shù)據(jù)是處理海量數(shù)據(jù)的一種技術(shù),你說的寫SQL只能處理結(jié)構(gòu)化數(shù)據(jù),更多的是非結(jié)構(gòu)化數(shù)據(jù)(文本數(shù)據(jù)),和半結(jié)構(gòu)化數(shù)據(jù)。并且通過SQL處理的數(shù)據(jù)量一般很少,幾個T就根本不行,大數(shù)據(jù)涉及存儲(存儲級別為PB級別),資源調(diào)度(一般是分布式系統(tǒng),不是一臺機(jī)器),計(jì)算框架(hadoop;storm;spark)這三部分,缺一不可,你說的寫SQL只是相當(dāng)于計(jì)算框架(勉強(qiáng)算得上,性能差遠(yuǎn)了)。
回答:這是一個非常好的問題,作為一名IT從業(yè)者,同時也在帶大數(shù)據(jù)方向的研究生,所以我來回答一下這個問題。首先,從技術(shù)體系結(jié)構(gòu)上來看,當(dāng)前的大數(shù)據(jù)技術(shù)已經(jīng)趨于成熟了,在數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)和數(shù)據(jù)應(yīng)用等方面,已經(jīng)形成了一整套技術(shù)框架,相關(guān)的技術(shù)生態(tài)也在不斷完善當(dāng)中。當(dāng)前大型科技公司也開始逐漸形成自己的大數(shù)據(jù)平臺,不同平臺也都有自身的技術(shù)特點(diǎn),總的來說,當(dāng)前在技術(shù)上已經(jīng)為大數(shù)據(jù)的行業(yè)應(yīng)用創(chuàng)新奠定了基礎(chǔ)...
原文地址: http://blog.52sox.com/essenti... 在大數(shù)據(jù)時代下,衍生了一些新的工作職位,比如數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師。看著那誘人的薪資,恨不得能早日踏入這個行業(yè)。 那么,今天我們來對數(shù)據(jù)挖掘進(jìn)行一些基礎(chǔ)性的了解和認(rèn)識。 在...
云計(jì)算和大數(shù)據(jù)這兩個詞已經(jīng)更多地被放在一起討論,而從應(yīng)用角度看,大數(shù)據(jù)更能挑動用戶的神經(jīng)。目前,并不是所有的企業(yè)都面臨著大數(shù)據(jù)的困擾,但是擁有著幾千萬甚至幾億客戶的運(yùn)營商,大數(shù)據(jù)所帶來的問題日益顯現(xiàn)...
...。」當(dāng)話題轉(zhuǎn)向「算法工程師的招聘」時,TalkingData 首席數(shù)據(jù)科學(xué)家張夏天不免面露難色起來。而在此之前,談?wù)撈鹚惴ê蛿?shù)據(jù)挖掘等具體業(yè)務(wù)時,他還滔滔不絕、興致勃勃。不只是張夏天,自去年 10 月以來,不止一位技術(shù) Lead...
...身的真正撩妹達(dá)人! 那么現(xiàn)實(shí)中,你是否有見過真正的數(shù)據(jù)科學(xué)家呢? 數(shù)據(jù)科學(xué)家,一個大數(shù)據(jù)時代的新興稱號,被《哈佛商業(yè)評論》中被譽(yù)為21世紀(jì)最性感的職業(yè),2015年,美國白宮首次設(shè)立數(shù)據(jù)科學(xué)家的崗位。 他們可能...
看起來很美很熱鬧的云計(jì)算大數(shù)據(jù),在具體落地時卻不得不面對一系列這樣的現(xiàn)實(shí)問題。正如中國電子學(xué)會副秘書長林潤華所言:產(chǎn)業(yè)界確實(shí)認(rèn)為這是大的發(fā)展方向,也是非常好的轉(zhuǎn)型機(jī)會,但是用戶還抱著非常審慎的態(tài)度...
大數(shù)據(jù)應(yīng)用已廣泛深入我們生活的方方面面,涵蓋醫(yī)療、交通、金融、教育、體育、零售等各行各業(yè)。 天氣預(yù)測應(yīng)用案例: 典型的案例即天氣預(yù)測。各類氣象指征瞬時發(fā)生,以典型的高頻復(fù)雜的形式出現(xiàn),給各類分析人...
...淫溪谷,盛怒于土囊之口,……DT時代,未來已來——數(shù)據(jù)大爆炸首先要明白大家為何從前幾年開始談大數(shù)據(jù)了?這是一個基本問題,包含著對當(dāng)下數(shù)據(jù)現(xiàn)實(shí)的基本認(rèn)識。一個不可忽視的事實(shí)是,隨著網(wǎng)絡(luò)和信息技術(shù)的不...
...個值稱之為損失(loss),我們的目標(biāo)就是使對所有訓(xùn)練數(shù)據(jù)的損失和盡可能的小。 如果將先前的神經(jīng)網(wǎng)絡(luò)預(yù)測的矩陣公式帶入到y(tǒng)p中(因?yàn)橛衵=yp),那么我們可以把損失寫為關(guān)于參數(shù)(parameter)的函數(shù),這個函數(shù)稱之為損...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時根據(jù)訓(xùn)練、推理能力由高到低做了...