摘要:今天,我就用數(shù)據(jù)告訴你,書中到底有沒有黃金屋。數(shù)據(jù)來源利用的拉勾爬蟲爬取了拉勾杭州站,要求年工作經(jīng)驗(yàn)的條招聘數(shù)據(jù)。原始數(shù)據(jù)的薪資是一個(gè)區(qū)間,將區(qū)間拆分為最低與最高兩個(gè)變量。大專本科碩士工資單位月最低工資分布最高薪資
北起漠河南至曾母暗沙,東達(dá)撫遠(yuǎn)西至斯姆哈納。在廣袤的中國土地上,千百年一直流傳著古老的傳說:書中自有黃金屋。
今天,我就用數(shù)據(jù)告訴你,書中到底有沒有黃金屋。
數(shù)據(jù)來源利用 Max 的拉勾爬蟲爬取了拉勾杭州站,要求3~5年工作經(jīng)驗(yàn)的1000條招聘數(shù)據(jù)。
簡單數(shù)據(jù)分析 疑問1:不同學(xué)歷進(jìn)的公司規(guī)模有明顯不同嗎?positionlist_grouped = positionlist.groupby(by = ["companySize","education"],as_index = False).count()
將數(shù)據(jù)按照公司規(guī)模與教育程度分組。
plt.rcParams["font.family"] = ["Arial Unicode MS"] plt.rcParams["axes.unicode_minus"] = False sns.set_style("whitegrid",{"font.sans-serif":["Arial Unicode MS","Arial"]}) # Draw a nested barplot to show survival for class and sex g = sns.catplot(x="companySize", y="positionId", hue="education", data=positionlist_grouped, height=6, kind="bar", palette="muted") g.despine(left=True) g.set_ylabels("count");
繪制分組數(shù)據(jù)的條形圖。
從圖上可以看到,雖然明確要求碩士的崗位比較少,但是不同規(guī)模的公司對學(xué)習(xí)要求的分布基本一致。
不同學(xué)歷進(jìn)的公司規(guī)模沒有明顯不同。
疑問2:不同學(xué)歷進(jìn)的公司財(cái)務(wù)狀況有明顯不同嗎?做法與疑問1一樣,區(qū)別是將數(shù)據(jù)按照財(cái)務(wù)狀況和學(xué)歷進(jìn)行分組,然后繪制分布的條形圖。
groupbyfe = positionlist.groupby(by = ["financeStage","education"],as_index = False).count()
我們可以看到 C 輪的公司開放給大專學(xué)歷的崗位相比 B 輪有一個(gè)斷崖式的下跌。餅圖會更明顯的反應(yīng)出這個(gè)現(xiàn)象。
plt.pie("positionId",labels = "financeStage",data = groupbyfe[groupbyfe["education"] == "大專"],autopct="%1.1f%%") plt.title("專科"); .... ....# 省略了繪制本科的代碼 ....# 省略了繪制碩士的代碼
對比三個(gè)餅圖,注意觀察本科和專科,B、C 輪公司的分布,我們可以看到 C 輪的公司提供給專科學(xué)歷的人的崗位占比非常的低。
所以對于疑問2,我的看法是:不同學(xué)歷進(jìn)的公司財(cái)務(wù)狀況基本一致,但是 C 輪的公司可能更傾向于招募本科及本科以上學(xué)歷的員工。
疑問3:不同的崗位對學(xué)歷的要求有明顯不同嗎?對于這個(gè)問題,我繪制了詞云。
首先將數(shù)據(jù)按照職位類別和學(xué)歷進(jìn)行分組并統(tǒng)計(jì)頻數(shù)
僅保留分組數(shù)據(jù)的職位類別和學(xué)歷列
將新的數(shù)據(jù)轉(zhuǎn)置
將職位類別行設(shè)置為列名
利用 pandas 的 to_dict 方法生成詞頻數(shù)據(jù)
利用 wordcloud 的 generate_from_frequencies 方法繪制詞頻
positionlist_grouped = positionlist.groupby(by = ["secondType","education"],as_index = False).count() grouped_dz = positionlist_grouped[positionlist_grouped["education"] == "大專"].loc[:,["secondType","positionId"]].T.dropna(axis = 1) grouped_dz.rename(columns=grouped_dz.loc["secondType",:],inplace = True) grouped_dz.drop(labels = "secondType",inplace=True)
from wordcloud import WordCloud wordcloud = WordCloud(font_path="/Library/Fonts/Songti.ttc",background_color="white").generate_from_frequencies(grouped_dz.to_dict("records")[0]) plt.imshow(wordcloud, interpolation="bilinear") plt.axis("off") plt.show()
上面三張圖由左至右分別是專科、本科與碩士學(xué)歷的職位詞云。
可以看到銷售相關(guān)的工作要求專科學(xué)歷即可,運(yùn)營、后端開發(fā)、移動前端開發(fā)、產(chǎn)品經(jīng)理等崗位對學(xué)歷的要求專科、本科平分秋色。而一些當(dāng)下火熱的崗位,比如人工智能、硬件開發(fā)、數(shù)據(jù)開發(fā)等,大部分公司對學(xué)歷的要求是碩士。
疑問4:不同學(xué)歷的薪資有明顯不同嗎?終于,到了最核心也是大家最關(guān)心的部分。
原始數(shù)據(jù)的薪資是一個(gè)區(qū)間,將區(qū)間拆分為最低與最高兩個(gè)變量。
positionlist["Lsalary"]=positionlist["salary"].str.split("-",expand = True)[0].str[:-1].astype(int) positionlist["Hsalary"]=positionlist["salary"].str.split("-",expand = True)[1].str[:-1].astype(int)
繪制不同學(xué)歷的最低薪資與最高薪資分布直方圖。
x = positionlist[positionlist["education"] == "大專"].loc[:,["Lsalary"]] y = positionlist[positionlist["education"] == "本科"].loc[:,["Lsalary"]] z = positionlist[positionlist["education"] == "碩士"].loc[:,["Lsalary"]] ax = sns.distplot(x) ax = sns.distplot(y) ax = sns.distplot(z) ax.set_xlabel("工資(單位K/月)") ax.set_title("最低工資分布"); #*****最高薪資
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/43873.html
摘要:今天,我就用數(shù)據(jù)告訴你,書中到底有沒有黃金屋。繪制分組數(shù)據(jù)的條形圖。我們可以看到輪的公司開放給大專學(xué)歷的崗位相比輪有一個(gè)斷崖式的下跌。繪制不同學(xué)歷的最低薪資與最高薪資分布直方圖。北起漠河南至曾母暗沙,東達(dá)撫遠(yuǎn)西至斯姆哈納。在廣袤的中國土地上,千百年一直流傳著古老的傳說:書中自有黃金屋。 今天,我就用數(shù)據(jù)告訴你,書中到底有沒有黃金屋。 數(shù)據(jù)來源 利用 Max 的拉勾爬蟲爬取了拉勾杭州站,要求...
摘要:對于商業(yè)市場來說,特別是中國這樣一個(gè)云計(jì)算才剛剛起步的市場。反觀云計(jì)算售賣的一些商品,目前主要還是以服務(wù)器為主。云計(jì)算的本質(zhì)是將計(jì)算能力轉(zhuǎn)化為標(biāo)準(zhǔn)化,可售賣的服務(wù)。可以說是云計(jì)算實(shí)踐的一個(gè)經(jīng)典案例。有的人會問,云計(jì)算廠商需要提供哪些服務(wù)。 2015年伊始,國內(nèi)云計(jì)算市場可謂風(fēng)起云涌。各路群豪紛紛涌入這個(gè)市場。其中最活躍的領(lǐng)域當(dāng)屬IAAS。阿里騰訊硝煙未盡,百度重新檢討了自己的PAAS戰(zhàn)略后,...
摘要:華為說應(yīng)屆生招聘已經(jīng)結(jié)束了。我進(jìn)入華為之后,要定崗,一般大家都愿意去市場部,因?yàn)槿A為最強(qiáng)的是市場部。我非常驚訝,因?yàn)闉榱吮苊膺@樣的事情,在簡歷里我只字未提在華為的測試經(jīng)歷。 非商業(yè)轉(zhuǎn)載請注明作譯者、出處,并保留本文的原始鏈接:http://www.ituring.com.cn/article/72226 段念,現(xiàn)任豆瓣工程副總裁,曾在Google,樂元互動,OpenTV等公司...
摘要:認(rèn)知突圍做復(fù)雜時(shí)代的明白人石志遠(yuǎn)到底什么才是明白人,處在浪蕩歲的我何談明白。和認(rèn)知層次不同的人交流,猶如雞同鴨講。同一件事情可以做的更快,單位時(shí)間內(nèi)做事情的數(shù)量越多,賺取的時(shí)間越多。單位時(shí)間內(nèi)做事的經(jīng)歷越多,人生經(jīng)歷越豐富,賺取的時(shí)間越多。 《認(rèn)知突圍》做復(fù)雜時(shí)代的明白人 石志遠(yuǎn) 到底什么才是明白人,處在20浪蕩歲的我何談明白。 引子 以前,有三個(gè)乞丐在城門口要飯,正好踫到皇上出宮狩獵...
摘要:以后會持續(xù)添加一些總結(jié)年,延續(xù)著年的野心,打算在考大學(xué)之前完成一個(gè)成功的項(xiàng)目,但屢屢遭到了挫折。到現(xiàn)在,年,這個(gè)項(xiàng)目已經(jīng)完成了,但是覺得自己是無法在高考前把它發(fā)布的了。 showImg(http://segmentfault.com/img/bVbJID); 題圖為本文作者作品,未經(jīng)許可請勿轉(zhuǎn)載并修改發(fā)布。另外聲明,題圖不是本人。 Mark:以后會持續(xù)添加一些總結(jié) 2013...
閱讀 3222·2021-09-09 11:39
閱讀 1228·2021-09-09 09:33
閱讀 1127·2019-08-30 15:43
閱讀 546·2019-08-29 14:08
閱讀 1733·2019-08-26 13:49
閱讀 2376·2019-08-26 10:09
閱讀 1545·2019-08-23 17:13
閱讀 2283·2019-08-23 12:57