国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

70%求職者因此被拒,你還不避開這些“雷區(qū)”?!

jollywing / 1047人閱讀

摘要:要想出類拔萃,你可以用庫中的這個函數(shù)來實驗一下,看看怎么將貝葉斯優(yōu)化法運用到超參數(shù)搜索中。你可以練習(xí)一些基礎(chǔ)的貝葉斯白板問題,并且閱讀下面這本著作來深刻理解這個法則的含義和來由。這就意味著求職者不僅技術(shù)要過關(guān),還要掌握一些其他的技能。

很多想要在數(shù)據(jù)科學(xué)行業(yè)尋找一席之地的人正在慢慢意識到這個問題:在數(shù)據(jù)科學(xué)這個領(lǐng)域應(yīng)聘,想得到求職或者面試反饋是基本不可能的。

圖片來源:unsplash.com/@kentreloar

互聯(lián)網(wǎng)公司對這些信息守口如瓶有很多原因。其一,公司給出的每一條拒絕理由都可能招致法律訴訟。其二,很多人并不能很好地消化負(fù)面消息,有些人甚至?xí)兊檬制ぁF淙绻@么做的話,想想面試官要花多長時間寫一篇構(gòu)思精良的反饋給幾十個甚至上百個應(yīng)聘的人。除此之外,公司并沒有從中得到任何好處。

于是,就出現(xiàn)了一大批困惑、迷茫又想要有所成就的數(shù)據(jù)科學(xué)家。但好消息是:在這個行業(yè),求職被拒的原因其實也就那么幾個,針對這些不足還有很多方法來進(jìn)行彌補。

不管是技術(shù)性還是非技術(shù)性的技能,應(yīng)聘者所不具備的也正是這些公司迫切需求的,本文旨在對這些問題進(jìn)行探討。

原因1:使用Python語言處理數(shù)據(jù)科學(xué)的技能

大部分?jǐn)?shù)據(jù)科學(xué)模型都基于Python環(huán)境。在使用Python語言處理數(shù)據(jù)結(jié)構(gòu)時,僅有少數(shù)工具能將新手和經(jīng)驗豐富的老手區(qū)分開來。如果你指望通過創(chuàng)建特別出眾的項目來吸引雇主的注意,這些工具能迅速拉開你和其他人的差距。

要想促使自己擴(kuò)充數(shù)據(jù)科學(xué)理論方面的知識,提高實踐能力,可以在項目中嘗試以下幾個方法:

數(shù)據(jù)挖掘。你應(yīng)該熟練掌握pandas函數(shù),比如.corr(),scatter_matrix(),.hist() 和.bar()這些語句的使用。你應(yīng)該時刻注意,利用主成分分析(PCA)原理或者t-SNE的方法將數(shù)據(jù)可視化,在Python語言中可以使用sklearn的PCA和TSNE。

特征選擇。在90%的情況下,數(shù)據(jù)集會有很多并不需要的特征,這些特征會耗費不必要的調(diào)試時間,還很可能會出現(xiàn)過擬合的現(xiàn)象。這就要求數(shù)據(jù)科學(xué)家們熟練掌握基本的篩選方法(如scikit-learn庫的VarianceThreshold函數(shù)和SelectKBest函數(shù))和稍顯復(fù)雜的基于模型的特征篩選方法(如SelectFromModel)。

使用超參數(shù)搜索的方法來尋找最優(yōu)模型。數(shù)據(jù)科學(xué)家一定得知道GridSearchCV函數(shù)是什么、怎么用。RandomSearchCV函數(shù)同理。要想出類拔萃,你可以用skopt庫中的BayesSearchCV這個函數(shù)來實驗一下,看看怎么將貝葉斯優(yōu)化法運用到超參數(shù)搜索中。

管道機(jī)制。sklearn中的pipeline庫可以幫助你一站式完成數(shù)據(jù)預(yù)處理、特征選擇和建模這些步驟。如果你對pipeline不熟悉的話,那就說明你應(yīng)該加強對建模工具包的學(xué)習(xí)。

原因2: 概率論和統(tǒng)計學(xué)知識

圖片來源:unsplash.com/@johnmoeses

概率論和統(tǒng)計學(xué)方面的知識并不會在數(shù)據(jù)科學(xué)的工作中多帶帶應(yīng)用,但它們是所有數(shù)據(jù)科學(xué)工作的基礎(chǔ)。所以,如果你還沒仔細(xì)研究過下面這些知識的話,那你就很容易把面試搞砸了。

貝葉斯法則。這是概率論的基礎(chǔ),在面試中經(jīng)常出現(xiàn)。你可以練習(xí)一些基礎(chǔ)的貝葉斯“白板”問題,并且閱讀下面這本著作來深刻理解這個法則的含義和來由。

傳送門:http://www.med.mcgill.ca/epid...

基本的概率論知識。你應(yīng)該知道怎么回答下文這些問題。

問題傳送門:https://github.com/kojino/120...

模型評估。在分類問題中,很多新手習(xí)慣以模型的精確度作為衡量標(biāo)準(zhǔn),這樣做通常不是一個很好的選擇。你應(yīng)該習(xí)慣使用sklearn的precision_score,recall_score,fl_score,和roc_auc_score等函數(shù)并了解其背后的理論知識。對于回歸問題,知道為什么用均方誤差(mean_squared_error)而不用平均絕對誤差(mean_absolute_error)也同樣重要,反之亦然。花時間去弄清列在sklearn官方文件中的所有模型評估標(biāo)準(zhǔn)是很值得的。

官方文件傳送門:https://scikit-learn.org/stab...

原因3: 軟件工程小竅門

數(shù)據(jù)科學(xué)家被要求做軟件工程工作的情況越來越多。很多雇主都要求應(yīng)聘者管理好自己的代碼,在筆記本和草稿上留下清晰的注釋。尤其是以下幾個方面:

版本控制。你應(yīng)該知道怎么使用git系統(tǒng),并且能用命令行和自己的GitHub庫遠(yuǎn)程互動。如果你還不能做到的話,建議你從下面這個教程開始。

教程傳送門:https://product.hubspot.com/b...

網(wǎng)頁開發(fā)。有些公司更傾向于將數(shù)據(jù)儲存到自己的網(wǎng)絡(luò)應(yīng)用程序(WebApp)中,或者通過API的形式來訪問數(shù)據(jù)。因此,熟悉網(wǎng)頁開發(fā)的基本知識也很重要,最好的辦法就是學(xué)習(xí)一些Flask框架的知識。

傳送門:https://www.freecodecamp.org/...

網(wǎng)頁抓取。這有點類似與網(wǎng)頁開發(fā):有時候你需要通過從網(wǎng)頁直接抓取數(shù)據(jù),將數(shù)據(jù)采集自動化。BeautifulSoup和scrapy是兩個非常不錯的網(wǎng)頁抓取工具。

清晰簡潔的代碼。學(xué)會字符串的使用。不要濫用行間注釋。將長函數(shù)拆成短函數(shù),越短越好。10行以上的函數(shù)都不應(yīng)該出現(xiàn)在你的代碼中。每個函數(shù)都應(yīng)該清晰地命名,function_1不是一個好名字。在給變量命名時遵循Python語言的規(guī)則,要像這樣like_this,不能像LikeThis或者這樣likeThis。一個Python模塊(.py格式的文件)中的代碼不要超過400行代碼。每個模塊都要有一個明確的目的,比如data_processing.py,predict.py)。學(xué)習(xí)if name == ‘_main_’語句是什么,為什么重要。使用列表解析(list comprehension)。不要濫用for循環(huán)。最后要記得給你的項目附上一個README文件。

原因4:商業(yè)嗅覺

圖片來源:unsplash.com/@emmamatthews

似乎有很多人認(rèn)為只要自己技術(shù)夠硬,就能被心儀的公司錄取。其實不然。事實上,公司更青睞能更快帶來效益的員工。

這就意味著求職者不僅技術(shù)要過關(guān),還要掌握一些其他的技能。

想別人之所想,并付諸行動。大多數(shù)人在沉浸于“數(shù)據(jù)科學(xué)學(xué)習(xí)模式”時,都會遵循一系列步驟:導(dǎo)入數(shù)據(jù)、分析數(shù)據(jù)、清理數(shù)據(jù)、數(shù)據(jù)可視化、建模、模型評估。

如果你是在學(xué)習(xí)一個新的庫或者一項新的技能的話,這些步驟沒什么不好。但在商業(yè)環(huán)境中,這種類似于“無人駕駛”的工作模式是一個不好的習(xí)慣,因為上班時間的每一分、每一秒,你做的每一件事情都是公司在為你買單。你得培養(yǎng)自己的商業(yè)思維,思考怎么妥善安排好自己的時間,為團(tuán)隊和公司做出有意義的貢獻(xiàn)。

這里介紹一個方法,在開始一項數(shù)據(jù)科學(xué)項目之前,先思考一下你要用它達(dá)到一個什么樣的目的,先給自己提幾個問題,這樣你就不會中途被一些所謂的DS工作流(workflow)等無關(guān)的工作打亂思路。把這些問題想得越實用越好,當(dāng)你完成整個項目之后,再回過頭想想這個項目有沒有幫你認(rèn)真回答這些問題。

問對問題。公司希望雇用的員工在調(diào)整工作模式時能夠顧全大局,并思考清楚一些問題。比如,“我現(xiàn)在負(fù)責(zé)的工作是因為它真的對團(tuán)隊和公司有實際幫助,還是因為我能在里面使用我自己喜歡的算法?”或者“我應(yīng)該優(yōu)化哪些重要的商業(yè)指標(biāo)呢?有沒有更好的方法來改善?

將你的成果解釋清楚。管理層需要你來告訴他們哪些商品賣得好,哪些用戶轉(zhuǎn)而使用了競爭者的產(chǎn)品,你得說出個所以然來。但他們不懂(也不屑于去了解)什么是查準(zhǔn)率/查全率曲線,也不知道你為了防止模型過擬合做出了多大的努力。所以,用淺顯易懂的方式來讓你的聽眾明白你做出了什么成果,有什么影響,這也是數(shù)據(jù)科學(xué)家必須具備的一項技能。

你可以找一個從高中開始就再也沒上過數(shù)學(xué)課的朋友,試著一邊做項目,一邊向這位朋友解釋你做的項目是干什么用的。友情提示:解釋的時候不能提到任何算法的名字,有關(guān)調(diào)試超參數(shù)的術(shù)語也不能提,你使用的語言應(yīng)該越簡單越好。

除了上面的原因,還有……

關(guān)于求職被拒的原因,沒有比上述理由更詳盡的了,從筆者目睹的百余個新手?jǐn)?shù)據(jù)科學(xué)家求職和面試指導(dǎo)案例,以及與面試官的溝通結(jié)果看來,70%的人是因為上述理由被拒。

但記著,像性格這種定義比較靈活的東西也可能會被算作考量的標(biāo)準(zhǔn)之一。如果你和面試官不是很合得來,談話進(jìn)行地不是很順利或者很尷尬,就很有可能你的硬實力是夠的,但是面試官覺得你的氣場和公司文化不是很符合。很多技術(shù)大牛也會因這種理由被拒,所以別太放在心上!


留言 點贊 關(guān)注
我們一起分享AI學(xué)習(xí)與發(fā)展的干貨
歡迎關(guān)注全平臺AI垂類自媒體 “讀芯術(shù)”

添加小編微信:dxsxbb
即可進(jìn)入微信交流群

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/45137.html

相關(guān)文章

  • 字節(jié)跳動薪資普降 17% ?看看這屆網(wǎng)友怎么說?

    摘要:號一大早就被字節(jié)跳動薪資普降的消息刷屏了,再看微博知乎,這個消息也已穩(wěn)坐兩大平臺的熱榜前位。通過微博熱搜,我們來看看具體發(fā)生了什么。月日是字節(jié)跳動取消大小周后的首個發(fā)薪日。 9.1號一大早就被字節(jié)跳動薪資普降 17%的消息刷屏了,再看微博知乎,這個消息也已穩(wěn)坐兩大平臺的熱榜前位。 ? 通...

    pubdreamcc 評論0 收藏0
  • 寫給初入門/半路出家的前端er

    摘要:半路出家的前端程序員應(yīng)該不在少數(shù),我也是其中之一。年,馮馮同事兼師兄看我寫太費勁,跟我說對面樓在找,問我要不要學(xué),說出來可能有點丟人,但是在那之前,我真得不知道什么是,什么是。 半路出家的前端程序員應(yīng)該不在少數(shù),我也是其中之一。 為何會走向前端 非計算機(jī)專業(yè)的我,畢業(yè)之后,就職于一家電力行業(yè)公司,做過設(shè)備調(diào)試、部門助理、測試,也寫過一段時間的QT,那三年的時間,最難過的不是工作忙不忙,...

    Cc_2011 評論0 收藏0
  • 7個 HTML 面試題及回答策略

    摘要:接下來,我會檢查每個頁面以確保它使用有用的標(biāo)簽,包括標(biāo)題標(biāo)簽。這個問題讓面試官有機(jī)會了解潛在員工對工作難以勝任的部分。面試官可能需要考慮這種弱點對團(tuán)隊的影響。面試官可能會發(fā)現(xiàn)自己公司的計劃與未來員工的職業(yè)目標(biāo)是否保持一致。 翻譯:瘋狂的技術(shù)宅原文:https://www.indeed.com/hire/i... 本文首發(fā)微信公眾號:jingchengyideng歡迎關(guān)注,每天都給你...

    Luosunce 評論0 收藏0

發(fā)表評論

0條評論

jollywing

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<