国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

三年前,我差點成了爬蟲大師

Codeing_ls / 3394人閱讀

摘要:期間,我從爬蟲入手,一路摸爬滾打,實現了千萬級微博評論自動抓取,在即將成為爬蟲專家前,受師兄指點轉向算法。確定研究方向經過前面的理論學習,你應該發現深度學習領域有很多細分方向,例如語音自然語言處理視覺強化學習純深度學習理論。

最近很多剛入學的學弟學妹給我們留言,聽說算法崗現在競爭很激烈,還能轉機器學習嗎?實習對于找工作重要嗎?

看完他們的疑問,三年前的經歷在我眼前歷歷在目。

研一修完畢業學分后,我去創業公司實習了一年。期間,我從爬蟲入手,一路摸爬滾打,實現了千萬級微博評論自動抓取,在即將成為“爬蟲專家”前,受師兄指點轉向DL算法。

下面我以「就業」為導向,分享一條親身經歷的學習路線。參考這個方法,在深度學習方向拿到offer進大廠,不是啥難事兒。

一、研一:基礎理論學習

研一的主要工作是學理論,打基礎。

然鵝學校的課程基本屬于科普講座,很多內容僅靠上課是遠遠不夠的。

這里我把第一年的學習任務細分了4個方向。

1)深度學習理論

基礎不牢,地動山搖。沒有扎實的基本功,無論是做科研還是做項目,都很容易捉襟見肘。

那怎樣學習效率最高呢?

如果你覺得看大頭書很枯燥(比如《深度學習》花書),我推薦你直接看吳恩達和李宏毅老師的深度學習視頻課。

內容既權威又有趣,看完會讓你覺得學習簡直是一天中最快樂的事!

這些網課都有配套的編程練習,學一課做一課,養成好習慣,及時查漏不缺。

看完視頻,如果想檢測一下自己的學習效果,推薦你參考我在知乎的一篇回答,看看第一部分“理論基礎”問題,自己能輕松解答多少。

如果你是面試官,你怎么去判斷一個面試者的深度學習水平?[1]

例如了解前向傳播反向傳播,以及鏈式求導;給一個兩層的MLP和簡單的二維向量,能推導出 forward propagation,再用 chain rule 推導出 back propagation。

2)確定研究方向

經過前面的理論學習,你應該發現深度學習領域有很多細分方向,例如語音、自然語言處理、視覺、強化學習、純深度學習理論。

所以第二步我們要明確自己的研究方向,并在之后兩年的學習中有所突破。

如果你喜歡語音交互,熟悉C++,可以選擇語音識別、語音合成等研究課題;

如果你喜歡研究文本和對話,熟悉Python和爬蟲,可以選擇自然語言處理方向;

如果你喜歡圖片與視頻,熟悉Python,對算法落地也很感興趣,可以選擇計算機視覺方向;

至于強化學習、深度學習理論研究等方向,如果不是自身基礎非常扎實或有優秀的師兄師姐指導,建議謹慎入坑。

這一步大家不要著急,既要了解不同方向,更要認真了解自己,包括能力、性格、特質。如果對自己研究領域沒有熱愛和興趣,到了中后期會非常痛苦,即便再換方向,沉沒成本也會很高。

好比讓你挑一道菜吃十年,什么才會是你的首選呢?

3)閱讀經典論文

選好方向之后,下一步的重點是閱讀該領域的經典論文,包括傳統方法,以及近期熱點。

如果你和我一樣主攻自然語言處理方向,那應該對最早期的神經網絡語言模型(2003)、靜態詞向量word2vec(2013)、動態詞向量ELMO(2018)、預訓練語言模型BERT、RoBerta、GPT(2018-2020),以及近期流行的prompt訓練(2021)都有清晰的認識,明白哪些場景適用哪種方法。

然后再往下細分,選擇子領域內的論文閱讀。

如果研究對話系統,對于常規的分類、匹配算法應該非常熟悉,同時了解基于神經網絡的DST算法,不同召回策略等等。

還不知道怎么搜論文的同學,這里教你兩種萬能搜索方法。

1. 正向檢索

在谷歌學術、arxiv、ACL Anthology輸入英文關鍵詞,檢索相應主題的paper,注意查看發表年份和引用數量。

或者直接查找近年的survey文章,在綜述中查看主要的研究分支和related work。

2.反向檢索

在谷歌學術的搜索結果頁面,點擊某一篇論文的“被引用次數”,跳轉進入引用了該論文的所有paper。

底層邏輯是引用了A論文的其他論文,基本都和A論文所屬的研究領域一致。

這兩種檢索方法,可以大幅提高查找文獻的效率。

4)強化一門主流編程語言

通過以上3步,我們已經具有了相對系統的理論基礎。然而“巧婦難為無米之炊”,有idea卻無法通過編程實現,還是白搭。

所以接下來,我們要給軍火庫增添幾樣重型武器,包括一門主流編程語言(深度學習一般用Python),深度學習框架(推薦Pytorch),服務器調用(Linux指令),IDE使用(Pycharm或Vscode+jupyter?lab)等。

有了這些工具,開發深度學習項目會方便很多。

而且從目前大家都在卷的情況看,coding已是基本功,是技術崗通過面試的底線。

一邊學習,一邊每天在leetcode上刷1~2道算法題,校招找工作會事半功倍。

進入研二,大家可選的路更多了。有的同學繼續在實驗室從事科研,以做實驗發paper為目標,有的同學已經走出校園開始提前實習。

這兩種選擇沒有好壞,關鍵要適合自己。最怕每天窩在宿舍吃外賣打游戲,畢業只多了張文憑。

二、科研與學術

有些同學是主動從事科研的,例如我身邊就有本科發表頂會,碩士畢業已手握6-7篇CCF-A一作的巨佬。

也有導師不放實習,“被迫”滯留實驗室的同學。研二時的我就屬于這一類,雖然拿到了大廠實習offer,又被勸退重回學校搞科研。

總的來說,做科研四分靠實力,三分靠努力,還有三分天注定。

實力首先指理論扎實,具有敏銳的學術嗅覺,懂得挖掘idea;英語閱讀、寫作過關,用詞地道,知道怎樣寫paper容易中稿;同時編程強悍,能快速迭代實驗,驗證結果。

有同學可能某方面薄弱些,可以通過大三大四以及研一研二的努力來彌補。

即便手握七成概率,paper能否中稿還和評審人的口味等“隨機因素”相關,有一定運氣成分。

所以做科研挺有風險的,如果忙活了2-3年沒中論文,碩士生涯幾乎等于nothing。

之前聽一位985師兄說,他們實驗室有50多個深度學習方向的博士,每當夜深人靜之際,經常能聽到博士宿舍樓傳來哭聲(科研壓力太大,沒有達標數量的paper畢不了業)。

甚至還有博士生在實驗室做實驗,做著做著就哭了。

三、項目與實習

相比之下,在互聯網公司找到一份實習要容易很多。

雖然內卷天天有,但只要研一沒摸魚,研二進一家第一第二梯隊的大廠一般問題不大。再不濟,也能去偏頭部的創業公司。

在公司實習,主要是積累項目經驗,把之前學習的理論落到實處。同時提前了解公司的管理流程、開發部署環境等等。

實習經歷將會是簡歷的一大亮點,越來越多大廠開始更加重視實習。一段充沛的實習經歷(3個月以上)絲毫不遜色于發表一篇頂會論文。

這是我導師部分碩士的畢業去向,有很多學術大佬,他們也會提前去公司實習。有的順利轉正,有的跳槽拿了更好的offer。

如上,走大廠實習轉正是拿到校招offer的很好選擇。部分大廠(如阿里)很多hc很早就預定給實習生轉正了,走常規秋招難度要大很多。

如果想實習導師卻不放人,建議提早和導師溝通協調。如果只能留在實驗室,趕緊看看有沒有靠譜的項目,能提供指導的師兄師姐。

如果導師放養,又不讓實習,還不給機器,那兄弟你只能自求多福了!

四、總結

研究生2-3年的時間非常短,如果熱愛學術,想要對整個研究領域產生個人影響,建議先出門右拐讀個博。

另外,深度學習也沒有想象中的那么高大上。大部分業務導向的算法崗,很多時候在和數據分析打交道、跟各個部門對齊需求,真正讓你訓模型跑實驗的比例其實很低。

在工業界,模型是否新穎不是最重要的,通過A/B測試,驗證算法能給公司真正帶來經濟效益才是關鍵。

為什么還有那么多同學反饋算法面試好難呢?

因為僧多粥少,除了計算機,還有各個專業的同學一起往里卷,門檻自然水漲船高。因而有了“面試造火箭”的說法,公司也正好通過面試刷掉一批想渾水摸魚的人。

從這個角度看,提早選擇開發崗也是一種不錯的折中。開發崗需求大,和算法的薪資差距也越來越小。

不管選擇什么,認真了解自己,適合自己的才是最好的。

千淘萬漉雖辛苦,吹盡狂沙始到金。

無論什么崗位,成長、薪水、福利都是和付出成正比的。只有自己努力,才能在研究生階段學有所成,收獲滿意的offer!

- END -

覺得還不錯就給我一個小小的鼓勵吧!

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/119992.html

相關文章

  • selenium 自動化爬蟲 5分鐘爬取新浪李敖大師1751條微博.

    摘要:是一個瀏覽器自動化測試框架可以模擬用戶的所有操作很久以前就想把李敖大師的所有微博爬取下來一直沒空前天看見群里有人推薦和就學了做了個你們想爬別人的只要把李敖大師的地址換成你要的就行了我還沒學不過我猜他就是去掉功能的瀏覽器這樣可以讓爬蟲更快如果 selenium 是一個瀏覽器自動化測試框架.可以模擬用戶的所有操作. 很久以前就想把李敖大師的所有微博爬取下來.一直沒空,前天看見群里有人推薦s...

    zhichangterry 評論0 收藏0
  • Evil Python

    摘要:用將倒放這次讓我們一個用做一個小工具將動態圖片倒序播放發現引力波的機構使用的包美國科學家日宣布,他們去年月首次探測到引力波。宣布這一發現的,是激光干涉引力波天文臺的負責人。這個機構誕生于上世紀年代,進行引力波觀測已經有近年。 那些年我們寫過的爬蟲 從寫 nodejs 的第一個爬蟲開始陸陸續續寫了好幾個爬蟲,從爬拉勾網上的職位信息到爬豆瓣上的租房帖子,再到去爬知乎上的妹子照片什么的,爬蟲...

    Turbo 評論0 收藏0
  • Python貓薦書系列:文也深度學習,理也深度學習

    摘要:本期貓薦書欄目系列之六,就以此為話題,推薦給大家兩本書它們都叫深度學習,但是內容很不一樣。事實上,第一本書被很多人譽為深度學習的圣經,知名度極高,有一個昵稱叫作花書。 最近出了兩件大新聞,相信大家可能有所耳聞。 我來當個播報員,給大家轉述一下: 1、中國隊在第 11 界羅馬尼亞數學大師賽(RMM)中無緣金牌。該項賽事是三大國際賽事之一,被譽為中學奧數的最高難度。其中一道題,令中國隊全軍...

    LuDongWei 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<