NLP 頂級科學家 Manning：深度學習將主導 SIGIR（信息檢索）

Reducto 發布于2019-04-25 18:03 / 3788人閱讀

摘要：于月日至日在意大利比薩舉行，主會于日開始。自然語言理解領域的較高級科學家受邀在發表主旨演講。深度學習的方法在這兩方面都能起到作用。下一個突破，將是信息檢索。深度學習在崛起，在衰退的主席在卸任的告別信中這樣寫到我們的大會正在衰退。

SIGIR全稱ACM SIGIR ，是國際計算機協會信息檢索大會的縮寫，這是一個展示信息檢索領域中各種新技術和新成果的重要國際論壇。SIGIR 2016于 7月17日至21日在意大利比薩（Pisa）舉行，主會于18日開始。

自然語言理解領域的較高級科學家Christopher Manning受邀在SIGIR2016發表主旨演講。

Christopher Manning是斯坦福大學計算機科學和語言學教授，曾在卡內基梅隆大學和悉尼大學任教。Manning關注使用機器學習研究計算機語言難題，比如句法分析，計算機語義學、機器翻譯等，以及使用深度學習解決自然語言理解（NLP）難題。他還是 ACM Fellow, AAAI Fellow，ACL Fellow。

Manning說，信息檢索（IR）和NLP中，有許多問題都是重疊的。IR系統是從理解用戶需要和理解文檔中生成，進而能夠決定某一個文件是否能夠滿足用戶的需要。大多數的NLP做的也是一樣的事：NLP的目的是理解問題和文件的意思，以及關系。

NLP中深度學習方法的應用，為計算機語義理解帶來了一個有效的工具。演講集中在兩個主題：一是NLP怎樣能幫助文本關系理解；二是深度學習如何從根本上實現這一目標。

在這一方面，最成功的工具是新一代的分布式詞語表征：神經詞匯嵌入。然而，除了詞義之外，我們還需要理解怎么分析大型文本的含義。這產生了兩個基本的要求，一個是理解人類語言表達的結構，另一個是分析含義。

深度學習的方法在這兩方面都能起到作用。最終，我們需要理解文本內的關系，能夠處理例如自然語言推理、問答之類的問題。我會繼續關注這些領域的研究，有神經網絡和沒有神經網絡的都關注。

圖片來自微博xiangnanhe

2013年，深度學習在語音上獲得突破；2013年，在計算機視覺上獲得突破；2015年，在自然語言理解上獲得突破。下一個突破，將是信息檢索（IR）。

點擊閱讀原文可獲取Manning演講筆記。

下面是Manning在斯坦福大學關于自然語言理解和深度學習的演講，可以幫助我們更好地理解他所說的深度學習對自然語言理解的幫助。

大會另一場主旨演講 2：Vipin Kumar ：氣候大數據下深度學習的機會與挑戰

大量數據變得可用的背景下，探討機器學習的機遇與挑戰。

此外，本次大會上共接收了62篇完整論文，其中包括谷歌、微軟等大型公司的研究。中國有大量論文被接受，其中包括中科院、華為、百度、人民大學、清華大學、電子科技大學、武漢大學、華中師范大學、華東師范大學等研究機構的論文。

深度學習在崛起，SIGIR在衰退

SIGIR的主席Charlie Clarke 在卸任的告別信中這樣寫到：“我們的大會正在衰退。”在圈內，這其實已經是一個共識，不管是在大會的茶歇間隙還是熱烈的會前討論中，人們都會說到這一現象。

發生了什么？

現在，有人擔心，SIGIR可能不會再吸引那么多的相關的論文。這一種擔心基于下面兩個觀察：

第一個是，2011年提交SIGIR的論文數量達到峰值543篇，但從那之后，就一直在下降。第二個觀察，其他同類會議收到的論文數量依然維持在很高的水平，有一些還出現了增加。

需要強調的是，SIGIR成員觀察到，提交到其他會議的論文，其中不少也提交到了SIGIR。

這意味著什么？

從歷史上看，SIGIR的研究影響范圍很大，其中包括文本分析、計算、機器學習和推薦系統等等。SIGIR的成員擔心，如果收到的論文越來越少，那么可能這些有影響力的論文會在別的會議上發表。

8大可能原因

1. 范圍太過保守

SIGIR 強調 Ad-hoc 搜索、正式的模型和相關的價值。所以，評議員們會在短時間內就為提交的論文貼上“與大會主題無關”的標簽。這么一來，一些帶有新穎創意、技術或者問題的作者就會覺得，SIGIR似乎并不歡迎提交論文。范圍太過保守帶來的機會成本是，會錯過一些相關的趨勢，比如推薦系統和數據科學。

2.標準太高

SIGIR的評議員強調詳盡的實驗，沒有深度分析的文章會被退回。這帶來的影響是：實驗分析或計算較少的作者選擇了別的會議，盡管他們的研究的觀點對于SIGIR社區來說是很有價值的。

3.太多的 IR 會議

SIGIR 雖然是較高級會議，但是還有許多小型的核心會議（CHIIR, ICTIR, ECIR, CIKM) 或者相關會議 ( RecSys, WSDM, WWW, KDD）。許多新的小型會議對SIGIR形成分流。

4.過于強調突破性

許多提交的論文關注于對現狀的改進，但是評議員更看重顛覆性的研究。這樣，可以指出新的研究方向的理論性論文可能會流向別的會議。

5.可復制性

SIGIR 重視實驗的較精確和可復制性，所以一些使用了私有數據的行業性論文難以被接收。行業的研究員更喜歡那些“行業友好”的會議。

6.錯誤的實驗標準

會議只關注一個特定的領域，其他領域受排斥。

7.注冊費太貴

8.大公司研究興趣已經轉到了機器學習和核心數據挖掘

歡迎加入本站公開興趣群

商業智能與數據分析群

興趣范圍包括各種讓數據產生價值的辦法，實際應用案例分享與討論，分析工具，ETL工具，數據倉庫，數據挖掘工具，報表系統等全方位知識

QQ群：81035754

GPU云服務器云服務器科學深度學習深度信息深度學習信息論深度學習信息檢索

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/4372.html

深度學習即將攻陷的下一領域：NLP—ACL2016優秀論文解讀上

摘要：而自然語言處理被視為深度學習即將攻陷的下一個技術領域，在今年全球較高級的學術會議上，我們也看到大量的在深度學習引入方面的探索研究。和也是近幾年暫露頭角的青年學者，尤其是在將深度學習應用于領域做了不少創新的研究。深度學習的出現讓很多人工智能相關技術取得了大幅度的進展，比如語音識別已經逼近臨界點，即將達到Game Changer水平；機器視覺也已經在安防、機器人、自動駕駛等多個領域得到應用。 ...

mengera88 2019-04-25 18:06 評論0 收藏0
深度學習即將攻陷的下一個領域：NLP ACL2016優秀論文解下

摘要：而自然語言處理被視為深度學習即將攻陷的下一個技術領域，在今年全球較高級的學術會議上，我們也看到大量的在深度學習引入方面的探索研究。深度學習的出現讓很多人工智能相關技術取得了大幅度的進展，比如語音識別已經逼近臨界點，即將達到Game Changer水平；機器視覺也已經在安防、機器人、自動駕駛等多個領域得到應用。而自然語言處理（NLP）被視為深度學習即將攻陷的下一個技術領域，在今年全球較高級...

alphahans 2019-04-25 18:06 評論0 收藏0
深度學習在NLP領域成績斐然，計算語言學家該不該驚慌？

摘要：深度學習浪潮這些年來，深度學習浪潮一直沖擊著計算語言學，而看起來年是這波浪潮全力沖擊自然語言處理會議的一年。深度學習的成功過去幾年，深度學習無疑開辟了驚人的技術進展。機器翻譯、聊天機器人等自然語言處理應用正隨著深度學習技術的進展而得到更廣泛和更實際的應用，甚至會讓人認為深度學習可能就是自然語言處理的終極解決方案，但斯坦福大學計算機科學和語言學教授 Christopher D. Mannin...

newsning 2019-04-25 18:12 評論0 收藏0
Deep learning的一些教程

摘要：還有一些以后補充。十分推薦更多的教程斯坦福的公開課教學語言是。加盟百度前，余凱博士在美國研究院擔任部門主管，領導團隊在機器學習圖像識別多媒體檢索視頻監控，以及數據挖掘和人機交互等方面的產品技術研發。轉載自http://baojie.org/blog/2013/01/27/deep-learning-tutorials/ ? Stanford Deep Learning wiki: htt...

SimpleTriangle 2019-04-25 17:58 評論0 收藏0
深度學習如何入門？

摘要：同時推薦閱讀由，和提供的深度學習教程，其中介紹略少一些。自然語言處理的深度學習，另一個斯坦福大學的學者的創始人也是一個很好的課程，可以解決與相關的所有最新的深入學習研究。如果您具有數學和計算機科學方面的工程背景或相關知識的編碼經驗，只需兩個月即可熟練掌握深度學習。難以置信？四步使它成為可能。欲了解更多，請往下看 Step 1: 學習機器學習基礎 (可選，但強烈推薦) 開始于An...

wzyplus 2019-08-16 10:44 評論0 收藏0