摘要:當我的妻子在年前懷孕時,我們進行了超聲波檢查。她進一步告訴我們,他們可以通過羊膜穿刺術查看胎兒實際上是否具有唐氏綜合征的基因改變。但是羊膜穿刺術風險很大,在手術中殺死胎兒的風險大約為。
摘要: Michael Jordan認真的解讀當下的AI到底是什么?
人工智能(AI)是未來的趨勢,這句話是技術人員、學者、記者和風險投資家一致贊同的。如同從技術學術領域跨越到普遍行業的許多詞語一樣,在使用這些詞語的時候都存在很大的誤解。我們這個時代的最想在某種程度上看到了硅片中的智能的出現,它與我們自己的娛樂相媲美,激勵我們并以同樣的方式恐嚇我們。
關于當今的時代,有一種不同的敘述??紤]下面的故事,它涉及人類、計算機、數據和生死決定,但這個故事的重點不在于硅片中的幻想。當我的妻子在14年前懷孕時,我們進行了超聲波檢查。房間里有一位遺傳學家,她指出胎兒心臟周圍有一些白色斑點。這些是唐氏綜合征的標志,她指出,現在你的患病風險已經上升到了1/20。她進一步告訴我們,他們可以通過羊膜穿刺術查看胎兒實際上是否具有唐氏綜合征的基因改變。但是羊膜穿刺術風險很大,在手術中殺死胎兒的風險大約為1/300。作為統計學家,我決定找出這些數字來自哪里。在研究的過程中,我發現一個統計分析,它在英國已經進行了十年,這些反映鈣積聚的白色斑點確實是唐氏綜合癥的預測指標。但我也注意到,在我們的測試中使用的成像機器比英國研究中使用的機器每平方英寸多幾百個像素。我回過頭來告訴遺傳學家,我相信這些白斑可能是假陽性,它們實際上是“白噪聲”。她說:啊,這就解釋了為什么我們這幾年唐氏綜合征診斷的增加了。
我們沒有做羊膜穿刺術,幾個月后出生了一個健康的女孩。但是這一事件讓我感到困擾,我確信全世界每天有成千上萬的人得到這種診斷結果,其中許多人選擇了羊膜穿刺手術,而且一些嬰兒可能也因此造成不必要的死亡。其實這個問題不僅僅與數據分析本身有關,而且與數據庫研究人員稱之為“來源”的問題有關。
作為一名計算機科學家,我首先想到的是建立一種推理和決策系統所需的原則,將計算機科學與統計學相結合,來解決一些現實中存在的問題。不僅在醫療領域,而且要在商業、交通和教育等領域,這些原則的發展至少與建立AI系統的原理一樣重要。
無論我們是否能夠接受“智能”,我們??都面臨著一個現實:人工智能正在改變我們的生活。盡管有些人認為這是屈從于“人工智能”的創造,但也可以用更溫和的方式去看待它,把它當稱一個新的工程分支一樣。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是收集幾個關鍵思想的力量,為人們帶來新的能力,并且安全地做到這一點。鑒于土木工程和化學工程建立在物理和化學之上,相應的這個人工智能是建立在過去的給予的基礎上-——“算法”、“數據”等等。
不幸的是,我們并不善于預測下一個正在出現的嚴重缺陷。我們缺少的是一個具有分析和設計原理的工程學科。
目前關于這些問題的公開對話過于頻繁地使用“AI”作為智能通配符,這使得很難推斷新興技術的范圍和后果。所以請讓我們從更仔細地考慮最近和歷史上用“AI”來指稱什么。
今天大多數被稱為“AI”的東西,特別是在公共領域,都被稱為“機器學習”(ML)。在過去的幾十年里,ML是一個算法領域,它將來自統計學、計算機科學和許多其他學科的想法融合在一起,設計算法來處理數據,做出預測并幫助做出決定。就對現實世界的影響而言,ML是真實的。事實上,ML在20世紀90年代初期就變得非常清晰了,到世紀之交,亞馬遜等具有前瞻性的公司已經在他們的業務中使用了ML,從而解決了欺詐行為中的關鍵任務:后端問題檢測和物流鏈預測以及建立創新的面向消費者的服務,如推薦系統。隨著數據集和計算資源在接下來的二十年中快速增長,很明顯,ML不僅為亞馬遜服務,任何公司的決策都開始與ML相關聯。“數據科學”這個短語開始被用來指代這種模型,反映了ML算法專家需要與數據庫和分布式系統專家合作建立可擴展的、強大的ML系統。
從歷史上看,“人工智能”這個詞在1950年代后期被創造出來,指的是在軟件和硬件中實現具有人類智能的實體的強烈愿望。我們使用“模仿人類智能”一詞來指代這一愿望,強調人工智能實體似乎應該是我們中的一員,至少是在精神上或者身體上。雖然運籌學,統計學,模式識別,信息論和控制論等相關學術領域已經存在,并且常常受到人工智能的啟發,但這些領域可以說是集中在“低層次”信號和決策上。比如松鼠能夠感知它所居住的森林的三維結構,并在其分支之間跳躍,對這些領域是鼓舞人心的。“人工智能”旨在集中精力于不同的事物,例如:人類“理性”和“思考”的“高級”或“認知”能力。然而,60年后,高級推理和思想仍然難以捉摸。目前被稱為“人工智能”的發展主要出現在與較低級別模式識別和運動控制相關的工程領域以及統計學領域,主要側重于找到數據模式并進行有根據的預測,假設和決定的測試。
事實上,20世紀80年代早期由David Rumelhart發現的著名的“反向傳播”算法,現在被視為所謂“AI革命”的核心,最早出現在20世紀50年代的控制理論領域和20世紀60年代,其早期應用之一是優化阿波羅太空船在朝向月球時的推力。
自20世紀60年代以來,人工智能取得了很大進展,但它可以說并不是來自追求人性化模擬人工智能。相反,就像阿波羅太空船一樣,這些想法常常隱藏在幕后,盡管對公眾不可見,但文檔檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社交網絡分析、診斷A / B測試等領域的研究和系統建設取得了重大成功。
人們可以簡單地同意將所有這些稱為“AI”,但這樣的標簽可能會讓統計學研究人員感到意外,這些研究人員醒來時發現自己突然被稱為“人工智能研究人員”。過去二十年間,訓練AI的愿望通常被稱為“智能增強”(IA),主要是使用計算和數據來創建增強人類智慧和創造力的服務。搜索引擎可以被看作是IA的一個例子(它增加了人類的記憶和事實的知識),自然語言翻譯(它增強了人類溝通的能力)也是如此?;谟嬎愕穆曇艉蛨D像生成可以作為藝術家的調色板和創意增強器。雖然這種服務可能涉及高層次的推理和思想,但目前他們不這樣做,相反他們大多執行各種字符串匹配和數字操作,捕獲人類可以使用的模式。
讓我們廣泛構思“智能基礎設施”(II)學科,即存在一個計算,連接數據和物理實體網絡,使人類環境更具有支持性、趣味性和安全性。這種基礎設施開始在交通,醫藥,商業和金融等領域出現,對個人和社會有著巨大的影響。它有時出現在關于“物聯網”的討論中,但是這種想象通常指的是僅僅是將“事物”帶到互聯網上的過程,而不是與能夠分析這些“事物”。
例如,我們可以想象將我們的生活置于一個“社會規模的醫療系統”中,它建立數據流和數據分析流程,位于人體內和周圍的醫生和設備之間,從而能夠幫助人類診斷和提供護理。該系統將納入身體細胞、DNA、血液檢測、環境、群體遺傳學和關于藥物和治療的大量科學文獻的信息。它不僅僅關注單個病人和醫生,還關注所有人類之間的關系 ,就像現在的醫學檢測允許在一組人類(或動物)上進行的實驗。這將有助于保持相關性、可靠性。而且,人們還可以預見到這樣一個系統出現的許多問題:涉及隱私問題、責任問題、安全問題等,這些問題應該被視為挑戰,而不是阻礙者。
我們現在遇到了一個關鍵問題:模擬古典人性化人工智能是面臨這些更大挑戰的最佳選擇還是唯一方法?事實上,最近最受歡迎的ML的成功案例就是人類模仿AI相關的領域,如計算機視覺、語音識別、機器人等。這里有兩點需要說明,首先,盡管人們不會從閱讀報紙中得知它,但人造模擬人工智能的成功實際上是有限的,我們距離實現人性化模擬AI還很遙遠。不幸的是,在仿人工智能AI方面進展甚微的情況下,出現過度夸贊和媒體關注的水平,這在其他工程領域并未出現。
其次,更重要的是,這些領域的成功既不足以解決重要的IA和II問題。為了實現自動駕駛汽車這樣的技術,需要解決一系列工程問題,這些問題可能與人力資源關系不大。整個交通系統(一個II系統)可能會更像目前的空中交通管制系統,而不是目前收集的松散耦合的、不具有前瞻性的人類駕駛員技能信息。因為它比當前的空中交通管制系統復雜得多,特別是在使用大量數據和自適應統計建模來決策時。(地面交通的情況要比空中更負責)
我們不難確定II系統中的算法和基礎設施挑戰,這些并不是人類模仿AI研究的核心主題。II系統需要管理分布式知識庫,這些而且知識庫正在迅速變化,并且可能會在全球范圍內不連貫。這些系統必須在做出及時的分布式決策時應對云端相互作用,并且他們必須處理長尾現象,因為我們不具有大量的個人數據。他們必須解決跨行業和競爭性界限分享數據的困難。最后,特別重要的是,II系統必須將諸如激勵和獎勵之類的經濟理念帶入統計和計算基礎設施領域,這些基礎設施將人與對方以及有價物品聯系起來。諸如音樂,文學和新聞等領域正在呼吁出現這樣的市場,數據分析將生產者和消費者聯系起來。這一切都必須在不斷演變的社會,道德和法律規范的背景下完成。
當然,經典的人造仿真AI問題仍然值得關注。然而,目前的重點是通過收集數據進行人工智能研究,部署“深度學習”的基礎設施,以及模仿某些狹義定義的人類技能的系統演示問題。這些問題包括:需要將意義和推理引入進行自然語言處理的系統中,需要推斷和表示因果關系,需要開發計算上易于處理的不確定表示,以及需要開發制定并追求長期目標的系統。
IA也是相當重要的,因為在可預見的將來,計算機將無法與人類相匹配地抽象描述現實世界的情況。我們需要經過深思熟慮的思考和計算機互動來解決我們最緊迫的問題。我們希望計算機能夠觸發新的人類創造力水平,而不是取代人類的創造力。
John McCarthy創造了“人工智能”一詞,顯然是為了區分他的新興研究議題與諾伯特維納的研究議題。維納創造了“控制論”來指代他自己的智能系統愿景,這一愿景與運籌學、統計學、模式識別、信息論和控制理論密切相關。很顯然,今天的“人工智能”的熱度遠遠超過了“控制論”。但我們需要超越麥卡錫和維納的特定歷史觀點。
我們需要認識到,目前關于人工智能的公眾對話(側重于狹隘的行業子集和狹窄的學術子集),可能使我們面臨AI、IA和II所帶來的挑戰和機遇的風險。
這個風險不是關于實現科幻夢想或超人類機器的噩夢,更多是關于人類理解和塑造技術的需求,因為它在日常生活中變得更加現實和有影響力。此外,在這種理解和塑造中,需要來自各行各業的不同聲音,而不僅僅是技術上的對話。
雖然行業將繼續推動技術發展,但學術界也將繼續發揮重要作用,不僅在提供一些最具創新性的技術理念時,而且來自其他學科的研究人員的觀點也非常重要,特別是社會科學、認知科學和人文科學。
而且,我們應該接受這樣的事實:我們正在創建一個新的工程分支?!肮こ虒W”這個術語通常在狹義上被引用,在學術界它通常指的是帶有冷酷無情的機器的泛指,以及人類失去控制的消極內涵。
但,在當今時代,我們有一個真正的機會來設想一些歷史上的新事物 - 一個以人為中心的工程學科。
本文由@阿里云云棲社區組織翻譯。
文章原標題《the-fall-of-rnn-lstm》,
譯者:虎說八道,審校:袁虎。
詳情請閱讀原文
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19732.html
摘要:近期,機器學習領域專家們關于深度學習的一些言論引起了極大的轟動。近來,深度學習由于其在模式識別方面的巨大作用激起了人們的廣泛興趣。綜上所述,當前的深度學習主要完成的是對大數據的分類和預測。 近期,機器學習領域專家們關于深度學習的一些言論引起了極大的轟動。同時,關于深度學習的開創性和整體架構也在學術界引發了相當的討論。伴隨著人工智能開始進入進一步開發應用階段,人們意識到它的成功與否完全取決于其...
摘要:同為美股,百度截至月日的第一季度財報顯示,第一季度百度總營收億元約合億美元,營業利潤億元約合億美元。這樣一來,難怪此前有言論說京東和螞蟻金服要超過百度的市值,百度對比阿里和騰訊確實符合掉隊論的邏輯。而關于百度的掉隊原因,我認為主要有兩點。當中國互聯網的增速逐漸放緩,BAT 三巨頭也受到越來越多人的質疑。前段時間,因質疑騰訊的持續增長能力,騰訊股價大跌。僅過去一年內,騰訊就已經跌掉超過一萬億元...
摘要:而平心而論,多數程序員是沒有時間和精力再去拿起數學概率,再去看全英文的業界論文,然后研究三五年,出一個成果,因為產出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業界成熟算法,結合行業產業需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
摘要:而平心而論,多數程序員是沒有時間和精力再去拿起數學概率,再去看全英文的業界論文,然后研究三五年,出一個成果,因為產出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業界成熟算法,結合行業產業需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
摘要:而平心而論,多數程序員是沒有時間和精力再去拿起數學概率,再去看全英文的業界論文,然后研究三五年,出一個成果,因為產出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業界成熟算法,結合行業產業需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
閱讀 1123·2021-11-24 09:39
閱讀 3623·2021-09-02 15:21
閱讀 2161·2021-08-24 10:01
閱讀 722·2021-08-19 10:55
閱讀 2447·2019-08-30 15:55
閱讀 1212·2019-08-30 14:16
閱讀 2992·2019-08-29 15:17
閱讀 3235·2019-08-29 13:53