摘要:不過,深度學習并不是人類可以創(chuàng)造的完美人工智能科技的終點。深度學習的公正性并非來自其自身,而是人類篩選和準備的深度學習數(shù)據(jù)。深度學習給出的是非自然合法語言解釋的結(jié)果。
現(xiàn)在每一個人都正在學習,或者正打算學習深度學習,它是目前人工智能諸多流派中興起的一個。各個年齡階段的數(shù)十萬人都在學習著免費和收費的深度學習課程。太多的創(chuàng)業(yè)公司和產(chǎn)品的命名以“深度”開頭,深度學習已然成了一個流行語,但其真正的落地應用實際上卻很少。絕大多數(shù)人忽略了一個事實:深度學習只占機器學習領域的1%,而機器學習又只占人工智能領域的1%。而實際中的絕大多數(shù)任務則是用余下99%的知識技術來處理的。一個“只會深度學習的專家”并不是“人工智能專家”。
深度學習并不是人工智能的同義詞!由于谷歌、Facebook等巨頭公司宣傳人工智能工具時主要談的就是深度學習,甚至只談深度學習,因此大眾誤以為所有的人工智能新的篇章都(將)由深度學習書寫。然而,真實情況并非如此。決策樹算法,比如 XGBoost沒有成為頭條,卻在很多Kaggle表格數(shù)據(jù)競賽中默默地擊敗了深度學習。媒體暗示AlphaGo的成功全部歸于深度學習,但實際上它是蒙特卡洛樹搜索+深度學習,這表明深度學習單槍匹馬很難取勝。很多強化學習的任務是通過神經(jīng)進化的 NEAT 算法(通過增強拓撲的進化神經(jīng)網(wǎng)絡)得到解決的,而不是反向傳播算法。人工智能領域存在著“深度誤傳”。
與100+國內(nèi)外技術專家探索2017前瞻熱點技術
我并不是說深度學習沒有解決問題:它令人印象深刻。樹和其他算法并沒有完勝深度學習,并且在某些任務上深度學習無法被取代,但是我希望未來一些非深度學習系統(tǒng)可被(重新)發(fā)現(xiàn)以擊敗深度學習。或許能解釋目前深度學習決策的黑箱問題。同樣我也希望能讀到探討“災難性遺忘”問題的深度學習文章,它是指在學習新知識時快速遺忘先前已學習知識的傾向,并且需要每天對抗“過擬合”。關于“智能”:深度學習會簡單相信所給的訓練數(shù)據(jù),而不去理解什么是真或假、現(xiàn)實或想象、公平或不公。人類也會誤信假新聞,但只是在某種程度上,甚至孩童都知道電影是虛構的,不是真實的。想了解更多內(nèi)容可以閱讀這篇文章:《人工智能(深度學習)的簡單解釋》。
20 年前,每個人都在學習 HTML,這個手動編寫網(wǎng)頁的標記語言當時被認為足以成就一個互聯(lián)網(wǎng)億萬富翁。和其他人一樣,我學習了每一項看起來有用的技術,如 HTML、移動app和深度學習,并且我希望大家在今后的人生都一直學習新事物。事實上,你一生中不能只學習一項技術。即使你學習了深度學習,你也不會一輩子了解人工智能。1995 年 HTML 開始過時,無法滿足需求,取而代之的是 CSS、Java 和服務器語言。同樣地,深度學習有一天也會過時,并且無法滿足需求。現(xiàn)在大多數(shù)流行的手機 APP 根本用不到 HTML,那么誰又會知道未來的人工智能APP是否用得到深度學習呢?
不過實際上,深度學習是 1980 年代的技術,比HTML還老:由于有了更多的訓練數(shù)據(jù),1970 年代的“帶有隱藏層的神經(jīng)網(wǎng)絡”得到了更好的結(jié)果,被重新命名為深度學習,之后被大肆炒作。1992年我簡要地查看了一些神經(jīng)網(wǎng)絡的源代碼,以及分形算法和細胞自動機。正如絕大多數(shù)人一樣,當時我并沒有選擇深度學習,只是把它當作毫無實際價值的學術數(shù)學難題。相反,我重點學習視頻游戲的 3D 技術、互聯(lián)網(wǎng)技術等等,因為它們可以即刻獲得結(jié)果。但是我們都錯了,深度學習借助大數(shù)據(jù)可以大有作為!2015 年的 Deep Dream 簡直令我著迷,接著是GAN等等。不過,深度學習并不是人類可以創(chuàng)造的完美人工智能科技的終點。
數(shù)十年來,“古老”的深度學習技術已被廣泛研究和更新以更準確地解決更多任務,但是沒有一個深度學習網(wǎng)絡結(jié)構(卷積、RNN、RNN + LSTM、GAN 等)可以解釋其自身的決策。無疑深度學習在未來還會解決更多的問題,取代更多的工作,但不太可能解決所有的問題,或者保持驚人的進步以對其所作決定的公正性進行合理的解釋。
深度學習無法理解哲學家柏拉圖與亞里士多德。
未來人工智能應探索其他的新方法,或者被忽視的舊方法,而不僅僅是深度學習。深度學習的一個局限是把數(shù)據(jù)中最常見的內(nèi)容作為真理,把統(tǒng)計學上較稀少、或與較常出現(xiàn)的內(nèi)容相反的東西看作謬論。深度學習的公正性并非來自其自身,而是人類篩選和準備的深度學習數(shù)據(jù)。深度學習可以閱讀并翻譯文本,但不是以“人類的方式”。如果使用超過100本書訓練深度學習模型:40本書告訴它仇恨、戰(zhàn)爭、死亡和摧毀如何是壞的,60本書告訴它希特勒的納粹思想是好的,那么該模型最終會成為100%的納粹!
如果在訓練數(shù)據(jù)集中納粹主義是最流行的觀點,深度學習靠自己永遠無法明白為什么殺害猶太人、同性戀以及殘疾人是錯誤的。難怪深度學習無法解釋其自身決策,除了最簡單的:“我(深度學習)讀到最多的是‘納粹主義是正確的’,因此它應該是正確的”。深度學習將會學習并模仿最具缺陷的邏輯而不去思考它的缺陷,包括恐怖主義。甚至孩童都可以自己明白電影中哪個家伙是壞人,但是深度學習做不到,除非人類首先明確教導它。深度學習中有些東西很酷,比如帶有反向傳播的梯度下降,以及自定義的深度學習硬件,但這大多來自統(tǒng)計學和幾何學,很可能不會出現(xiàn)在 2037 年的人工智能時代。
對很多任務來說,深度學習人工智能正在或者將會變成違法的、不被社會所兼容的。**2018年5月25日起,公司或個人在收集 28 個歐洲國家公民數(shù)據(jù)時應遵循《一般數(shù)據(jù)保護條例》(GDPR)。屆時歐洲的一些APP將被禁止使用深度學習,這導致AI初創(chuàng)公司拼命尋找深度學習的替代方案,否則將面臨罰款的風險。罰款金額為全球營收的4%,包括美國部分。關于自動化決策的GDPR要求深度學習具有解釋其決策的能力,以及防止基于種族、觀點、健康等歧視現(xiàn)象的發(fā)生。**類似于GDPR的法律正在全球范圍內(nèi)制定,這只是時間問題。《美國公平信用報告法》要求披露所有對消費者信用評分產(chǎn)生不利影響的因素,最多只允許有4個。深度學習的因素可謂海量,而不僅僅是4個,如何將其簡化為4個呢?人工智能,正如比特幣ICO,開始忽視法規(guī),但是法律與懲罰總會降臨。
如果深度學習系統(tǒng)的工作是采取更多相關決策,而不是簡單區(qū)分一張圖像是否是貓,或者在自拍的哪部分添加兔耳,它們將會被非深度學習系統(tǒng)取代。人工智能必須是負責任的,可以使用簡單、合法有效的語言向法官和用戶解釋其輸出結(jié)果,這與深度學習大不相同。深度學習的復雜性,對法官和用戶來說就像是“魔術”,這是一種法律風險,而不是一個很酷的未來。深度學習將會建議或警示人類,比如從醫(yī)療圖像中檢測疾病,并獲得醫(yī)生的驗證,但這只是缺乏細節(jié)的部分自動化。面對被人工智能拒絕、并尋求解釋的人們(例如工作、貸款被拒絕等),我們能說什么呢?
法律包含“解釋權”,比如為什么工作或貸款被拒絕。深度學習給出的是非自然(合法)語言解釋的結(jié)果。深度學習的代碼容易獲得,卻不為法官或用戶所接受,因為即使較好的數(shù)學家或其他算法也無法搞明白它,或者將模型簡化成可以理解的語言。即使最后的決策是由人類做出的,人工智能工具也應給出詳細的理由,人們可以認為它是錯的(然后無視、推翻人工智能的決定),或者通過簡單的復制、粘貼并且簽署人工智能給出的解釋來快速接受。沒有人知道如何修改深度學習以給出簡單到人類可理解的解釋,因此深度學習不可能做到完全與我們的要求相符!這一問題同樣影響到了若干其他人工智能和機器學習算法,但不像深度學習受影響那么嚴重。比如,如果決策樹算法變成提升樹或集成樹,它也會變得不可解釋。但是未來,可能會出現(xiàn)或發(fā)現(xiàn)能為自己的決策辯護的新的人工智能,它們將會在常規(guī)決策中取代深度學習和人類的位置。
在GDPR規(guī)定的情況中,只有人類職員可以拒絕申請:人工智能可自動化完成積極的結(jié)果,否則,如果它拒絕了一項貸款、工作等,就應該將這項任務交給人,讓人工來處理這些會讓用戶感到生氣或者要追究的消極結(jié)果。但是在拒絕的情況下,人類將不會從基于深度學習的人工智能中獲得幫助或解釋,他們不能獲知深度學習的邏輯是否正確。他們需要自己從頭檢查數(shù)據(jù),以決定是否最終拒絕,并且要為這個決定寫一份合理的解釋。此舉風險在于為了節(jié)約時間和成本,人類員工會為人工智能的拒絕決定編造假的解釋,并盲目接受人工智能的認可。但是決定人工智能給出拒絕決策的公平性的法官會詢問為什么別人的被接受了,并且進行對比。安全起見,無論類似GDPR的法規(guī)是如何規(guī)定的,對于接受和拒絕,你都要有充足的理由。非深度學習的人工智能系統(tǒng)將最終成為被人類所采用的系統(tǒng),它們會把所有決策的解釋提供給用戶、法官和支持人員,不論是完全或部分自動化的決策。
在法律和深度學習之前,解釋性已經(jīng)是一個大問題。在反壟斷案例中,谷歌等公司被質(zhì)問為什么是這個產(chǎn)品而不是其他產(chǎn)品出現(xiàn)在搜索結(jié)果的第一個。下面也是深度學習出現(xiàn)之前的事:很多其他的算法同樣以瘋狂的方式混合數(shù)據(jù)以得到結(jié)果,因此沒有哪個人可以輕易地重構出決策原因。法官被告知:工程師并不了解詳情,以及被當作證據(jù)的幾頁線性代數(shù)。這樣不會有好結(jié)果:甚至在特定的法律存在之前,多個案例承擔著數(shù)十億美元的罰款,收到要更變系統(tǒng)的警告。被自動拒絕了工作、貸款、退款的用戶集體起訴商店、銀行或保險公司的自動決策單元,將會變成常態(tài),所以無法解釋便意味著“無以辯護”、被罰款以及一場品牌公關災難。
對大部分人來說,“人工智能”意味著科幻電影中能夠給出聰明解釋的人工智能,電影中人類可以快速決定自己是否同意,這樣易于進行法律驗證。大多數(shù)聽到公司是“人工智能第一位”或“增加人工智能”的人,包括法官和撰寫《一般數(shù)據(jù)保護條例》(GDPR)等法律的人,都會期待和電影中一樣的“人工智能”,即如果被法院傳召,它能夠捍衛(wèi)自己的決定,這令用戶和法官都印象深刻。然而我們得到的是無法解釋的“深度學習人工智能”,僅僅因為其缺乏可解釋性,這些人工智能即使在它們能夠解決的問題上也不會經(jīng)常得到使用。深度學習無法節(jié)省成本,也不會取代那些需要敏銳的自動決策的工作。即使在人類必須作出最終決策的情況下,人工智能工具能夠解釋自己的建議,也比它不給出理由就做出回應更加可取。可解釋的人工智能一旦被(重新)發(fā)現(xiàn),將會更加安全、合法、廉價、快速,并且取代深度學習和人類。深度學習在 20 世紀60到80年代發(fā)明,而到2010年才重新被發(fā)現(xiàn),或許未來可解釋的人工智能基礎也已經(jīng)被某些研究者描述出來,但是由于不是深度學習,所以可能在許多年內(nèi)都沒人關心和開發(fā)該類型的人工智能,直到它們被重新發(fā)現(xiàn)和炒熱。
關于自動決策的GDPR也需要防范基于種族、意見、健康狀況等產(chǎn)生的歧視。但是使用用戶生成的數(shù)據(jù),如社交媒體和新聞(而不是真實的數(shù)據(jù),例如醫(yī)療或財務記錄)訓練的深度學習模型通常暗含邪惡的偏見。如前所述,深度學習可以讀取大量文本和數(shù)據(jù),并模仿其內(nèi)容,但無法批判性地理解內(nèi)容。深度學習只相信它在數(shù)據(jù)中頻繁看到的事物、底層模式和趨勢,因此它會放大人類社會的偏見和問題。如果數(shù)據(jù)顯示被逮捕的黑人比白人多,那么一旦有人犯罪,深度學習將首先懷疑黑人。數(shù)據(jù)顯示公司董事會董事中男性比例高于女性,深度學習將在招聘中更傾向于男性應聘者。
深度學習決策會比訓練數(shù)據(jù)的平均樣本包含更深刻的偏見,如種族歧視、性別歧視。這個問題在所有的機器學習算法中都會發(fā)生,但是深度學習模型是其中最難測試、檢測、控制和調(diào)整的。例如聊天機器人變得納粹化、充滿仇恨,或者美圖軟件中給黑人照片美白。這個問題很難解決,與其試圖解決它,很多深度學習實驗直接因為它而突然取消。
?
你無法通過在訓練之后添加補丁,來修復一個帶有偏見、種族和性別歧視的深度學習模型。深度學習是一個神經(jīng)網(wǎng)絡,與其他人工智能方法不同,你無法通過局部補救來修改某個答案,而是必須使用不同的、完全平衡以及公正的、稀有的真實世界數(shù)據(jù)對該網(wǎng)絡進行重新訓練。深度學習可以在不理解數(shù)據(jù)的情況下模仿數(shù)據(jù)中的內(nèi)容:它不會否定任何數(shù)據(jù),不會發(fā)現(xiàn)社會上的偏見,而只是“學習數(shù)據(jù)”。你應該雇傭一個人類員工,專門創(chuàng)建來自理想社會的假的、公正的數(shù)據(jù),在這里白人與黑人被逮捕的頻率相同,董事會中50%的董事都是女性,等等。但是,由人類專家創(chuàng)建海量無偏見數(shù)據(jù)的成本如果僅是為了訓練深度學習模型,用人工智能取代人類的價值又在哪里呢!此外,即使你已經(jīng)訓練出真正公正的深度學習模型,你也沒有證據(jù)可以向法官或用戶證明其決策的公正性,因為它無法提供解釋。
深度學習用于沒有法律風險的非商業(yè)應用或者游戲,其重要性將會降低。當可解釋的人工智能流行起來時,深度學習將會像磁帶或陰極電視一樣被拋棄。在游戲中輸給機器人的人類不太可能說服法官因為人工智能公司無法解釋人工智能是怎么贏的而對其罰款。不滿FaceApp把自己的自拍照修的更老、更年輕,或者換了性別的人也不太可能說服法官因為FaceApp無法解釋人工智能是如何決定新面孔的而對其罰款(除了一個“種族變化”濾鏡,遭到大規(guī)模抗議后被移除,完全不需要法官參與)。在醫(yī)療圖像中進行疾病檢測是一項安全的深度學習應用,前提是用戶在服藥之前先向人類醫(yī)生尋求確認。
合法的深度學習市場非常有限:在決策結(jié)果造成財政、健康上的區(qū)別,或者存在歧視,而深度學習無法幫助人們理解決策是否公正以及為什么公正的時候,法官都可以進行處罰。那么自動駕駛呢?似乎在藝術、游戲或高級幽默以外的領域使用深度學習都有法律風險。有需要時,現(xiàn)有的非深度學習方法可以取代深度學習,新方法也會被(重新)發(fā)現(xiàn),因此人工智能的發(fā)展將會繼續(xù)順利進行。尤其是如果每個人都將研究(并投資)人工智能和機器學習科學領域中的所有新舊算法,而不只是深度學習:這也是成為“人工智能全方位專家”的路徑。
深度學習除了正在“非法”用于很多可解任務以外,它也不能被用于解決以下一系列問題:那些需要抽象推理來找出數(shù)據(jù)中哪些是公平,哪些是不公平的任務,以及那些需要解釋其自行作出的決定的任務。即使對于那些不需要解釋的任務,例如圖像識別,深度學習看起來是較好的系統(tǒng),但是也不如人類自己的眼睛保險。你可以輕而易舉地使用“對抗樣本”來讓深度學習系統(tǒng)出錯:為一張貓的圖片加入一些不可見的噪點,機器就會把它誤認為其他不相關的東西,比如一只狗。人類看到這樣的圖片仍然看得出它是一只貓,而深度學習會將其理解成一只狗或者其它黑客秘密嵌入的東西。這一點可以用到路牌上,來黑掉目前的自動駕駛汽車。新一代的人工智能系統(tǒng)必須克服這個問題才能取代深度學習。
著名深度學習庫Keras作者Fran?ois Chollet曾在一篇名為《深度學習的限制》的文章中說到:“深度學習真正能成功做到的是使用連續(xù)幾何變換,在給定大量人為標注數(shù)據(jù)的情況下將空間X映射到空間Y的能力。”這些空間擁有多重維度,不僅僅是三維的,這就是深度學習可以模仿畢加索的作畫風格、在德州撲克中“Bluff”,以及在其他任務中模仿人類創(chuàng)造力的原因。但是對于外行人來說,這也許意味著:深度學習模型經(jīng)過訓練可以擁有識別貓的能力,而它本身不知道什么是貓;它可以是一個種族主義者,但不知道什么是種族主義。深度學習可以識別貓、具有種族主義、或贏得很多游戲,這一點是令人矚目的,有時也有實際用途,但是深度學習無法解釋為什么圖中的動物是貓,或者一個決策是否帶有種族歧視。
在《深度學習的未來》一文中,Keras的作者描述了一種只有“幾何模塊”的全新深度學習系統(tǒng),它應該與尚未出現(xiàn)的“算法模塊”和“元學習器”相關。這種系統(tǒng)可以顯著增加能夠解決的問題類型與數(shù)量,但因為深度學習模塊的存在,這種方式仍然無法解釋它的決策。這就像我們不能用言語解釋大腦中計算出的某些感覺或圖像。人類會解釋一切事物,但大多數(shù)都是編造的、過于簡單的理由,而每個人似乎都認為是準確的。機器的算法卻總是被要求做到完全準確。有一些專家正在開發(fā)完全不包含深度學習的全新人工智能系統(tǒng),但他們?nèi)狈Y金支持:現(xiàn)在所有人都只投資深度學習,而且這個風潮還將持續(xù)一段時間。沒有人知道下一個人工智能大事件將會是關于什么的,但不太可能是深度學習2.0。
深度學習正被大肆炒作,因為盡管涉及利益沖突,目前也只有出售深度學習軟、硬件的人在關于人工智能的訪談中發(fā)聲。你可曾見過任何“自然智能”專家,如心理學家和哲學家支持過深度學習?
如果你并不急于學習人工智能,或者還沒有時間,我認為你可以等待下一代人工智能系統(tǒng)的興起然后直接學習它,跳過深度學習 1.0 時代。如果你急需學習人工智能,或者自己也有足夠的時間,我建議你深入了解整個人工智能及機器學習領域的知識,而不僅僅是深度學習。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/4642.html
摘要:絕大多數(shù)人忽略了深度學習只占機器學習領域的,而機器學習又只占到了人工智能領域的。一個深度學習專家無法與人工智能專家劃上等號。但是,深度學習并不是人類可以創(chuàng)造的人工智能科技的終點。深度學習的公正性并非來自其自身,而是人類篩選和準備的數(shù)據(jù)。 人工智能的這一波熱潮毫無疑問是由深度學習引發(fā)的,自吳恩達等人 2011 年發(fā)表「識別貓」研究后,深度學習及其引發(fā)的技術已經(jīng)在圖像識別、游戲等任務中超越人類,...
摘要:而這種舉一反三的能力在機器學習領域同樣適用,科學家將其稱之為遷移學習。與深度學習相比,我們技術較大優(yōu)點是具有可證明的性能保證。近幾年的人工智能熱潮中,深度學習是最主流的技術,以及之后的成功,更是使其幾乎成為的代名詞。 如今,人類將自己的未來放到了技術手里,無論是讓人工智能更像人類思考的算法,還是讓機器人大腦運轉(zhuǎn)更快的芯片,都在向奇點靠近。谷歌工程總監(jiān)、《奇點臨近》的作者庫茲韋爾認為,一旦智能...
摘要:年的深度學習研討會,壓軸大戲是關于深度學習未來的討論。他認為,有潛力成為深度學習的下一個重點。認為這樣的人工智能恐懼和奇點的討論是一個巨大的牽引。 2015年ICML的深度學習研討會,壓軸大戲是關于深度學習未來的討論。基于平衡考慮,組織方分別邀請了來自工業(yè)界和學術界的六位專家開展這次圓桌討論。組織者之一Kyunghyun Cho(Bengio的博士后)在飛機上憑記憶寫下本文總結(jié)了討論的內(nèi)容,...
摘要:白宮在月日發(fā)布的報告中稱,中國的人工智能研究已經(jīng)走在了美國前面,提及深度學習或深度神經(jīng)網(wǎng)絡的期刊論文數(shù)量上,其實中國早在年就實現(xiàn)了對美國的超越,居世界第一。 白宮在10月14日發(fā)布的報告中稱,中國的人工智能研究已經(jīng)走在了美國前面,提及深度學習或深度神經(jīng)網(wǎng)絡的期刊論文數(shù)量上,其實中國早在2013年就實現(xiàn)了對美國的超越,居世界第一。值得一提的是,中國的相關論文不僅數(shù)量上遠超其他國家,質(zhì)量上的表現(xiàn)...
摘要:問深度學習社區(qū)現(xiàn)在面臨的主要挑戰(zhàn)是什么答打擊炒作發(fā)展倫理意識獲得科學嚴謹性。深度學習簡直是科學的重災區(qū)。 Keras之父、谷歌大腦人工智能和深度學習研究員Fran?ois Chollet撰寫了一本深度學習Python教程實戰(zhàn)書籍《Python深度學習》,書中介紹了深度學習使用Python語言和強大Keras庫,詳實新穎。近日,F(xiàn)ran?ois Chollet接受了采訪,就深度學習到底是什么、...
閱讀 741·2021-07-25 21:37
閱讀 3653·2019-08-30 15:55
閱讀 2571·2019-08-30 15:54
閱讀 1716·2019-08-30 15:44
閱讀 3122·2019-08-30 15:44
閱讀 858·2019-08-30 15:43
閱讀 1020·2019-08-29 15:36
閱讀 3037·2019-08-29 10:58