摘要:對于異常機制的合理運用是直接關(guān)系到碼農(nóng)飯碗的事情所以,本文將具體介紹一下和的異常處理機制,闡明二者在異常處理機制上的異同。下面將具體介紹二者的異常處理機制。
概述
異常處理,是編程語言或計算機硬件里的一種機制,用于處理軟件或信息系統(tǒng)中出現(xiàn)的異常狀況(即超出程序正常執(zhí)行流程的某些特殊條件)。Python和R作為一門編程語言自然也是有各自的異常處理機制的,異常處理機制在代碼編寫中扮演著非常關(guān)鍵的角色,卻又是許多人容易混淆的地方。對于異常機制的合理運用是直接關(guān)系到碼農(nóng)飯碗的事情!所以,本文將具體介紹一下Python和R的異常處理機制,闡明二者在異常處理機制上的異同。
異常安全在了解Python和R的異常機制之前,我們有必要了解一下異常安全的概念。
根據(jù)WikiPedia的文獻(xiàn),一段代碼是異常安全的,如果這段代碼運行時的失敗不會產(chǎn)生有害后果,如內(nèi)存泄露、存儲數(shù)據(jù)混淆、或無效的輸出。我們可以知道一段代碼的異常安全通常分為下面五類:
異常安全通常分為5個層次:
失敗透明:如果出現(xiàn)了異常,將不會對外進一步拋出該異常。(一般比較復(fù)雜)
強異常安全:可以運行失敗,不過數(shù)據(jù)會回滾到代碼運行前(無副作用)
基本異常安全:運行失敗導(dǎo)致的數(shù)據(jù)變更,使得代碼運行前后數(shù)據(jù)不一致了(有副作用)
最小異常安全:運行失敗保存了無效數(shù)據(jù),但是還不會引起崩潰,資源不會泄露(進程不會掛)
異常不安全:沒有任何保證(進程可能會掛掉)
從上述的5個層次來看,我們可以知道,在平時寫代碼的時候,對數(shù)據(jù)庫、文件、網(wǎng)絡(luò)等的IO操作都是需要盡量保證無副作用的,也就是強異常安全。具體來說就是,RDBS操作在失敗的時候需要回滾機制、所有IO操作在最后要保證IO連接資源關(guān)閉。
其實和多數(shù)語言的異常機制的語法是類似的:Python和R都是通過拋出一個異常對象或一個枚舉類的值來返回一個異常;異常處理代碼的作用域由try開始,以第一個異常處理子句(catch, except等)結(jié)束;可連續(xù)出現(xiàn)若干個異常處理子句,每個處理特定類型的異常。最后通過finally子句,無論是否出現(xiàn)異常它都將執(zhí)行,用于釋放異常處理所需的一些資源。
下面將具體介紹二者的異常處理機制。
Python 中的異常處理機制首先,Python 是一門面向?qū)ο笳Z言,所有的異常類都是通過繼承BaseException類來實現(xiàn)的,我們亦可以通過相應(yīng)的繼承來實現(xiàn)自定義的異常類,比如在工作流調(diào)度中使用AirflowException,具體實現(xiàn)可以直接看Airflow的源碼。
事實上,這些在我們代碼處理范圍內(nèi)的異常其實就是可以分成兩個部分:
IO異常:由網(wǎng)絡(luò)抖動、磁盤文件位置變更、數(shù)據(jù)庫連接變更等引起的IO異常問題。
運行期異常:由于計算或者傳輸?shù)膮?shù)參數(shù)類型有誤、參數(shù)值異常等等發(fā)生在運行期的異常,都統(tǒng)一被稱為運行期異常。正常來說,IO上的異常我們都要有相應(yīng)的try-catch-finally機制,在Python也就是如下實現(xiàn):
try: do something with IO except: do something without IO finally: close IO
這里容易犯的一個錯誤就是在except中又引入了新的IO操作,比如在except中又引入了一個API的POST請求或者數(shù)據(jù)庫寫操作等等,這樣如果在except階段又發(fā)生了異常,將導(dǎo)致異常信息的丟失。
另一方面,對于可能的運行期異常則需要我們根據(jù)具體應(yīng)用場景的需求來做相應(yīng)的處理,一般就是遇到一個新的問題加一個新的異常捕獲機制,當(dāng)然這里也就考驗到碼農(nóng)程序設(shè)計的功利,是否能夠未雨綢繆。比如數(shù)組長度的檢查,傳入字典的Key檢查等等。Python本身提供了豐富的異常處理類型并且易于拓展,正確使用將可以顯著提升程序的魯棒性(保住碼農(nóng)的飯碗)。
使用try-catch-finally機制是足夠簡單的,但是在混入return和rasie操作之后,事情就看起來變得有點復(fù)雜。
舉一個例子:
def test(): try: a = 1/0 except: a = 0 raise(ValueError,"value error, the division must greater than 0") return a finally: a = 1 return a test()
你看這里的返回應(yīng)該是什么呢?
其實,這里的返回最后應(yīng)該是 1,而except中raise的異常則會被吃掉。這也是許多人錯誤使用finanlly的一個很好的例子。
Python在執(zhí)行帶有fianlly的子句時會將except內(nèi)拋出的對象先緩存起來,優(yōu)先執(zhí)行finally中拋出的對象,如果finally中先拋出了return或者raise,那么except段拋出的對象將看起來被吃掉了。
一個段正確的處理方式應(yīng)該是這樣的:
try: do IO info = {"status":200} except: info = {"status":400} finally: try: write log(info) except: raise(SomeError,"error message") close IO
具體的調(diào)用棧的過程可以參考這個更加生動的例子:
R 中的異常處理機制R和Python最大的不同就是 R 本質(zhì)上是一門強動態(tài)類型的非純函數(shù)式編程語言(所謂非純即存在副作用)而非面向?qū)ο笳Z言。從函數(shù)式編程語言的角度上講,R和Erlang、LISP的關(guān)系比較近一些。
既然是函數(shù)式語言,處理異常也是通過函數(shù)式的,而非直接通過面向?qū)ο蟮姆绞健 從語法上來看就略顯突兀(花括號函數(shù)式語言的一大通病):
tryCatch({ doStuff() doMoreStuff() }, some_exception = function(se) { recover(se) })
如果這段用Python來表達(dá)就變成:
try: doStuff() doMoreStuff() except SomeException, se: recover(se)
事實上正確運用 R 的異常處理機制反而是比較負(fù)擔(dān)小的一種方式:(R 還支持用中文字符集命名變量)
tryCatch({ 結(jié)果 <- 表達(dá)式 }, warning = function(w) { warning() ... # 運行期異常 }, error = function(e) { stop() ... # IO異常 }, finally { on.exit() ... # 資源回收 }
下面是 Hadley 大神對R的異常處理機制優(yōu)點的分析:
One of R’s great features is its condition system. It serves a similar purpose to the exception handling systems in Java, Python, and C++ but is more flexible. In fact, its flexibility extends beyond error handling–conditions are more general than exceptions in that a condition can represent any occurrence during a program’s execution that may be of interest to code at different levels on the call stack. For example, in the section “Other Uses for Conditions,” you’ll see that conditions can be used to emit warnings without disrupting execution of the code that emits the warning while allowing code higher on the call stack to control whether the warning message is printed. For the time being, however, I’ll focus on error handling.
The condition system is more flexible than exception systems because instead of providing a two-part division between the code that signals an error and the code that handles it, the condition system splits the responsibilities into three parts–signaling a condition, handling it, and restarting. In this chapter, I’ll describe how you could use conditions in part of a hypothetical application for analyzing log files. You’ll see how you could use the condition system to allow a low-level function to detect a problem while parsing a log file and signal an error, to allow mid-level code to provide several possible ways of recovering from such an error, and to allow code at the highest level of the application to define a policy for choosing which recovery strategy to use.
我的理解是R通過條件機制,然我們可以選擇性的在低階函數(shù)中把warning吃掉,這樣就不至于影響高階函數(shù)的運行?條件機制將異常分為三階段而不是兩階段:
1.異常信號捕獲
2.異常處理
3.重啟機制。
并且我們還可以看到在異常處理中,如何在中階函數(shù)中恢復(fù)低階函數(shù)的Error,并且在高階函數(shù)中選擇一定的恢復(fù)策略。
這段貌似個人理解有誤,還請看官指正。
參考資料RCpp的異常處理
Python對API調(diào)用的異常封裝例子
什么情況下使用異常處理?
知乎:Python 的異常機制及規(guī)范是否相當(dāng)不人性化?
Python Exceptions Handling
Using R — Basic error Handing with tryCatch()
博客園:R語言里的異常處理與錯誤控制
Error Handling in R
Beyond Exception Handling: Conditions and Restarts
R 錯誤處理
Stackoverflow: Exception handling in R
CRAN: Exception Handling in R
R 語言摘記(R-LANG, PART II)
Java異常處理
更優(yōu)閱讀體驗可直接訪問原文地址:https://segmentfault.com/a/11...
作為分享主義者(sharism),本人所有互聯(lián)網(wǎng)發(fā)布的圖文均遵從CC版權(quán),轉(zhuǎn)載請保留作者信息并注明作者 Harry Zhu 的 FinanceR專欄:https://segmentfault.com/blog...,如果涉及源代碼請注明GitHub地址:https://github.com/harryprince。微信號: harryzhustudio
商業(yè)使用請聯(lián)系作者。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/38098.html
摘要:概述工欲善其事必先利其器,如果現(xiàn)在要評選數(shù)據(jù)科學(xué)中最好用的編輯器注意一定是可以通過訪問的,和一定是角逐的最大熱門,正確使用編輯器可以很大地提升我們的工作效率。 概述 showImg(https://segmentfault.com/img/bVAdol); 工欲善其事必先利其器,如果現(xiàn)在要評選數(shù)據(jù)科學(xué)中最好用的Web 編輯器(注意一定是可以通過Web訪問的),RStudio和Jupyt...
摘要:則在讀取數(shù)據(jù)時將兩個中文字段混淆成了一個字段,導(dǎo)致整個數(shù)據(jù)結(jié)構(gòu)錯亂。三條路子全軍覆沒,這讓我情何以堪,好在使用的經(jīng)驗頗豐,通過中文的轉(zhuǎn)換和切割就輕松解決了這個問題。 概述 showImg(https://segmentfault.com/img/bVylLL); 在現(xiàn)實場景中,由于數(shù)據(jù)來源的異構(gòu),數(shù)據(jù)源的格式往往是難以統(tǒng)一的,這就導(dǎo)致大量具有價值的數(shù)據(jù)通常是以非結(jié)構(gòu)化的形式聚合在一起的...
摘要:概述在真實的數(shù)據(jù)科學(xué)世界里,我們會有兩個極端,一個是業(yè)務(wù),一個是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)分析,也就是型數(shù)據(jù)科學(xué)。所以說,同時學(xué)會和這兩把刷子才是數(shù)據(jù)科學(xué)的王道。 showImg(https://segmentfault.com/img/bVAgki?w=980&h=596); 概述 在真實的數(shù)據(jù)科學(xué)世界里,我們會有兩個極端,一個是業(yè)務(wù),一個是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)...
摘要:另外一個我們同時使用兩種語言的原因是已有的統(tǒng)計學(xué)工具與包。對另一些為讀者寫數(shù)據(jù)科學(xué)工具的人來說他們從一開始就考慮了這些跨語言。和實際上是用實現(xiàn)的這是條阻力最小的路徑。無論是哪個贏得這場語言戰(zhàn)爭,和都將保持在數(shù)據(jù)科學(xué)屆的地位。 showImg(https://segmentfault.com/img/remote/1460000006762469); 概述 幾周前,我有幸在 Scipy ...
摘要:概述隨著容器化技術(shù)的興起,數(shù)據(jù)科學(xué)現(xiàn)在最大的一場運動已經(jīng)不是由一個新的算法或者統(tǒng)計方法發(fā)起的了,而是來自的容器化技術(shù)。本文將介紹利用容器技術(shù)如何加速數(shù)據(jù)科學(xué)在生產(chǎn)環(huán)境中的實際應(yīng)用。 showImg(https://segmentfault.com//img/bVxzYL); 概述 隨著容器化技術(shù)的興起,數(shù)據(jù)科學(xué)現(xiàn)在最大的一場運動已經(jīng)不是由一個新的算法或者統(tǒng)計方法發(fā)起的了,而是來自Doc...
閱讀 3473·2021-09-02 09:53
閱讀 1799·2021-08-26 14:13
閱讀 2759·2019-08-30 15:44
閱讀 1318·2019-08-30 14:03
閱讀 1968·2019-08-26 13:42
閱讀 3019·2019-08-26 12:21
閱讀 1307·2019-08-26 11:54
閱讀 1902·2019-08-26 10:46