国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

OCR:精準、穩定、易用的文字識別

spacewander / 1874人閱讀

摘要:精準穩定易用的文字識別大家好,今天給大家介紹精準穩定易用的文字識別應用服務。是英文光學字符識別的縮寫,通常叫法為文字識別。

OCR:精準、穩定、易用的文字識別

大家好,今天給大家介紹精準、穩定、易用的文字識別應用服務OCR。
OCR是英文光學字符識別的縮寫,通常叫法為文字識別。它的工作原理是通過掃描儀或數碼相機等光學輸入設備來獲取紙張上的文字圖片信息,利用各種模式識別算法,分析文字形態特征,判斷出合適的標準編碼,然后按照通用的格式,存儲在文本文件中。由此可見OCR實際上是讓計算機認字,實現文字的自動輸入,它是一種快捷、省力、高效的文本輸入方法。
文字識別的基本三要素就是O、C、R。O代表光學,即識別的是光線給出的文字,而不是聲音,或者人體的觸感等等。那為什么會有光呢?主要是因為光的反射和物理會吸收光線。其次還要求字的顏色和背景是不一樣的。那同樣它對于輸入的圖片的話,盡可能的要保證圖片的清晰度。第二個要素就是C,也就是字符的意思。大家需要注意的是,字符是信息的一種編碼,不是字體。字符主要是實現信息的編碼,比如說大家看到一張蘋果的圖片,那我們第一反應它可以代表中文的蘋果這兩個字符,或者對應到英文的apple這個字符。所謂的文字其實就是一種字符,比如說大家常用的漢字,那就是中國人的字符。計算機顯然也是需要對應到一個編碼字符。比如說我們常用的GBK、Unicode、UTF-8等等,那這時候就會產生一個問題,如果有的字的圖像在計算機編碼里面沒有對應的信息,那是不是說這個文字就沒辦法被識別呢?答案是,的確如此。所以說我們所使用的文字編碼級,一定要盡可能的覆蓋我們所要識別的字符。文字識別第三個要素就是R,它代表了識別的意思。剛剛我們了解到了,O和C它分別代表了光學的圖片和對應的字符。那如何將光學的圖片映射到計算機編碼呢?目前關于如何將圖片字符轉換到光學字符,有兩種方法,一種是傳統方法,還有一種是基于深度學習的方法。在我們華為云學院的課程中會給大家做一個詳細的介紹。需要注意的是OCR是指文字識別,但是OCR所采用的技術不僅僅是適用于文字識別。
那么對于企業來說,為什么要使用OCR技術呢?舉個例子,大家出差之后需要進行報銷,報銷的時候需要填寫很多的信息,同樣公司的財務人員需要花費一個較長的時間來進行INVOICE的一次次審核,有可能一個報銷單需要經過三個或者說更多的財務人員進行一次次的審核校對。那即便如此,在我們日常報銷中,也多多少少會出現一些人為的錯誤。那么OCR技術可不可以幫助我們實現INVOICE的快速準確的讀取呢?答案是肯定的。由此可見,OCR技術可以對于企業來說,它可以減少相關人員審核所產生的成本,以及減少審核所需要的流程。總結一下企業為什么需要使用OCR技術,第一,是為了降低重復性的勞動成本。第二,它可以提高業務效率,第三,它能夠提高文本識別的精確度。
OCR在企業中主要運用于哪些場景呢?這里做了一個總結。第一文檔場景,它主要用于印刷文檔的識別,翻譯文字的識別,搜索識別,涂抹識別。第二,電商場景,主要用于電商用戶身份的綁定,實名認證,商家身份認證。第三,圖片反作弊場景,它主要識別圖像和視頻中的一些違規文字,進行一些違規的處理和風險管控。第四,辦公場景,主要會用于企業證件、年報、財報、piao據識別。然后接著是金融場景,它主要會用于客戶的身份識別,身份綁定,個人信息核實。最后一個就是視頻場景,主要是會用于視頻字幕的識別,視頻標題的識別,視頻反作弊,圖像反作弊,評論反作弊等。
文字識別的技術難點主要存在以下幾個方面,第一就是圖像質量差,很多場景待識別的文本圖片的質量往往都很差,它存在嚴重的一些干擾曲線,傾斜、暗光或者曝光扭曲。比如說我們常用的一些海關的報關的掃描單據。第二它對精確度要求特別高,在某些場景,用戶對于數值的精確度要求特別高。比如說文本中的一些稅率、金額、幣種等文字的精確度要求高達百分之百。第三就是識別內容較為復雜,文本內容的復雜多樣性,例如說一個文本中有可能存在不同的字體和顏色,小數點近似的英文數字,特殊的字符,特殊的符號連接詞以及數字的內容,它的識別難度會很大,很容易被漏識,或者誤識。第四就是語言的種類的繁多,隨著全球化現在越來越擴大,每家公司多多少少都會涉及到多個國家,這時候就要求OCR技術能夠支持多語言多字符。
以上對文字識別進行了簡要的介紹,訪問華為云學院(https://edu.huaweicloud.com/) ,報名學習《文字識別服務》課程,了解更多文字識別關鍵技術及應用實踐。華為云學院現已發布推出《智能表單和證件文字識別》微認證,微認證結合OCR服務,讓您體驗智能識別帶來的效率提升!

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19928.html

相關文章

  • 數字中國創新大賽決賽名單出爐,與華為云 EI 一起挑戰書法識別

    摘要:數字中國創新大賽決賽名單出爐,與華為云一起挑戰書法識別日前,以軟件賦能數字經濟創新驅動數字中國為主題的數字中國創新大賽分區北京決賽成功舉辦。 數字中國創新大賽決賽名單出爐,與華為云 EI 一起挑戰書法識別日前,以軟件賦能數字經濟 創新驅動數字中國為主題的 2019數字中國創新大賽分區(北京)決賽成功舉辦。福州市人民政府副市長李春,中國電子信息產業發展研究院黨委書記宋顯珠,中國互聯網投資...

    2501207950 評論0 收藏0

發表評論

0條評論

spacewander

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<