国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

利用百度AI OCR圖片識別,Java實現(xiàn)PDF中的圖片轉(zhuǎn)換成文字

AdolphLWQ / 3130人閱讀

摘要:二方案實現(xiàn)百度平臺獲取該平臺限制調(diào)用次數(shù),作為個人開發(fā)者來說,基本上是夠用了。代碼實現(xiàn)邏輯思路讀取文件,然后讀取中包含的圖片,將圖片傳給百度平臺去進行識別,返回結(jié)果解析。

序言:我們在讀一些PDF版書籍的時候,如果PDF中不是圖片,做起讀書筆記的還好;如果PDF中的是圖片的話,根本無法編輯,做起筆記來,還是很痛苦的。我是遇到過了。我們搞技術(shù)的,當然得自己學(xué)著解決現(xiàn)在的痛點。
一. 現(xiàn)狀

為了不重復(fù)造輪子,當然得看看現(xiàn)在市面上是否有已經(jīng)實現(xiàn)過的,如果有,那自然是拿來即用。

首先,說說一些在線版的PDF圖片轉(zhuǎn)文字,對文件大小有限制為2M(似乎有很多的文件處理都是限制在這個數(shù)),超過了便要收費了。

第二,那就是WPS的PDF圖片轉(zhuǎn)文字了。別說大小限制了,直接是收費。

二. 方案實現(xiàn) 2.1 百度AI平臺 獲取AppID, API Key, Secret Key

該平臺限制調(diào)用次數(shù), 作為個人開發(fā)者來說,基本上是夠用了。

Java SDK文檔使用說明: https://ai.baidu.com/docs#/OCR-Java-SDK/top

不清楚的,可以去看文檔。

2.2 代碼實現(xiàn)

邏輯思路: 讀取PDF文件,然后讀取PDF中包含的圖片,將圖片傳給百度AI平臺去進行識別,返回結(jié)果解析。

第一步:新建一個Demo的Maven工程

省略....(相信大家都會哈)

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/75536.html

相關(guān)文章

  • iOS利用OpenCV 實現(xiàn)行區(qū)域提取的嘗試

    摘要:這是坐標百度,好像沒啥好研究的了,不過出于好奇還是想知道使用是如何做到把文字區(qū)域進行框選的,所以接下來我們就看看如何在上使用實現(xiàn)圖片中的文字框選。一些探索 最近下了幾個OCR的App(比如白描),發(fā)現(xiàn)可以選中圖片中的文字行逐行轉(zhuǎn)成文字,覺得很有意思(當然想用要花錢啦),想著自己研究一下實現(xiàn)原理,google之后,發(fā)現(xiàn)了兩個庫,一個是OpenCV,在機器視覺方面應(yīng)用廣泛,圖像分析必備利器。另一...

    番茄西紅柿 評論0 收藏0
  • Python圖像處理之圖片識別OCR

    摘要:與介紹將圖片翻譯成文字一般被稱為光學(xué)文字識別,。是目前公認最優(yōu)秀最精確的開源系統(tǒng)。我們以圖片為例輸入命令識別結(jié)果如下只識別錯了一個字,識別率還是不錯的。最后加一句,對于彩色圖片的識別效果沒有黑白圖片的效果好。 OCR與Tesseract介紹 ??將圖片翻譯成文字一般被稱為光學(xué)文字識別(Optical Character Recognition,OCR)??梢詫崿F(xiàn)OCR 的底層庫并不多,...

    W4n9Hu1 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<