Node實(shí)現(xiàn)驗(yàn)證碼識別

luckyw 發(fā)布于2019-08-20 16:46 / 2104人閱讀

摘要：了別人代碼的你最近忽然對圖像識別有了興趣，作為一個(gè)前端，當(dāng)然是想用來深入研究。先從簡單的入手，識別圖片驗(yàn)證碼。圖片驗(yàn)證碼對開發(fā)來說一點(diǎn)也不陌生，它是對服務(wù)器保護(hù)的一道屏障，避免了諸如暴力破解密碼之類的攻擊。

copy了別人代碼的你

最近忽然對圖像識別有了興趣，作為一個(gè)前端，當(dāng)然是想用Javascript來深入研究。

先從簡單的入手，識別圖片驗(yàn)證碼。圖片驗(yàn)證碼對web開發(fā)來說一點(diǎn)也不陌生，它是對服務(wù)器保護(hù)的一道屏障，避免了諸如暴力破解密碼之類的攻擊。但是，今天就是要去突破這道屏障。

現(xiàn)在開源的圖像識別技術(shù)有很多，我在GitHub上找到了一個(gè)用Javascript實(shí)現(xiàn)的，相對受歡迎的框架Tesseract.js。

我先準(zhǔn)備好一個(gè)簡單的驗(yàn)證碼

這個(gè)是數(shù)字字母的組合，接下來我們就用tesseract.js來對這個(gè)驗(yàn)證碼進(jìn)行解析。

安裝

npm install --save tesseract.js

使用這個(gè)命令進(jìn)行安裝，--save代表只安裝到當(dāng)前項(xiàng)目中。

使用

首先要在代碼中進(jìn)行引入

var tesseract = require("tesseract.js");

然后使用tesseract的recognize方法對圖片進(jìn)行解析。

tesseract.recognize(myImage,options)
.then(function(result){
    console.log(result)
});

其中，myImage可以是圖片file對象，或者圖片的存放地址的字符串等，我們這里先用存放地址的字符串。

options則是對解析過程的個(gè)性化設(shè)置，可以設(shè)置語言等其他屬性，較為重要的有lang屬性，用來設(shè)置語言類型，英文為eng（默認(rèn)）,數(shù)字是Math.

運(yùn)行效果

下面我們來看一下實(shí)際的運(yùn)行效果。

文件系統(tǒng)

app.js

使用node命令運(yùn)行

可以看出，輸出的結(jié)果是LPGU，驗(yàn)證碼中的字母數(shù)字組合是LP6U，略有偏差，將6解析成了G。

所以，自動(dòng)識別雖好，但是準(zhǔn)確率還是需要提高。

Tesseract.js訓(xùn)練

tesseract.js是可以通過訓(xùn)練來提高準(zhǔn)確率的，我們看一下第一次運(yùn)行結(jié)束后發(fā)生了什么變化。

運(yùn)行結(jié)束之后，文件系統(tǒng)中生成了一個(gè)eng.traineddata文件

這個(gè)文件，就是tesseract的訓(xùn)練文件，下次再分析的時(shí)候，會(huì)先從這個(gè)訓(xùn)練文件中尋找是否有匹配的結(jié)果。通過這種方式，形成它自己的大腦。

當(dāng)然，我認(rèn)為也可以手動(dòng)的添加相同格式的文件進(jìn)去，手動(dòng)的擴(kuò)充這個(gè)圖像分析系統(tǒng)的智能性。

附錄一

recognize第一個(gè)參數(shù)所允許的類型：

因?yàn)?b>tesseract.js既可以運(yùn)行node服務(wù)器中，也可以運(yùn)行再瀏覽器中，我們這里只提在服務(wù)器中所允許的類型

文件地址（string）

包含PNG或JPEG類型的Buffer對象

imageData對象

附錄二

瀏覽器中引入方式

使用方式同node方法

GPU云服務(wù)器云服務(wù)器驗(yàn)證碼識別‘’ 驗(yàn)證碼識別 java實(shí)現(xiàn)驗(yàn)證碼 android驗(yàn)證碼實(shí)現(xiàn)

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://specialneedsforspecialkids.com/yun/83156.html

發(fā)表評論

登陸后可評論

0條評論

luckyw

男|高級講師

我要關(guān)注我要私信

TA的文章

講講Python中的函數(shù)傳遞問題【文末送書】

閱讀 3511·2021-11-18 10:02
阿里云：速搶，輕量雲(yún)服務(wù)器，60元/年，2核/2G/5M帶寬/60GB ESSD/1T流量

閱讀 946·2021-09-04 16:48
前端實(shí)用知識

閱讀 2034·2019-08-30 15:55
關(guān)于頁面優(yōu)化

閱讀 3533·2019-08-30 15:52
前端面試題-clearfix（清除浮動(dòng)）

閱讀 1810·2019-08-30 14:08
vue2.0組件間事件派發(fā)與接收

閱讀 3552·2019-08-30 13:19
chatbot：基于 AIML 的 PHP 聊天機(jī)器人

閱讀 1137·2019-08-27 10:53
es6之深入理解promise

閱讀 3116·2019-08-26 12:11

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Node實(shí)現(xiàn)驗(yàn)證碼識別

安裝

使用

運(yùn)行效果

Tesseract.js訓(xùn)練

附錄一

附錄二

相關(guān)文章

node識別驗(yàn)證碼

**OCR識別驗(yàn)證碼**

**一只node爬蟲的升級打怪之路**

**如何識別圖片驗(yàn)證碼？**

驗(yàn)證碼識別

發(fā)表評論

0條評論

luckyw

男|高級講師

TA的文章

講講Python中的函數(shù)傳遞問題【文末送書】

阿里云：速搶，輕量雲(yún)服務(wù)器，60元/年，2核/2G/5M帶寬/60GB ESSD/1T流量

前端實(shí)用知識

關(guān)于頁面優(yōu)化

前端面試題-clearfix（清除浮動(dòng)）

vue2.0組件間事件派發(fā)與接收

chatbot：基于 AIML 的 PHP 聊天機(jī)器人

es6之深入理解promise

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Node實(shí)現(xiàn)驗(yàn)證碼識別

安裝

使用

運(yùn)行效果

Tesseract.js訓(xùn)練

附錄一

附錄二

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！