由于公司需要進行了中文驗證碼的圖片識別開發(fā),最近一段時間剛忙完上線,好不容易閑下來就繼上篇《基于Windows10 x64+visual Studio2013+Python2.7.12環(huán)境下的Caffe配置學(xué)習(xí) 》文章,記錄下利用caffe進行中文驗證碼圖片識別的開發(fā)過程。由于這里主要介紹開發(fā)和實現(xiàn)過程,CNN理論性的東西這里不作為介紹的重點,遇到相關(guān)的概念和術(shù)語請自行研究。目前從我們訓(xùn)練出來的模型來看,單字識別率接近96%,所以一個四字驗證碼的準確率大概80%,效果還不錯,完全能滿足使用,如果每張圖片的樣本繼續(xù)加大應(yīng)該能取得更高的準確率,當然隨著樣本的加大,訓(xùn)練時間也隨之增大,對硬件設(shè)備要求也越高,還有就是優(yōu)化LeNet網(wǎng)絡(luò)結(jié)構(gòu),目前這里只使用了三層卷積。
(一)開發(fā)準備
(1)開發(fā)環(huán)境
軟件環(huán)境:visual Studio2013+Python2.7.12+caffe
硬件環(huán)境:Intel Core i7-4790+GTX1080+RAM32G
(2)訓(xùn)練圖片