隨著機器視覺的發(fā)展 , 光學(xué)字符識別(Optical Character Recognition,OCR)技術(shù)得到越來越廣泛的應(yīng)用 。OCR字符檢測技術(shù)是通過光學(xué)圖像采集設(shè)備采集圖像,接著基于圖像處理系統(tǒng)進行圖像的預(yù)處理、檢測與識別 。

文章插圖
OCR字符檢測流程
字符識別算法是OCR字符檢測技術(shù)的重要組成部分 。OCR字符檢測技術(shù)-般由圖像預(yù)處理與字符識別兩個部分組成 。圖像的預(yù)處理是對光學(xué)成像設(shè)備獲取到的原始圖像進行處理,進而將圖像分割并歸一化為一個個獨立的字符;字符識別部分是將分割出的字符進行識別 , 并將識別出的字符信息整合成字符串信息進行輸出 。
采集到的原圖像經(jīng)過預(yù)處理后得到單枚字符,接著將單枚字符圖像數(shù)據(jù)傳入識別算法部分 。常見的字符識別算法如下:
1、 模板匹配算法
模板匹配法是通過計算目標圖像與搜索圖中所有子圖的相似度 , 其中相似度最大的即認為是最佳待匹配的位置 。模板匹配法根據(jù)匹配的基本原理演變出多種匹配計算方式 , 如序貫相似性匹配、距離變換、最小均方誤差等 。這其中最簡單的就是最簡單的圖像作差法,當然這種方法只適用于待識別的類型比較少,并且待識別的圖像差異性比較大的場景當中 。
【有關(guān)字符串查找算法 字符識別算法有哪些】OCR技術(shù)中使用模板匹配法時首先要建立標準的模板字符庫,接著將待識別字符圖像與模板字符庫中字符進行匹配相似度計算 , 得到匹配相似度值最大的就是相對應(yīng)的字符識別結(jié)果 。模板匹配的優(yōu)點在于識別過程直接采取兩幅圖像間的相似匹配度,在某些特定的場景中有著很高的實用性 。
2、支持向量機
支持向量機(Support Vector Machine , SVM)是基于統(tǒng)計學(xué)理論的一種分類識別算法 。SVM在小樣本的分類領(lǐng)域的應(yīng)用中具有很好的效果 。經(jīng)過長期發(fā)展 , SVM出現(xiàn)了許多衍生算法 , 如最小二乘SVM、半監(jiān)督SVM等 。
支持向量機分類算法不僅對于小樣本的情況具有較好的分類效果,并且對高維和線性不可分的問題進行了很好的解決,這是該算法的主要優(yōu)點 , 但該算法也有弊端,例如核函數(shù)的選擇,以及算法的實時性較差等問題 。
3、貝葉斯分類算法
貝葉斯分類算法(Bayes)主要原理是通過Bayes定理對未知樣本進行預(yù)測,并計算樣本進行各個類別的可能性,最后通過概率統(tǒng)計對圖像實現(xiàn)分類 。貝葉斯分類方法的主要優(yōu)點在于魯棒性強 , 穩(wěn)定性好;其缺點在于Bayes模型基礎(chǔ)假設(shè)了不同屬性間的概率獨立,即相互不影響 。因此,使用該方法時要考慮應(yīng)用場景 。
4、神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)算法常用在解決分類和回歸問題 。OCR技術(shù)中也廣泛使用了基于神經(jīng)網(wǎng)絡(luò)的算法 , 字符圖像在使用神經(jīng)網(wǎng)絡(luò)分類器進行識別時,根據(jù)網(wǎng)絡(luò)的輸入層的不同可以分為兩種情況:一是將二維的字符圖像直接作為網(wǎng)絡(luò)的輸入 , 將圖像的各個像素點作為節(jié)點進行全連接,這種方法可以實現(xiàn)較高的識別正確率,且抗干擾能力強 , 但是網(wǎng)絡(luò)運算量較大,會花費較長的時間訓(xùn)練網(wǎng)絡(luò);二是對字符圖像進行特征提取,然后將提取到的字符特征信息作為祌經(jīng)網(wǎng)絡(luò)的輸入來進行網(wǎng)絡(luò)的訓(xùn)練 , 這種情況可以有效減少網(wǎng)絡(luò)訓(xùn)練所需的時間,但這種方式訓(xùn)練的網(wǎng)絡(luò)對字符識別正確率的高低取決于字符特征信息提取的有效程度 。
隨著OCR字符檢測技術(shù)的飛速發(fā)展 , 應(yīng)用領(lǐng)域逐漸滲透到工業(yè)、銀行、半導(dǎo)體、交通運輸?shù)戎T多領(lǐng)域 。比如,筆記本外殼表面的字符檢測系統(tǒng)中,可以通過識別表面的字符信息將筆記本外殼進行型號歸類 。在金屬閥門的歸類系統(tǒng)中 , 可以通過識別閥門表面標志的字符信息,將規(guī)格不同的閥門有效分離 。在銀行的單據(jù)識別系統(tǒng)中,可以通過OCR技術(shù)識別存取款金額,從而使機器能夠進行自動化工作 , 提高了銀行的工作效率 。在襯布表面的疵點檢測系統(tǒng)中,可以通過識別襯布表面標識的字符信息,將檢測的成品進行分類入庫 ??傊?,將OCR字符檢測技術(shù)應(yīng)用到不同領(lǐng)域,都給生產(chǎn)生活帶來了很大的便利 。
以上關(guān)于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關(guān)的問題,請您及時就醫(yī)或請專業(yè)人士給予相關(guān)指導(dǎo)!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對您有所幫助:- 掌握WPS中Excel查找快捷鍵技巧
- Excel中如何使用VLOOKUP函數(shù)進行數(shù)據(jù)查找
- 酷我音樂下載歌曲保存位置查找方法
- 提高工作效率:Word文檔快速查找關(guān)鍵字技巧
- 如何快速查找ArcMap工具
- 探究Java中字符串插入位置的算法
- 使用Mathematica查找英文詞典中匹配模式單詞的方法
- 如何在Word文檔中設(shè)置查找功能忽略標點符號
- 如何有效運用CorelDRAW中的路徑查找器
- Excel工作簿中工作表過多,如何快速查找?
