首先關注一個核心問題:什么場景下的OCR識別需求分別對應選擇什么型號智能相機,以及是否需要深度學習?
一、字符識別
對于一些產線產品位置固定,OCR 特征清晰明顯,對比度高、背景簡單的字符,可 以通過傳統(tǒng)方式即閾值分割的形式進行讀取的需求,相機字符識別自帶的模型可以應對 現(xiàn)場如點陣、刻蝕、壓印出來的字符。自帶的模型內部已經訓練了幾百萬張樣本,基本涵蓋了絕大部分應用場景。
二、特征匹配(位置修正)+字符識別
對于一些產品在視野內可能位置會變動、產品位置不固定但前景和背景灰度差較大、干擾較少的實際場景,可以開啟位置修正對字符識別進行輔助定位,來保證產品移動、旋轉等各種情況下都可以定位到要識別的字符。
注:開啟位置修正后,需保證模板區(qū)域始終在相機視野內,否則特征匹配不到會持續(xù)NG。
三、DL 字符識別
在一些字符形態(tài)大小不統(tǒng)一,對比度低,背景存在干擾,字符粘連,畸變等場景, 傳統(tǒng)方法效果一般,這個時候可以用到深度學習,在常見行業(yè)如,食藥品包裝,電子行業(yè),煙草行業(yè)薄膜,半導體晶源等等已經實現(xiàn)全行業(yè)覆蓋,不需要進行過多的模型訓練,就可以實現(xiàn)字符的高效識別檢測,準確率基本在三個九以上。
四、DL字符定位+DL字符識別
在很多實際的OCR檢測需求中,字符位置不固定,字符大小不統(tǒng)一,甚至一些需求僅檢測視野內某個特定區(qū)域內的字符,應對這類情況,往往需要深度學習定位和深度學習識別搭配起來使用,提高準確率和穩(wěn)定性達到預期效果。
食品行業(yè)噴墨會導致字符大小、深淺、形態(tài)和位置都會有變化,傳統(tǒng)方法無法準確定位到字符,引入深度學習定位和深度學習識別有效解決難題。
面對僅檢測紅框內字符(出界即NG)的實際需求,傳統(tǒng)算法模塊無法實現(xiàn)檢測需求,引入深度學習定位進行輔助,定位框框選目標區(qū)域,搭配出界過濾使能完美解決應用難點。
外包裝行業(yè)需要對箱體噴墨進行OCR識別,字符位數(shù)、長短、大小、位置及拍照距離都存在變化,且應對字符分段、噴墨深淺不一、存在劃痕等干擾,深度學習都可以穩(wěn)定定位并識別。
OCR識別仍然是智能相機的主要應用方向之一,關于OCR識別的優(yōu)化和更新也是智能相機的重點迭代方向,智能相機會結合市場需求和建議不斷優(yōu)化算法庫以適應并解決愈發(fā)多樣性的檢測場景和任務
廣州艾韋迅科技是海康威視HIKVISION旗下的??禉C器人HikRobot海康智能讀碼器/工業(yè)相機經銷商,供應海康威視HIKVISION讀碼器同時為 為電子、物流、FPD顯示屏、半導體、汽車制造等領域提供專業(yè)機器視覺解決方案,海康工業(yè)讀碼器助力用戶快速準確實現(xiàn)工業(yè)自動化。