OCR (光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR的名詞也因此而產生。衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。
ocr識別的過程如下:
1、圖像輸入:要進行ocr識別,第一步便要采集所要識別的圖像,可以是名片、身份證、護照、行駛證、駕駛證、公文、文檔等等都可以,然后將圖像輸入到識別核心。
2、圖像預處理:此過程包含二值化(將圖像上的像素點灰度值設置為0或255,也就是將整個圖像呈現出明顯的只有黑和白的視覺效果)、去噪、傾斜度矯正等。
3、版面分析:將所要識別的文檔分段、分行處理
4、字符切割:此時需要字符定位和字符切割,定位出字符串的邊界,然后分別對字符串進行單個切割,單個分割出來的字符再做識別。
5、字符特征提取:提取字符特征,為后面的識別提供依據。
6、字符識別:將當前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配,識別出字符。
7、版面回復:將識別結果按照原來的版面排班,輸出Word或pdf格式的文檔。
8、后處理校正: 根據特定的語言上下文的關系,對識別結果進行較正的算法。
-
字符識別
+關注
關注
0文章
17瀏覽量
8652 -
OCR
+關注
關注
0文章
144瀏覽量
16355
發布評論請先 登錄
相關推薦
評論