视频在线观看免费网址,性欧美高清强烈性视频,中文字幕久久网

OCR 是光學字符識別（英語：Optical Charac ter Recognition，OCR）是指對文本資料的圖像文件進行分析識別處理，獲取文字及版面信息的過程。

很早之前就有同學在公眾號后臺回復希望出一篇 OCR 相關的文章，今天嘗試了一下 cnocr 和 tesseract 兩個 Python 開源識別工具的效果，給大家分別講講兩個工具的使用方法和對比效果。

1.準備

開始之前，你要確保Python和pip已經成功安裝在電腦上，如果沒有，可以訪問這篇文章：超詳細Python安裝指南進行安裝。

(可選1) 如果你用Python的目的是數據分析，可以直接安裝Anaconda：Python數據分析與挖掘好幫手—Anaconda，它內置了Python和pip.

(可選2) 此外，推薦大家用VSCode編輯器，它有許多的優點：Python 編程的最好搭檔—VSCode 詳細指南。

請選擇以下任一種方式輸入命令安裝依賴 ：

Windows 環境打開 Cmd (開始-運行-CMD)。
MacOS 環境打開 Terminal (command+空格輸入Terminal)。
如果你用的是 VSCode編輯器或 Pycharm，可以直接使用界面下方的Terminal.

（選擇一）安裝 cnocr：

pip install cnocr

看到 Successfully installed xxx 則說明安裝成功。

如果你只想對圖片中的中文進行識別，那么 cnocr 是一個不錯的選擇，你只需要安裝 cnocr 包即可。

但如果你想試試其他語言的OCR識別，Tesseract 是更好的選擇。

（選擇二）安裝 pytesseract：

首先，無論是Windows還是macOS，你都需要安裝 pytesseract:

pip install pytesseract

其次，還需要安裝Tesseract.

（macOS） Tesseract 在macOS下可以使用brew安裝：

brew install tesseract

非常方便，一條命令即可完成安裝。

（Windows ）**** 安裝Tesseract

需要先下載安裝tesseract的程序，然后下載中文簡體字預訓練好的模型包（盡管本教程不會用tesseract，但還是給大家提供了）。

你可以在Python實用寶典公眾號后臺回復：**tesseract **打包下載。

下載完成后，將 tesseract-ocr-setup-4.00.00dev.exe 安裝到 Tesseract-OCR 指定目錄下，復制該目錄路徑增加到Path中：

并將訓練好的模型文件 chi_sim.traineddata 放入該目錄中，這樣安裝就完成了。

2.cnocr 識別圖片的中文

cnocr 主要針對的是排版簡單的印刷體文字圖片，如截圖圖片，掃描件等。目前內置的文字檢測和分行模塊無法處理復雜的文字排版定位。

盡管它分別提供了單行識別函數和多行識別函數，但在本人實測下，單行識別函數的效果非常糟糕，或者說要求的條件十分苛刻，基本上連截圖的文字都識別不出來。

不過多行識別函數還不錯，使用該函數識別的代碼如下：

from cnocr import CnOcr
ocr = CnOcr()
res = ocr.ocr('test.png')
print("Predicted Chars:", res)

用于識別這個圖片里的文字：

效果如下：

如果不是很吹毛求疵，這樣的效果已經很不錯了。

3.pytesseract 識別圖片的英文

如果你的OCR目的不是中文而是英文，是需要別的模型的。這里給大家分享Tesseract-OCR，它是一款由HP實驗室開發，由Google維護的開源OCR引擎。

Tesseract-OCR 可擴展性很強，你可以基于它訓練屬于自己的OCR模型。

現在給大家看看它分類英文的效果，代碼如下：

import pytesseract
from PIL import Image

image = Image.open('test.png')
code = pytesseract.image_to_string(image, lang='eng')
print(code)

識別的圖片：

效果如下：

Tesseract 識別英文的效果真的很不錯，中文效果就比較一般了。

如果你想試試Tesseract識別中文，只需要將代碼中的eng改為chi_sim即可，不過相信我，效果不忍直視。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

程序

程序

+關注

關注
117

文章
3786

瀏覽量
81015
開源

開源

+關注

關注
3

文章
3333

瀏覽量
42478
python

python

+關注

關注
56

文章
4795

瀏覽量
84646
OCR

OCR

+關注

關注
0

文章
144

瀏覽量
16353

求助，關于FX3的兩個使用問題求解

如題，咨詢FX3的兩個使用問題： 1，在F1F模式下，燒寫成功后，WIN10無法識別設備，切換到0F1，燒寫成功后，WIN10同樣無法識別設備，所以現在我的板子只能使用USB引導了，燒寫到RAM可以

發表于 02-22 07:16

python開發工具推薦

Python開發軟件可根據其用途不同分為兩種，一種是Python代碼編輯器，一種是Python集成開發工具，

發表于 04-12 16:12

關于汽車在點頭與沉浮兩個自由度方向的問題

關于汽車在點頭與沉浮兩個自由度方向的問題，利用simulink進行求解。

發表于 02-16 17:18 ?0次下載

Python的兩個基礎包numpy和Matplotlib示例詳解

Python的科學計算包 - Numpy numpy(Numerical Python extensions)是一個第三方的Python包，用于科學計算。這個庫的前身是1995年就開始

發表于 11-15 18:36 ?5492次閱讀

精選10個Python開源項目

過去一個月里，我們對近 250 個 Python 開源項目進行了排名，并挑選出熱度前 10 的項目。

發表于 11-12 09:47 ?6327次閱讀

語音識別的兩個方法_語音識別的應用有哪些

本文主要闡述了語音識別的兩個方法及語音識別的應用。

發表于 04-01 09:04 ?5995次閱讀

干貨：兩個關于Vim的使用問題及小技巧

最近在使用 VIM 時遇到兩個新的問題，覺得還很挺有價值的。現在將處理方法總結后，分享給大家。

發表于 08-31 12:09 ?2927次閱讀

干貨：<b class='flag-5'>兩個</b><b class='flag-5'>關于</b>Vim的使用問題及小技巧

在Python中用于終止線程的兩個選項

? 我經常被問到如何殺死一個后臺線程，這個問題的答案讓很多人不開心: 線程是殺不死的。在本文中，我將向您展示? Python ?中用于終止線程的兩個選項。如果我們是一個好奇寶寶的話，

發表于 11-17 10:02 ?4672次閱讀

兩個電機的電路開源

電子發燒友網站提供《兩個電機的電路開源.zip》資料免費下載

發表于 08-03 11:20 ?1次下載

<b class='flag-5'>兩個</b>電機的電路<b class='flag-5'>開源</b>

兩個LED和兩個按鈕的使用

電子發燒友網站提供《兩個LED和兩個按鈕的使用.zip》資料免費下載

發表于 01-30 16:04 ?1次下載

<b class='flag-5'>兩個</b>LED和<b class='flag-5'>兩個</b>按鈕的使用

網絡工程師學Python-開源自動化部署工具Fabric

Python Fabric是一個基于Python的開源自動化部署工具，可以簡化管理遠程服務器的過程。

發表于 04-28 09:54 ?747次閱讀

關于Python 加速工具的選單

一些高效的函數實現，也有已經封裝好的拓展模塊，還包括速度更快的 Python 解釋器。當然多處理器版本確實能大幅提高運行效率。如果想了解多核編程，可以從 multiprocessing 模塊開始。而且也能找到非常多的關于分布式計算的第三方

發表于 07-07 11:19 ?376次閱讀

OCR如何自動識別圖片文字

回復希望出一篇 OCR 相關的文章，今天嘗試了一下 cnocr 和 tesseract 兩個 Python 開源識別工具的

發表于 10-31 16:45 ?778次閱讀

python中如何交換兩個數的位置

在Python中，我們可以使用多種方法來交換兩個數的位置。下面將詳細介紹這些方法，并提供示例代碼和解釋。方法一：使用臨時變量進行交換這是最簡單的方法之一，我們可以使用一個臨時變量來交換兩個

發表于 11-22 10:56 ?2941次閱讀

python中如何交換兩個數的值相加

應用進行詳細解析。一、變量交換原理解析傳統方式在Python中，交換兩個數的值通常可以使用一個臨時變量進行操作。假設有變量a和b，要實現交換，可以通過如下代碼實現： temp = a a = b b = temp 這種方法

發表于 11-29 17:29 ?663次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

關于兩個Python開源識別工具的效果

評論