使用Google的Tesseract和OpenCV構(gòu)建光學(xué)字符識別(OCR)系統(tǒng)
EAST具有U形網(wǎng)絡(luò)。網(wǎng)絡(luò)的第一部分包括在ImageNet數(shù)據(jù)集上訓(xùn)練的卷積層。下一部分是特征合并分支,該分支將當(dāng)前特征圖與上一階段的未合并特征圖連接在一起。然后是卷積層,以減少計(jì)算并生成輸出特征圖。最后,使用卷積層,輸出是顯示文本存在的得分圖和幾何圖,幾何圖可以是旋轉(zhuǎn)的框或覆蓋文本的四邊形,這可以從研究論文中包含的結(jié)構(gòu)圖像中直觀地理解:
我強(qiáng)烈建議你親自閱讀本文(https://arxiv.org/abs/1704.03155) ,以更好地了解EAST模型。OpenCV從版本3.4開始包含EAST文本檢測器模型,這使得實(shí)現(xiàn)自己的文本檢測器變得超級方便。生成的本地化文本框可以通過Tesseract OCR傳遞以提取文本,這樣你將擁有一個完整的OCR端到端模型。
使用TensorFlow對象的API進(jìn)行文本檢測的自定義模型TensorFlow Object API:https://github.com/tensorflow/models/tree/master/research/object_detection構(gòu)建文本檢測器的最后一種方法是用使用了TensorFlow Object API的自定義文本檢測器模型。它是一個開放源代碼框架,用于為目標(biāo)檢測任務(wù)構(gòu)建深度學(xué)習(xí)模型。要詳細(xì)了解它,我建議先閱讀下面這篇詳細(xì)的文章。https://www.a(chǎn)nalyticsvidhya.com/blog/2020/04/build-your-own-object-detection-model-using-tensorflow-api/要構(gòu)建你的自定義文本檢測器,你顯然需要一個包含很多圖像的數(shù)據(jù)集,至少要多于100個;然后你需要對這些圖像進(jìn)行注釋,以便模型可以知道目標(biāo)對象在哪里并了解有關(guān)它的一切;最后,你可以從TensorFlow’s detection model zoo(https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md) 中根據(jù)性能和速度之間的權(quán)衡選擇一種預(yù)訓(xùn)練的模型。你可以參考這個綜合性的博客來構(gòu)建你的自定義模型。博客:https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#configuring-a-training-pipeline現(xiàn)在。訓(xùn)練可能需要一些計(jì)算,但是如果你真的沒有足夠的計(jì)算能力,請不要擔(dān)心!你可以使用Google合作實(shí)驗(yàn)室滿足所有要求!這篇文章(https://www.a(chǎn)nalyticsvidhya.com/blog/2020/03/google-colab-machine-learning-deep-learning) 將教你如何有效地使用它。最后,如果你想往前走了一步,并建立一個最先進(jìn)的YOLO文本探測器模型,該文章(https://www.a(chǎn)nalyticsvidhya.com/blog/2018/12/practical-guide-object-detection-yolo-framewor-python/) 將是一個了解它的所有細(xì)節(jié)的敲門磚,是一個很好的入門教程!
尾注:在這篇文章中,我們討論了OCR中存在的問題以及可以用來解決這項(xiàng)任務(wù)的各種方法。我們還討論了這些方法的各種缺點(diǎn),以及為什么OCR不像看起來那么容易!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?