在資訊大爆炸的時代,我們經常面臨文件、圖片找不到的情況,HarmonyOS基于AI的通用文字識別技術,可以有效幫助我們解決這些難題。
基于AI的通用文字識別,將OCR技術和AI分詞技術集成,可以對圖像信息進行文字檢測、識別和關鍵信息提取,并根據分析結果提供翻譯、搜索等相關服務。
通用文字識別的核心技術是OCR【Optical Character Recognition,光學字符識別】,OCR是一種通過拍照、掃描等光學輸入方式,把各種票據、卡證、表格、報刊、書籍等印刷品文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為計算機等設備可以使用的字符信息的技術。
AI分詞是對于一段輸入文本,自動進行分詞,同時提供不同的分詞粒度。
接下來我們將通過一個“AI文字識別”Demo,為你展示如何三步完成AI應用的開發,心動不如行動,復制下方鏈接,搶先體驗吧~HarmonyOS應用開發在線體驗:https://playground.harmonyos.com/#/cn/onlineDemo
AI文字識別Demo
如下視頻所示,點擊在線體驗鏈,進入 “AI文字識別”Demo后,會看到圖片列表中已經收錄不同圖片,接著在輸入框中輸入關鍵詞,點擊識別搜索后,會彈出一個提示框,點擊提示框的“下一步”,搜索結果列表就會展示與關鍵詞相關的圖片。
只需輸入關鍵詞,就可以匹配得到我們想要的圖片,再也不用懼怕茫茫圖海中找不到圖的窘境了。如此方便高效的AI應用,只需三步就能完成,接下來我們將我大家揭秘是此AI應用如何通過三步完成的 。
第一步,圖片文字識別
如圖1所示,通過調用API:ITextDetector.detect(),對圖片上的文字進行識別。具體實現是在代碼21行的textDetector,此處傳入了需要識別的Image( “有獎征文”圖)和一個 text組件,text組件將保存Image識別的結果,然后通過22行的sendResult將文字識別結果發送到主線程。更多API詳情請點擊下方官網鏈接。
ITextDetector.detect()官網介紹:
https://developer.harmonyos.com/cn/docs/documentation/doc-references/itextdetector-0000001054200044
第二步,智能分詞
如圖2所示,通過調用API:NluClient.getWordSegment(),將輸入的內容根據不同的詞語粒度,自動分割為數個關鍵詞。如:在搜索框中輸入“有獎征文”,系統會將關鍵詞分成“有獎”和“征文”。具體實現是在代碼13行getWordSegment,參數requestData為輸入的關鍵詞,然后通過14行的sendResult發送分詞結果。更多API詳情請點擊下方官網鏈接。
NluClient.getWordSegment()官網介紹:
https://developer.harmonyos.com/cn/docs/documentation/doc-references/nluclient-0000001054518788
第三步,匹配圖片
如圖3所示,最后一步很簡單,就是將分詞后的“有獎征文”和圖片識別的文字匹配,具體實現是將代碼第4行的list(關鍵詞集合)與第5行的imageInfos(圖片文字識別結果集合)進行匹配,如果滿足匹配條件,就會獲取匹配的圖片并展示在搜索結果中。至此,就通過了簡單的三步完成一個使用AI能力進行圖片搜索的應用。
AI能力概述
了解完通用文字識別和分詞的AI能力,是不是感覺AI原來離我們這么近,使用起來也這么簡單呢?其實除了這兩項AI能力以外(如圖4所示),HarmonyOS還支持文檔檢測校正、文字圖像超分、IM類意圖識別、語音識別、語音播報等13類AI能力,開箱即用,開發者可以靈活、便捷地選擇AI能力,使應用變得更加智能。
編輯:jq
-
圖像信息
+關注
關注
0文章
6瀏覽量
6760 -
AI
+關注
關注
87文章
30805瀏覽量
268930 -
文字識別
+關注
關注
0文章
16瀏覽量
8636 -
OCR
+關注
關注
0文章
144瀏覽量
16353 -
HarmonyOS
+關注
關注
79文章
1974瀏覽量
30154
原文標題:萌新也能開發AI應用?立即在線體驗
文章出處:【微信號:gh_019562b5fb4b,微信公眾號:gh_019562b5fb4b】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論