應(yīng)用展望 - 語(yǔ)音識(shí)別系統(tǒng)中增加圖像識(shí)別技術(shù)的設(shè)計(jì)應(yīng)用

　　3 應(yīng)用展望

　　語(yǔ)音識(shí)別是一種賦能技術(shù)，現(xiàn)有的很多人機(jī)交互界面都可能通過補(bǔ)充語(yǔ)音識(shí)別功能而得到改善。語(yǔ)音識(shí)別技術(shù)可以把費(fèi)腦、費(fèi)力、費(fèi)時(shí)的機(jī)器操作變成一件很容易且有趣味性的事情，在許多“手忙”、“手不能用”、“手所不能及”、“懶得動(dòng)手”的場(chǎng)景中，包括像駕駛室、一些危險(xiǎn)的工業(yè)場(chǎng)合、家電控制等方面，高識(shí)別率的語(yǔ)音識(shí)別系統(tǒng)將會(huì)更加方便人的工作和生活。

　　由于知識(shí)層次和知識(shí)領(lǐng)域的差異，現(xiàn)實(shí)生活中有相當(dāng)一部分人很難享受到現(xiàn)代化生活帶來(lái)的便利，包括信息服務(wù)和其他各類先進(jìn)設(shè)備可提供的幫助。高識(shí)別率語(yǔ)音識(shí)別技術(shù)有助于改善這種情況，使社會(huì)各個(gè)階層更多的人享受到更多的社會(huì)信息資源和現(xiàn)代化服務(wù)，提高整個(gè)社會(huì)的信息化程度和現(xiàn)代化速度。

　　高識(shí)別率語(yǔ)音識(shí)別技術(shù)還將推出機(jī)器人智能技術(shù)的發(fā)展，由于機(jī)器人本來(lái)就要配置視覺系統(tǒng)，本方案很容易實(shí)現(xiàn)，提高了人與機(jī)器交互的能力。另外高識(shí)別率語(yǔ)音識(shí)別技術(shù)在語(yǔ)音錄入系統(tǒng)、會(huì)議實(shí)時(shí)記錄及同聲翻譯、記者采訪設(shè)備等方向有著廣闊的應(yīng)用前景。

　　語(yǔ)音識(shí)別技術(shù)關(guān)系到多學(xué)科的研究領(lǐng)域，不同領(lǐng)域中的研究成果都對(duì)語(yǔ)音識(shí)別的發(fā)展作出了貢獻(xiàn)。讓機(jī)器識(shí)別語(yǔ)音的困難在某種程度上就像一個(gè)外語(yǔ)不好的人聽外國(guó)人講話一樣，它與說(shuō)話人、說(shuō)話速度、說(shuō)話內(nèi)容、環(huán)境條件有關(guān)。語(yǔ)音信號(hào)本身的特點(diǎn)造成了語(yǔ)音識(shí)別的困難。

　　這些特點(diǎn)包括多變性、動(dòng)態(tài)性、瞬時(shí)性和連續(xù)性等。

　　計(jì)算機(jī)語(yǔ)音識(shí)別的過程與人對(duì)語(yǔ)音識(shí)別處理過程基本上是一致的。目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論。一個(gè)芫整的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分：語(yǔ)音特征提取其目的是從語(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。

　　聲學(xué)模型與模式匹配（識(shí)別算法）：聲學(xué)模型通常將獲取的語(yǔ)音特征通過學(xué)習(xí)算法產(chǎn)生。在識(shí)別時(shí)將輸入的語(yǔ)音特征與聲學(xué)模型（模式）進(jìn)行匹配、比較，得到最佳的識(shí)別結(jié)果。

　　語(yǔ)言模型與語(yǔ)言處理語(yǔ)言模型包括由識(shí)別語(yǔ)音命令構(gòu)成的語(yǔ)法網(wǎng)緒或由統(tǒng)計(jì)方法構(gòu)成的語(yǔ)言模型，語(yǔ)言處理可以進(jìn)行語(yǔ)法、語(yǔ)義分析。對(duì)小詞表語(yǔ)音識(shí)別系統(tǒng)，通常不需要語(yǔ)言處理部分。

　　聲學(xué)模型是識(shí)別系統(tǒng)的底層模型，并且是語(yǔ)音識(shí)別系統(tǒng)中最關(guān)鍵的一部分。聲學(xué)模型的目的是提供一種有效的方法，計(jì)算語(yǔ)音的特征矢量序列和每個(gè)發(fā)音模板之間的距離。聲學(xué)模型的設(shè)計(jì)與語(yǔ)言發(fā)音特點(diǎn)密切相關(guān)。

　　聲學(xué)模型單元大小（字發(fā)音模型、半音節(jié)模型或音素模型）對(duì)語(yǔ)音訓(xùn)練數(shù)據(jù)量大小、系統(tǒng)識(shí)別率以及靈活性有較大的影響。必須根據(jù)不同語(yǔ)言的特點(diǎn)、識(shí)別系統(tǒng)詞匯量的大小決定識(shí)別單元的大小。

　　語(yǔ)言模型對(duì)中、大詞匯量的語(yǔ)音識(shí)別系統(tǒng)特別重要。當(dāng)分類發(fā)生錯(cuò)誤時(shí)可以根據(jù)語(yǔ)言學(xué)模型、語(yǔ)法結(jié)構(gòu)、語(yǔ)義學(xué)進(jìn)行判斷糾正，特別是一些同音字則必須通過上下文結(jié)構(gòu)才能確定詞義。語(yǔ)言學(xué)理論包括語(yǔ)義結(jié)構(gòu)、語(yǔ)法規(guī)則、語(yǔ)言的數(shù)學(xué)描述模型等有關(guān)方面。目前比較成功的語(yǔ)言模型通常是采用統(tǒng)計(jì)語(yǔ)法的語(yǔ)言模型與基于規(guī)則語(yǔ)法結(jié)構(gòu)命令的語(yǔ)言模型。語(yǔ)法結(jié)構(gòu)可以限定不同詞之間的相互連接關(guān)系，減少了識(shí)別系統(tǒng)的搜索空間，這有利于提高系統(tǒng)的識(shí)別。

　　語(yǔ)音識(shí)別過程實(shí)際上是一種認(rèn)識(shí)過程。就像人們聽語(yǔ)音時(shí)，并不把語(yǔ)音和語(yǔ)言的語(yǔ)法結(jié)構(gòu)、語(yǔ)義結(jié)構(gòu)分開。

　　因?yàn)楫?dāng)語(yǔ)音發(fā)音模糊時(shí)人們可以用這些知識(shí)來(lái)指導(dǎo)對(duì)語(yǔ)言的理解過程，但是對(duì)機(jī)器來(lái)說(shuō)，識(shí)別系統(tǒng)也要利用這些知識(shí)，只是如何有效地描述這些語(yǔ)法和語(yǔ)義還有困難：小詞匯量語(yǔ)音識(shí)別系統(tǒng)包括幾十個(gè)詞的語(yǔ)音識(shí)別系統(tǒng)。

　　中等詞匯量的語(yǔ)音識(shí)別系統(tǒng)通常包括幾百個(gè)詞至上干個(gè)詞的識(shí)別系統(tǒng)。

　　大詞匯量語(yǔ)音識(shí)別系統(tǒng)通常包括幾干至幾萬(wàn)個(gè)詞的語(yǔ)音識(shí)別系統(tǒng)。

　　這些不同的限制也確定了語(yǔ)音識(shí)別系統(tǒng)的困難度。

　　由于有了種種困難，語(yǔ)音識(shí)別技術(shù)通常根據(jù)使用中的限制性要求，構(gòu)建成不同類型的系統(tǒng)，通常包括三類。

　　其一為限制用戶的說(shuō)話方式，這又可以分為孤立詞語(yǔ)音音識(shí)別系統(tǒng)（connected-wordsspeechrecognitionsystem）、連續(xù)語(yǔ)音識(shí)別系統(tǒng)（continuespeechrecognitionsystem）和即興口語(yǔ)語(yǔ)音識(shí)別系統(tǒng)（spontaneousspeechrecognitionsystem）。其二為限制用戶的用詞范圍。第三種為限制系統(tǒng)的用戶對(duì)象。

　　1增加圖像識(shí)別設(shè)計(jì)的目的如今的語(yǔ)音識(shí)別技術(shù)正在逐漸成熟，許多語(yǔ)音識(shí)別技術(shù)都已經(jīng)能夠達(dá)到很高的識(shí)別率了，不過當(dāng)識(shí)別率到了一定的程度后，再提高就很困難，此時(shí)需要采用其他技術(shù)來(lái)協(xié)助語(yǔ)音的識(shí)別。

　　目前的語(yǔ)音識(shí)別系統(tǒng)由于采用單一傳感器（聲音傳感器）進(jìn)行工作，在進(jìn)行語(yǔ)音識(shí)別時(shí)，不可能對(duì)捕獲的語(yǔ)音信息進(jìn)行細(xì)分，只能采用定速率跟蹤識(shí)別，將語(yǔ)音信息與系統(tǒng)庫(kù)中的模板進(jìn)行匹配判斷。如果捕獲信息的速率與存儲(chǔ)在系統(tǒng)庫(kù)中的模板相差不多，則能正常工作，否則將會(huì)出現(xiàn)誤判。然而現(xiàn)實(shí)生活中，人們說(shuō)話不可能總保持相同的速率，而是不斷變化的，這勢(shì)必造成了語(yǔ)音識(shí)別系統(tǒng)的誤差增多，以致降低語(yǔ)音識(shí)別系統(tǒng)的實(shí)用性。

　　人們?cè)谶M(jìn)行語(yǔ)言交流時(shí)，在捕獲語(yǔ)音信息的同時(shí)，也在獲取其他的信息以幫助理解，例如表情、神態(tài)等信息。如果得不到相關(guān)信息，人們相互之間也會(huì)產(chǎn)生誤解，例如當(dāng)兩個(gè)人在相隔較遠(yuǎn)距離時(shí)，由于不能清楚對(duì)方的表情、神態(tài)，經(jīng)常會(huì)出現(xiàn)理解錯(cuò)誤的情況發(fā)生。可見使用單一的信息渠道的確會(huì)增加理解難度，因此有必要考慮增加信息渠道來(lái)解決這個(gè)問題。這就是增加圖像識(shí)別功能的原因。

　　對(duì)于語(yǔ)音識(shí)別系統(tǒng)，如果能像人一樣判斷語(yǔ)言對(duì)象的喜、怒、哀、樂，當(dāng)然是最好的，但這勢(shì)必大大增加圖像識(shí)別的工作量，甚至超過語(yǔ)音識(shí)別的成本，不太合理。

　　并且，由于技術(shù)的原因，還不能使機(jī)器有像人一樣的視覺能力，要讓機(jī)器能夠準(zhǔn)確識(shí)別出人的各種表情還達(dá)不到，所以此種方案是不可取的。進(jìn)一步分析知道，語(yǔ)音識(shí)別系統(tǒng)受語(yǔ)速的影響是很大的。人在正常講話時(shí)，嘴的開合狀態(tài)都是大同小異的，如果讓機(jī)器只對(duì)嘴的開合兩種情況進(jìn)行判斷和實(shí)時(shí)跟蹤，得出講話人的語(yǔ)速信息，是能夠做到的。所以僅僅需要機(jī)器識(shí)別出人說(shuō)話的速度，以此來(lái)調(diào)整語(yǔ)音識(shí)別的匹配速度，從而適合語(yǔ)音韻律，自然有利于系統(tǒng)的語(yǔ)音識(shí)別能力，提高識(shí)別的準(zhǔn)確性。通過語(yǔ)速對(duì)語(yǔ)音識(shí)別系統(tǒng)的幫助，將為語(yǔ)音系統(tǒng)提供另一條實(shí)用的信息渠道。

　　采用語(yǔ)速作為系統(tǒng)的第二信息渠道，一旦系統(tǒng)跟蹤到了目標(biāo)的語(yǔ)速，在協(xié)助語(yǔ)音識(shí)別的同時(shí)還能夠有效地排除與語(yǔ)音信息不同步的外界噪聲，因此系統(tǒng)能夠獲得更好的識(shí)別性能。

　　2實(shí)現(xiàn)的技術(shù)及方法2.1系統(tǒng)總體設(shè)計(jì)概述語(yǔ)音系統(tǒng)采集說(shuō)話人（語(yǔ)言對(duì)象）的兩路信息，一路由聲音傳感器取得，一路由攝像設(shè)備取得。攝像設(shè)備取得人的嘴型變化后，將之轉(zhuǎn)化為語(yǔ)速信息送到語(yǔ)音識(shí)別器與采集到的語(yǔ)音進(jìn)行匹配識(shí)別，自動(dòng)調(diào)節(jié)識(shí)別速度，更好地芫成語(yǔ)音識(shí)別工作。系統(tǒng)的工作流程如。

　　2.2輔助圖像識(shí)別設(shè)計(jì)捕獲語(yǔ)言對(duì)象的說(shuō)話速率是保證整個(gè)系統(tǒng)良好工作的關(guān)鍵。為了實(shí)現(xiàn)此目的，使用基于機(jī)器視覺的人嘴部狀態(tài)檢測(cè)方法來(lái)設(shè)計(jì)。由于對(duì)圖像的識(shí)別精度要求不高，可以選擇灰度圖像以提高運(yùn)算速度。在速度允許的情況下，彩色圖像的識(shí)別精度會(huì)更高。

　　流程分析整個(gè)輔助圖像識(shí)別設(shè)計(jì)的目的就是通過機(jī)器視覺進(jìn)行圖像采集、圖像處理，提取出說(shuō)話人的語(yǔ)速信息供語(yǔ)音系統(tǒng)使用。

　　以灰度圖像為例，其圖像處理過程如。

　　采樣（像索mxn）*》量化（處理灰度G）*完成圖像數(shù)字化y進(jìn)一步抽象及描述 |分類、識(shí)別及理解圖特征*田像的特征提取特征空間圄2灰度圄像的處理流程對(duì)于彩色圖像，特征量會(huì)更多一些，也就更復(fù)雜一些，但其基本步驟都是先芫成圖像數(shù)字化，再進(jìn)行圖像特征提取，最后進(jìn)行圖像識(shí)別和理解。

　　當(dāng)芫成圖像處理后，比較模塊將這一幀圖像與上一幀圖像的數(shù)據(jù)進(jìn)行對(duì)比，判斷出變化，從而統(tǒng)計(jì)出語(yǔ)速信息，最后輸出給語(yǔ)音識(shí)別器進(jìn)行匹配工作。

　　圖像處理算法設(shè)計(jì)經(jīng)過對(duì)人臉RGB像素的分析，發(fā)現(xiàn)人臉圖像中的R、G兩分量符合二維高斯分布。因此，可通過這兩個(gè)分量確定人臉的位置。在人臉定位的基礎(chǔ)上，根據(jù)人的嘴部處于人臉下半部分的特征，比較容易確定出嘴部的大致位置，它為嘴部精確定位提供了基本條件，如所示。

　　根據(jù)系統(tǒng)要求，灰度圖像可以滿足需要，但由于嘴唇與皮膚的灰度差別不大，而且灰度信息更容易受到光照條件、人臉的運(yùn)動(dòng)和旋轉(zhuǎn)變化等影響，使人臉圖像中嘴唇區(qū)域邊緣不明顯，特別是當(dāng)嘴唇內(nèi)部的陰影區(qū)域與牙齒交替出現(xiàn)時(shí)，嘴唇的邊緣變得更加模糊。所以利用唇色和膚色的灰度及邊緣信息分割不能達(dá)到很高的準(zhǔn)確度。若要提高對(duì)嘴部狀況的識(shí)別準(zhǔn)確度，可以利用彩色信息來(lái)對(duì)人嘴的形狀、位置進(jìn)行確定。

　　研究發(fā)現(xiàn)，嘴唇的主要顏色特征是唇色相對(duì)膚色顏色較紅，而且歸一化RGB顏色對(duì)光照、人臉運(yùn)動(dòng)和旋轉(zhuǎn)具有不變性。因此利用顏色信息，采用模式分類技術(shù)分割嘴唇區(qū)域，可以克服灰度圖像本身固有的缺點(diǎn)。由于Fisher線性分類器能夠最大限度地分開兩類，且其學(xué)習(xí)是離線處理，減少了計(jì)算量，因此可采用Fisher線性分類器進(jìn)行嘴唇區(qū)域分割。

　　人嘴在說(shuō)話與正常情況下的外形有明顯的區(qū)別。說(shuō)話時(shí)嘴部張開較大，而正常情況下，嘴部基本閉合（）。因此，可以利用這些特征進(jìn)行嘴部狀態(tài)的檢測(cè)。研究中發(fā)現(xiàn)，嘴部區(qū)域的最大寬度WU、最大高度Hmx能夠表征嘴部的張開程度，應(yīng)取為特征值；上嘴唇與下嘴唇之間的高度H在說(shuō)話和不說(shuō)話時(shí)也有明顯不同，應(yīng)取為特征值。將以上三個(gè)特征值組成一組向量，即可描述出不同狀態(tài)下的嘴部幾何特征，如所示。

　　將獲得的能夠描述人的嘴部區(qū)域幾何形狀特征參數(shù)組成一個(gè)特征向量Zu，即可作為下一步判別分類的在進(jìn)行識(shí)別時(shí)只要確定兩個(gè)狀態(tài)“開”、“合”即可。

　　在實(shí)際中由于發(fā)音時(shí)不同的語(yǔ)音會(huì)導(dǎo)致嘴的開合程度不一，所以對(duì)“開”（氏》0）的區(qū)分會(huì)很多種情況，必然會(huì)極大地增加運(yùn)算存儲(chǔ)量。相對(duì)而言，嘴的“閉合”狀態(tài)一般只有一種模式（HmO），因此可以只確定說(shuō)話人嘴的“閉合”狀態(tài)，其他狀態(tài)都判為“開”，這樣將方便處理。

　　由于對(duì)識(shí)別精度要求不高，既可以采用傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別方法，也可以采用較熱門的神經(jīng)網(wǎng)緒識(shí)別方法；但由于系統(tǒng)對(duì)實(shí)時(shí)要求較高，而神經(jīng)網(wǎng)緒識(shí)別方法運(yùn)行速度成問題，因此不建議采用神經(jīng)網(wǎng)緒識(shí)別方法。

　　2.3語(yǔ)速信息的提取選用合適的捕獲頻率不斷采集說(shuō)話人的圖像，用當(dāng)前幀的數(shù)據(jù)與上一幀數(shù)據(jù)進(jìn)行比較，根據(jù)其變化的頻率就可以推算出語(yǔ)速信息。實(shí)際情況中，所求的語(yǔ)速信息不需要太精確就能夠達(dá)到一般要求。

　　3應(yīng)用展望語(yǔ)音識(shí)別是一種賦能技術(shù)，現(xiàn)有的很多人機(jī)交互界面都可能通過補(bǔ)充語(yǔ)音識(shí)別功能而得到改善。語(yǔ)音識(shí)別技術(shù)可以把費(fèi)腦、費(fèi)力、費(fèi)時(shí)的機(jī)器操作變成一件很容易且有趣味性的事情，在許多“手忙”、“手不能用”、“手所不能及”、“懶得動(dòng)手”的場(chǎng)景中，包括像駕駛室、一些危險(xiǎn)的工業(yè)場(chǎng)合、家電控制等方面，高識(shí)別率的語(yǔ)音識(shí)別系統(tǒng)將會(huì)更加方便人的工作和生活。

　　高識(shí)別率語(yǔ)音識(shí)別技術(shù)還將推動(dòng)機(jī)器人智能化技術(shù)的發(fā)展。由于機(jī)器人本來(lái)就要配置視覺系統(tǒng)，本方案很容易實(shí)現(xiàn)，提高了人與機(jī)器交互的能力。另外高識(shí)別率語(yǔ)音識(shí)別技術(shù)在語(yǔ)音錄入系統(tǒng)、會(huì)議實(shí)時(shí)記錄及同聲翻譯、記者采訪設(shè)備等方向有著廣闊的應(yīng)用前景。

閱讀全文

上一頁(yè)1 23全文

本文導(dǎo)航

第 1 頁(yè)：語(yǔ)音識(shí)別系統(tǒng)中增加圖像識(shí)別技術(shù)的設(shè)計(jì)應(yīng)用
第 2 頁(yè)：增加圖像識(shí)別設(shè)計(jì)的目的
第 3 頁(yè)：應(yīng)用展望

圖像識(shí)別(37828) 圖像識(shí)別(37828)
語(yǔ)音識(shí)別(111781) 語(yǔ)音識(shí)別(111781)

評(píng)論

相關(guān)推薦

智能家庭應(yīng)用之語(yǔ)音識(shí)別系統(tǒng)

開發(fā)基于自然語(yǔ)言的語(yǔ)音識(shí)別系統(tǒng)面臨許多技術(shù)挑戰(zhàn)，包括使用精確的語(yǔ)音識(shí)別引擎將機(jī)器聽到的內(nèi)容翻譯成文字—以及一個(gè)綜合的自然語(yǔ)言處理器

2015-10-20 09:31:10

3998

1小時(shí)玩轉(zhuǎn)AI語(yǔ)音識(shí)別

`報(bào)名鏈接：http://t.elecfans.com/live/563.html直播主題及亮點(diǎn)本次直播講解AI語(yǔ)音識(shí)別核心技術(shù)知識(shí)以及語(yǔ)音識(shí)別系統(tǒng)架構(gòu)，現(xiàn)場(chǎng)實(shí)操寫代碼實(shí)現(xiàn)語(yǔ)音采集、語(yǔ)音傳輸與解析

2018-09-19 13:40:42

圖像識(shí)別技術(shù)在印刷線路板精密測(cè)試中的應(yīng)用

結(jié)果如圖5。經(jīng)分析，該導(dǎo)線實(shí)際寬度為L(zhǎng)0=286.2μm，測(cè)試數(shù)值為最大寬度Lmax=286.8μm，最小寬度Lmin=285.8μm，則測(cè)量系統(tǒng)的誤差為：　　將圖像識(shí)別技術(shù)應(yīng)用于印制線路板的精密測(cè)量，試驗(yàn)結(jié)果表明該系統(tǒng)具有較高的測(cè)試精度(0.6μm)，可滿足印制線路板的高精度測(cè)量。:

2018-11-22 11:01:25

語(yǔ)音識(shí)別的現(xiàn)狀如何？

語(yǔ)音識(shí)別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理，經(jīng)過Labiner等人的研究，卡內(nèi)基梅隆大學(xué)的李開復(fù)最終實(shí)現(xiàn)了第一個(gè)基于隱馬爾科夫模型的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx。此后嚴(yán)格來(lái)說(shuō)語(yǔ)音識(shí)別技術(shù)并沒有脫離HMM框架。

2019-10-08 14:29:52

語(yǔ)音識(shí)別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

語(yǔ)音識(shí)別系統(tǒng)在智能家庭系統(tǒng)中的應(yīng)用是什么？

2021-05-31 06:54:34

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究

FPGA和Nios_軟核的語(yǔ)音識(shí)別系統(tǒng)的研究引言語(yǔ)音識(shí)別的過程是一個(gè)模式匹配的過程在這個(gè)過程中，首先根據(jù)說(shuō)話人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型，對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析，并提取所需的語(yǔ)音特征，在此基礎(chǔ)上建立

2012-08-11 11:47:15

arduino哪個(gè)開發(fā)板可以做圖像識(shí)別？

arduino哪個(gè)開發(fā)板可以做圖像識(shí)別

2023-09-22 06:49:27

【HarmonyOS HiSpark AI Camera】基于本平臺(tái)開源圖像識(shí)別與應(yīng)用

項(xiàng)目名稱：基于本平臺(tái)開源圖像識(shí)別與應(yīng)用試用計(jì)劃：申請(qǐng)理由本人有多年的學(xué)習(xí)和開發(fā)經(jīng)驗(yàn)，曾參與國(guó)內(nèi)開源軟件的開發(fā)，對(duì)計(jì)算機(jī)圖像標(biāo)定技術(shù)，圖像識(shí)別，基于標(biāo)識(shí)的跟蹤注冊(cè)技術(shù)有過深入的學(xué)習(xí)和探索。想借助發(fā)燒友

2020-11-19 09:45:40

【NUCLEO-F412ZG申請(qǐng)】圖像識(shí)別

申請(qǐng)理由：項(xiàng)目描述：到手后將主要研究個(gè)關(guān)于圖像識(shí)別方面的功能，攝像頭采集圖像數(shù)據(jù)然后對(duì)圖像進(jìn)行處理，最終的目的是識(shí)別出圖像中的文字符號(hào)內(nèi)容（主要是字母數(shù)字的識(shí)別），以便于測(cè)試STM32的運(yùn)算性能。

2016-11-07 16:34:55

使用緊急呼叫和DSP的語(yǔ)音識(shí)別系統(tǒng)

開發(fā)并測(cè)試了安裝在汽車內(nèi)、使用簡(jiǎn)單離散字的特定發(fā)音人語(yǔ)音識(shí)別系統(tǒng)。

2019-11-04 07:23:41

幾類汽車識(shí)別系統(tǒng)的經(jīng)典設(shè)計(jì)方案

車牌識(shí)別技術(shù)是計(jì)算機(jī)視頻圖像識(shí)別技術(shù)在車輛牌照識(shí)別中的一種應(yīng)用。車牌識(shí)別技術(shù)要求能夠?qū)⑦\(yùn)動(dòng)中的汽車牌照從復(fù)雜背景中提取并識(shí)別出來(lái)，通過車牌提取、圖像預(yù)處理、特征提取、車牌字符識(shí)別等技術(shù)，識(shí)別車輛牌號(hào)

2019-06-28 08:29:44

基于ATMEGAl28的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

量大，一般在計(jì)算機(jī)上實(shí)現(xiàn)，即使是嵌入式方面，多數(shù)方案也需要運(yùn)算能力強(qiáng)的ARM或DSP，并且外擴(kuò)RAM、FLASH等資源，增加了硬件成本，這些特點(diǎn)無(wú)疑限制了語(yǔ)音識(shí)別技術(shù)的應(yīng)用，尤其是嵌入式領(lǐng)域。本系統(tǒng)

2014-03-17 13:31:40

基于AVR單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

通過簡(jiǎn)單的修改，可以很方便地將LD3320驅(qū)動(dòng)程序移植到各種嵌入式系統(tǒng)中。隨著人們對(duì)人工智能功能的需求，語(yǔ)音識(shí)別技術(shù)將越來(lái)越受到人們的關(guān)注，相信不久的將來(lái)，語(yǔ)音識(shí)別將會(huì)擁有更廣闊的應(yīng)用。

2021-01-13 15:54:14

基于DSP的快速紙幣圖像識(shí)別技術(shù)研究

本課題通過對(duì)現(xiàn)有圖像識(shí)別技術(shù)進(jìn)行研究和分析，針對(duì)當(dāng)前DSP(數(shù)字信號(hào)處理)技術(shù)的新發(fā)展，提出了基于DSP的快速圖像識(shí)別概念。快速圖像識(shí)別技術(shù)以嵌入式系統(tǒng)為算法的實(shí)現(xiàn)平臺(tái)，它結(jié)合了當(dāng)前最新的數(shù)信號(hào)處理

2014-11-05 14:43:48

基于DSP的漢字語(yǔ)音識(shí)別系統(tǒng)如何實(shí)現(xiàn)

基于DSP的漢字語(yǔ)音識(shí)別系統(tǒng)如何實(shí)現(xiàn)

2021-03-12 06:33:15

基于FPGA的車輛牌照識(shí)別系統(tǒng)的設(shè)計(jì)

基于FPGA的車輛牌照識(shí)別系統(tǒng)的設(shè)計(jì)介紹了一種以FPGA 芯片為核心，基于SoPC技術(shù)實(shí)現(xiàn)的車輛牌照識(shí)別系統(tǒng)。系統(tǒng)通過CCD攝像頭完成含車牌圖像的采集，經(jīng)過系統(tǒng)的存儲(chǔ)、處理來(lái)實(shí)現(xiàn)車牌識(shí)別的目的。系統(tǒng)具有良好的便攜性、靈活性和通用性。詳細(xì)的論述了該系統(tǒng)硬件結(jié)構(gòu)和軟件設(shè)計(jì)思想，并分析了系統(tǒng)具有的優(yōu)點(diǎn)。

2012-08-11 15:35:45

基于HMM的語(yǔ)音識(shí)別系統(tǒng)是怎么訓(xùn)練的

基于HMM的語(yǔ)音識(shí)別系統(tǒng)是怎么訓(xùn)練的？有哪些步驟？

2021-12-23 06:16:50

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

2020-03-07 16:41:15

基于LabVIEW的語(yǔ)音識(shí)別系統(tǒng)

請(qǐng)大家?guī)蛶兔Γ贚abVIEW的語(yǔ)音識(shí)別系統(tǒng)，要求先錄幾個(gè)人的聲音做樣板，然后再讓其中一個(gè)人說(shuō)話，能辨別出是誰(shuí)說(shuō)的

2013-05-16 11:16:15

基于STM32嵌入式的孤立詞語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)

語(yǔ)音識(shí)別是機(jī)器通過識(shí)別和理解過程把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本或命令的技術(shù)，其根本目的是研究出一種具有聽覺功能的機(jī)器。本設(shè)計(jì)研究孤立詞語(yǔ)音識(shí)別系統(tǒng)及其在STM32嵌入式平臺(tái)上的實(shí)現(xiàn)。識(shí)別流程是：預(yù)

2021-08-06 08:32:00

基于labview的語(yǔ)音識(shí)別

處理過程基本上是一致的。目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論。一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分：（1）語(yǔ)音特征提取：其目的是從語(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。（2）聲學(xué)模型

2019-03-10 22:00:15

基于vuforia的圖像識(shí)別Jar的使用

Jar包整合入安卓程序中。首先，新建一個(gè)安卓應(yīng)用程序。將提供的Jar包和so庫(kù)復(fù)制粘貼到程序的libs文件夾中（若無(wú)此文件夾則新建）。然后，在需要調(diào)用圖像識(shí)別Activity的時(shí)候，只需要新建一個(gè)

2018-09-20 11:58:15

如何去實(shí)現(xiàn)一種特定人語(yǔ)音識(shí)別系統(tǒng)？

特定人語(yǔ)音識(shí)別的方法有哪些？特定人語(yǔ)音識(shí)別系統(tǒng)是由哪些部分組成的？如何去實(shí)現(xiàn)一種特定人語(yǔ)音識(shí)別系統(tǒng)？

2021-05-19 06:44:14

如何構(gòu)建基于圖像識(shí)別的印制線路板精密測(cè)試系統(tǒng)？

如何構(gòu)建基于圖像識(shí)別的印制線路板精密測(cè)試系統(tǒng)？圖像識(shí)別技術(shù)在印刷線路板精密測(cè)試中的應(yīng)用

2021-04-27 06:25:52

如何用單片機(jī)實(shí)現(xiàn)圖像識(shí)別？

如何用單片機(jī)實(shí)現(xiàn)圖像識(shí)別

2023-10-25 06:43:45

嵌入式語(yǔ)音識(shí)別系統(tǒng)中的電路設(shè)計(jì)是如何的

調(diào)高點(diǎn)或者調(diào)低點(diǎn)，空調(diào)就會(huì)做相應(yīng)的反應(yīng)，那到底是如何來(lái)實(shí)現(xiàn)這些語(yǔ)音交互的呢，那就得說(shuō)嵌入式語(yǔ)音識(shí)別系統(tǒng)了，今天我們先來(lái)看一下嵌入式語(yǔ)音識(shí)別系統(tǒng)中的電路設(shè)計(jì)是如何的，是如何實(shí)現(xiàn)這些語(yǔ)音交互的。語(yǔ)音識(shí)別在現(xiàn)...

2021-12-20 07:52:03

嵌入式語(yǔ)音識(shí)別系統(tǒng)在生活中的應(yīng)用有哪些呢

嵌入式語(yǔ)音識(shí)別系統(tǒng)是什么？嵌入式語(yǔ)音識(shí)別系統(tǒng)在生活中的應(yīng)用有哪些呢？

2021-12-23 08:27:03

微軟語(yǔ)音識(shí)別系統(tǒng)錯(cuò)誤率僅為5.1%，達(dá)成新的精準(zhǔn)里程碑！

　　導(dǎo)讀：微軟今天宣布，其會(huì)話語(yǔ)音識(shí)別系統(tǒng)的誤率達(dá)到了5.1%，是目前為止最低的。 [img][/img] 　　這一數(shù)據(jù)超過了微軟人工智能和研究團(tuán)隊(duì)去年5.9%的誤差率，并將其準(zhǔn)確性與專業(yè)的人

2017-08-23 09:18:35

怎么做圖像識(shí)別？

怎么做圖像識(shí)別

2015-07-22 23:23:16

怎么實(shí)現(xiàn)基于STM32F103單片機(jī)的車牌識(shí)別圖像處理識(shí)別系統(tǒng)的設(shè)計(jì)？

STM32的主要優(yōu)點(diǎn)是什么？怎么實(shí)現(xiàn)基于STM32F103單片機(jī)的車牌識(shí)別圖像處理識(shí)別系統(tǒng)的設(shè)計(jì)？

2021-09-29 06:29:46

怎么實(shí)現(xiàn)基于射頻技術(shù)的無(wú)線識(shí)別系統(tǒng)設(shè)計(jì)？

本文給出一種實(shí)現(xiàn)簡(jiǎn)單射頻識(shí)別系統(tǒng)的方式。閱讀器和應(yīng)答器均包含在單片機(jī)控制系統(tǒng)中，利用ASK調(diào)制與解調(diào)電路以及匹配網(wǎng)絡(luò)電路，使整個(gè)系統(tǒng)的可識(shí)別有效距離約為8．3cm，有一定的使用價(jià)值。

2021-06-03 06:33:01

怎么設(shè)計(jì)基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)？

隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展，語(yǔ)音口令識(shí)別已經(jīng)成為了人機(jī)交互的一個(gè)重要方式之一。語(yǔ)音口令識(shí)別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語(yǔ)給出響應(yīng)，如通過語(yǔ)音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運(yùn)行或做出

2019-09-03 08:27:23

怎樣去搭建一個(gè)基于kaldi的在線語(yǔ)音識(shí)別系統(tǒng)

(GMM+HMM+NGRAM)概述）。一段時(shí)間后老板就布置了具體任務(wù)：在我們公司自己的ARM芯片上基于kaldi搭建一個(gè)在線語(yǔ)音識(shí)別系統(tǒng)，三個(gè)人花三個(gè)月左右的時(shí)間完成。由于我們都是語(yǔ)音識(shí)別領(lǐng)域的小白，要求...

2021-07-29 08:59:19

怎樣去搭建一個(gè)基于kaldi的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢

怎樣去搭建一個(gè)基于kaldi的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢？

2021-12-23 09:30:05

怎樣去搭建一個(gè)基于kaldi的嵌入式在線語(yǔ)音識(shí)別系統(tǒng)

怎樣去搭建一個(gè)基于kaldi的嵌入式在線語(yǔ)音識(shí)別系統(tǒng)？分為哪幾個(gè)階段呢？

2021-10-28 08:37:01

怎樣去設(shè)計(jì)一種基于LD3320芯片的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢

LD3320語(yǔ)音識(shí)別芯片的工作原理是什么？LD3320語(yǔ)音識(shí)別芯片有何應(yīng)用？怎樣去設(shè)計(jì)一種基于LD3320芯片的嵌入式語(yǔ)音識(shí)別系統(tǒng)呢？

2021-12-23 09:50:11

怎樣去設(shè)計(jì)基于嵌入式Linux的語(yǔ)音識(shí)別系統(tǒng)

、超聲波測(cè)距和云臺(tái)的控制，并將語(yǔ)音識(shí)別技術(shù)應(yīng)用于多角度超聲波測(cè)距系統(tǒng)中。通過測(cè)試，系統(tǒng)可以通過識(shí)別語(yǔ)音指令控制測(cè)量方向，無(wú)需手動(dòng)干預(yù)，最后將測(cè)量結(jié)果通過語(yǔ)音播放出來(lái)。1.引言語(yǔ)言是人類傳播信息的重要手段，語(yǔ)音...

2021-11-04 09:03:09

怎樣去設(shè)計(jì)并制作出基于STM32的孤立詞語(yǔ)音識(shí)別系統(tǒng)呢

語(yǔ)音識(shí)別是什么？怎樣去設(shè)計(jì)并制作出基于STM32的孤立詞語(yǔ)音識(shí)別系統(tǒng)呢？

2021-11-08 07:04:19

求一種基于TMS320VC5402的嵌入式音樂語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)方案

音樂語(yǔ)音識(shí)別系統(tǒng)的硬件電路該如何去設(shè)計(jì)？音樂語(yǔ)音識(shí)別系統(tǒng)的軟件該如何去實(shí)現(xiàn)？

2021-12-23 08:50:56

汽車Vin碼識(shí)別系統(tǒng)，就用OCR識(shí)別技術(shù)

案例，全程技術(shù)支持，集成簡(jiǎn)單、快捷。產(chǎn)品組成----------汽車VIN碼識(shí)別系統(tǒng)的優(yōu)勢(shì)——識(shí)別率高、識(shí)別速度快識(shí)別率高達(dá)99%，識(shí)別速度小于1秒------------——汽車VIN碼識(shí)別系統(tǒng)覆蓋

2019-06-28 13:40:19

淺談人臉識(shí)別系統(tǒng)在智慧社區(qū)方面的應(yīng)用

` 隨著科學(xué)技術(shù)的發(fā)展與進(jìn)步，信息技術(shù)已經(jīng)邁入了一個(gè)全新的領(lǐng)域。作為人工智能領(lǐng)域的典型分支技術(shù)，人臉識(shí)別通過比較人臉的視覺特征信息從而進(jìn)行身份鑒別，既屬于圖像識(shí)別，也屬于生物特征識(shí)別。而在智慧城市

2017-09-26 14:03:09

給予labview的圖像識(shí)別系統(tǒng)，，各位高手能指點(diǎn)一下唄

本帖最后由 wangzhihangxing 于 2012-4-28 10:14 編輯本人要做個(gè)圖像識(shí)別系統(tǒng)，，Vision里的模塊不夠缺少processing怎么辦

2012-04-25 22:34:05

貼片機(jī)中的現(xiàn)代視覺與圖像識(shí)別技術(shù)

元件和IC封裝中QFP引腳細(xì)間距化，以及BGA，CSP，COB，F(xiàn)lipChip和MCM的應(yīng)用都對(duì)貼裝精度的要求進(jìn)一步提高，對(duì)視覺與圖像識(shí)別技術(shù)要求也越來(lái)越高。貼片機(jī)中現(xiàn)代視覺與圖像識(shí)別技術(shù)主要有

2018-09-03 10:25:54

車輛牌照識(shí)別系統(tǒng)的原理及算法研究

車輛牌照識(shí)別系統(tǒng)的原理及算法研究本文對(duì)車輛牌照自動(dòng)識(shí)別系統(tǒng)中圖象預(yù)處理、特征提取和字符識(shí)別等環(huán)節(jié)涉及的新算法、新技術(shù)以及系統(tǒng)整體設(shè)計(jì)做了一個(gè)比較全面的論述，同時(shí)針對(duì)目前的研究現(xiàn)狀，對(duì)一些關(guān)鍵

2009-12-02 12:59:27

圖像識(shí)別模組(包括PCB圖、圖像識(shí)別模組源代碼)

圖像識(shí)別模組電路原理圖、圖像識(shí)別模組PCB圖、圖像識(shí)別模組源代碼、圖像識(shí)別模組用戶使用手冊(cè)

2009-01-02 19:14:59

120

基于SPCE061A的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

系統(tǒng)采用凌陽(yáng)SPCE061A 單片機(jī)作為語(yǔ)音識(shí)別系統(tǒng)的主控芯片。通過硬件電路設(shè)計(jì)和軟件代碼部分成功的設(shè)計(jì)并實(shí)現(xiàn)了一種具有語(yǔ)音識(shí)別功能、語(yǔ)音提示(語(yǔ)音合成)及語(yǔ)音回放(語(yǔ)音編

2009-05-26 10:54:08

基于貝葉斯理論的超聲肝圖像識(shí)別系統(tǒng)研究

超聲肝圖像識(shí)別是醫(yī)學(xué)圖像圖像處理的重要分支，也是計(jì)算機(jī)輔助診斷中的一個(gè)重要應(yīng)用，在醫(yī)院常規(guī)檢查和遠(yuǎn)程醫(yī)療中有廣泛的實(shí)際意義和應(yīng)用價(jià)值。本系統(tǒng)對(duì)獲取的圖像進(jìn)行處

2009-05-26 16:31:52

車號(hào)圖像處理與識(shí)別系統(tǒng)的研制

文章介紹了用于火車貨車的車皮號(hào)及自重?cái)?shù)字圖像識(shí)別的計(jì)算機(jī)圖像處理與識(shí)別系統(tǒng)的實(shí)踐。使用濾波和非線性灰度擴(kuò)展，使顯示圖像獲得改善，采用非線性路徑搜索法分割圖像，

2009-06-19 08:36:08

基于ARM的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

語(yǔ)音識(shí)別技術(shù)是語(yǔ)音處理領(lǐng)域的一個(gè)關(guān)鍵技術(shù)。在研究了語(yǔ)音識(shí)別技術(shù)原理的基礎(chǔ)上，本文提出了一種基于ARM 處理器的孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)方案，包括系統(tǒng)硬件設(shè)計(jì)、軟件

2009-09-03 10:52:49

語(yǔ)音識(shí)別系統(tǒng)中增加圖像識(shí)別技術(shù)的設(shè)計(jì)

采用機(jī)器視覺對(duì)語(yǔ)音對(duì)象進(jìn)行跟蹤，利用說(shuō)話人正常發(fā)音時(shí)，嘴部的開合狀況提取語(yǔ)速信息，實(shí)時(shí)調(diào)整語(yǔ)音識(shí)別的工作速度，匹配語(yǔ)音韻律，將有效提高語(yǔ)音識(shí)別準(zhǔn)確性。討論了系

2010-07-16 14:53:59

EAN一13碼的圖像識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

EAN一13碼的圖像識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 0 引言　　自動(dòng)化數(shù)據(jù)采集技術(shù)是信息采集和處理的關(guān)鍵技術(shù)，條碼技術(shù)在自動(dòng)化數(shù)據(jù)采集中占重要地位，得到了廣泛的應(yīng)

2009-12-28 10:58:30

3696

圖像識(shí)別技術(shù)在銀行ATM監(jiān)控的應(yīng)用

文中介紹了圖像識(shí)別技術(shù)在ATM監(jiān)控系統(tǒng)中的應(yīng)用，以及在ATM監(jiān)控中所起到的各項(xiàng)功能。并對(duì)由于設(shè)備能力、現(xiàn)場(chǎng)環(huán)境等客觀因素所造成的圖像識(shí)別技術(shù)，在相關(guān)應(yīng)用上的不足和需要克服

2011-09-05 09:51:06

2740

基于DSP的快速紙幣圖像識(shí)別技術(shù)研究

2011-09-14 15:07:55

158

SPCA563B實(shí)現(xiàn)圖像識(shí)別系統(tǒng)

詳細(xì)介紹基于SPCA563B芯片的 圖像識(shí)別 系統(tǒng)的設(shè)計(jì)思想和硬件電路，給出具體應(yīng)用實(shí)倒。對(duì)CMOS采集的圖像數(shù)據(jù)進(jìn)行預(yù)處理，然后對(duì)其進(jìn)行分割和提取特征.并利用一定的算法進(jìn)行圖像識(shí)別

2011-09-27 14:09:22

3695

基于STM32的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

基于STM32的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

2015-11-09 18:03:00

科大訊飛新一代語(yǔ)音識(shí)別系統(tǒng)解讀

今天，我們就為大家從技術(shù)上揭秘科大訊飛的新一代語(yǔ)音識(shí)別系統(tǒng)。

2016-08-17 14:31:02

3245

基于圖像融合技術(shù)的運(yùn)動(dòng)目標(biāo)圖像識(shí)別研究

基于圖像融合技術(shù)的運(yùn)動(dòng)目標(biāo)圖像識(shí)別研究_王佳欣

2017-01-07 20:32:20

基于語(yǔ)音特征聚類的HMM語(yǔ)音識(shí)別系統(tǒng)研究姚敏鋒

基于語(yǔ)音特征聚類的HMM語(yǔ)音識(shí)別系統(tǒng)研究_姚敏鋒

2017-03-15 08:00:00

語(yǔ)音識(shí)別系統(tǒng)硬軟件方案分析

該設(shè)計(jì)運(yùn)用三星公司的S3C2440，結(jié)合ICRoute公司的高性能語(yǔ)音識(shí)別芯片LD3320，進(jìn)行了語(yǔ)音識(shí)別系統(tǒng)的硬件和軟件設(shè)計(jì)。在嵌入式Linux操作系統(tǒng)下，運(yùn)用多進(jìn)程機(jī)制完成了對(duì)語(yǔ)音識(shí)別芯片

2017-10-15 10:53:42

基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的實(shí)現(xiàn)

引言隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展，語(yǔ)音口令識(shí)別已經(jīng)成為了人機(jī)交互的一個(gè)重要方式之一。語(yǔ)音口令識(shí)別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語(yǔ)給出響應(yīng)，如通過語(yǔ)音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運(yùn)行

2017-12-02 09:09:01

706

對(duì)于圖像識(shí)別的引入、原理、過程、應(yīng)用前景的深度剖析

圖像識(shí)別技術(shù)是信息時(shí)代的一門重要的技術(shù)，其產(chǎn)生目的是為了讓計(jì)算機(jī)代替人類去處理大量的物理信息。隨著計(jì)算機(jī)技術(shù)的發(fā)展，人類對(duì)圖像識(shí)別技術(shù)的認(rèn)識(shí)越來(lái)越深刻。圖像識(shí)別技術(shù)的過程分為信息的獲取、預(yù)處理、特征

2017-12-21 15:01:16

6110

簡(jiǎn)單介紹圖像識(shí)別技術(shù)在各類行業(yè)的應(yīng)用

其實(shí)對(duì)于圖像識(shí)別技術(shù)，大家已經(jīng)不陌生，人臉識(shí)別、虹膜識(shí)別、指紋識(shí)別等都屬于這個(gè)范疇，但是圖像識(shí)別遠(yuǎn)不只如此，它涵蓋了生物識(shí)別、物體與場(chǎng)景識(shí)別、視頻識(shí)別三大類。發(fā)展至今，盡管與理想還相距甚遠(yuǎn)，但日漸成熟的圖像識(shí)別技術(shù)已開始探索在各類行業(yè)的應(yīng)用。

2018-01-23 11:26:47

34007

一文讀懂圖像識(shí)別，真的前景不可限量？

圖像識(shí)別技術(shù)人工智能 圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。它是指對(duì)圖像進(jìn)行對(duì)象識(shí)別，以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。 圖像識(shí)別發(fā)展的三階段 圖像識(shí)別的發(fā)展經(jīng)歷了三個(gè)階段：文字識(shí)別、數(shù)字圖像

2018-08-21 17:25:02

614

如何實(shí)現(xiàn)圖像識(shí)別？為什么要入局圖像識(shí)別？

圖像識(shí)別技術(shù)能讓機(jī)器像人一樣看到世界，甚至看到人類都看不到醫(yī)療保健：圖像識(shí)別最突出的能力之一是協(xié)助創(chuàng)建增強(qiáng)現(xiàn)實(shí)（AR）——一種“將計(jì)算機(jī)生成的圖像疊加在用戶對(duì)現(xiàn)實(shí)世界的視角之上”的技術(shù)。如果給人

2018-08-29 10:46:56

7695

淺析圖像識(shí)別背后的發(fā)展歷程

圖像識(shí)別，是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解，以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。

2018-09-30 09:47:01

23410

如何使用科優(yōu)先策略進(jìn)行的植物圖像識(shí)別系統(tǒng)介紹

植物識(shí)別領(lǐng)域的研究包括單一背景和自然環(huán)境植物圖像識(shí)別，由于背景噪聲的存在，自然環(huán)境植物圖像識(shí)別難度更大。針對(duì)如何降低卷積神經(jīng)網(wǎng)絡(luò)（CNN）的權(quán)重大小、如何改善過擬合、如何提高模型對(duì)自然環(huán)境植物

2018-11-23 17:35:05

一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)

2019-04-23 15:52:53

863

嵌入式語(yǔ)音識(shí)別系統(tǒng)是什么

嵌入式語(yǔ)音識(shí)別系統(tǒng)分為封閉域識(shí)別和開放域識(shí)別，封閉域識(shí)別范圍圍繞指定的字/詞語(yǔ)集合，也就是說(shuō)在開發(fā)系統(tǒng)的時(shí)候會(huì)設(shè)定好應(yīng)識(shí)別的字或詞語(yǔ)，對(duì)范圍外的詞語(yǔ)語(yǔ)音系統(tǒng)不會(huì)識(shí)別。

2019-06-12 11:38:09

2859

LabVIEW圖像識(shí)別系統(tǒng)汽車領(lǐng)域的應(yīng)用

詳解如何利用LabVIEW實(shí)現(xiàn)汽車儀表圖像識(shí)別

2019-07-31 10:23:47

6823

語(yǔ)音識(shí)別系統(tǒng)功能_語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用

對(duì)比語(yǔ)音識(shí)別技術(shù)的兩個(gè)發(fā)展方向，由于基于不同的運(yùn)算平臺(tái)，因此具有不同的特點(diǎn)。大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)一般都是基于PC機(jī)平臺(tái)，而語(yǔ)音識(shí)別專用芯片的中心運(yùn)算處理器則只是一片低功耗、低價(jià)位的智能芯片

2019-10-01 09:21:00

5253

醫(yī)療智能語(yǔ)音識(shí)別系統(tǒng)的研發(fā)與應(yīng)用

結(jié)合語(yǔ)音識(shí)別技術(shù)構(gòu)建醫(yī)療智能語(yǔ)音識(shí)別系統(tǒng)，達(dá)到減輕醫(yī)護(hù)人員日常工作負(fù)擔(dān)，減少重復(fù)性勞動(dòng)，提高診療質(zhì)量的目的。基于語(yǔ)音識(shí)別的關(guān)鍵技術(shù)和海量的醫(yī)療數(shù)據(jù)，開發(fā)電子病歷與檢查報(bào)告智能語(yǔ)音錄入、移動(dòng)護(hù)理智能語(yǔ)音錄入、非接觸式智能語(yǔ)音數(shù)據(jù)交互系統(tǒng)。

2019-10-21 16:46:27

3262

人臉識(shí)別和圖像識(shí)別技術(shù)是如何為安防賦能的

圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解，以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)，屬于應(yīng)用深度學(xué)習(xí)算法的一種實(shí)踐應(yīng)用。

2020-03-18 11:14:31

917

語(yǔ)音識(shí)別設(shè)置能刪除嗎_語(yǔ)音識(shí)別系統(tǒng)工作流程

本文首先介紹了語(yǔ)音識(shí)別設(shè)置的刪除，其次闡述了語(yǔ)音識(shí)別系統(tǒng)工作流程，最后介紹了語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)。

2020-04-01 09:47:40

3750

基于JuliUS語(yǔ)音識(shí)別引擎實(shí)現(xiàn)機(jī)器人孤立詞語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)

語(yǔ)音識(shí)別系統(tǒng)是一種模式識(shí)別系統(tǒng)，系統(tǒng)首先對(duì)語(yǔ)音信號(hào)進(jìn)行分析，得到語(yǔ)音的特征參數(shù)，然后對(duì)這些參數(shù)進(jìn)行處理，形成標(biāo)準(zhǔn)的模板。這個(gè)過程稱為訓(xùn)練或?qū)W習(xí)。當(dāng)有測(cè)試語(yǔ)音進(jìn)入系統(tǒng)時(shí)，系統(tǒng)將對(duì)這些語(yǔ)音信號(hào)進(jìn)行處理，然后進(jìn)行參考模板的匹配，得出結(jié)果。此時(shí)便完成了語(yǔ)音識(shí)別的過程。

2020-04-06 17:13:00

1524

圖像識(shí)別技術(shù) 推動(dòng)智能科技時(shí)代發(fā)展

隨著圖像識(shí)別技術(shù)的不斷發(fā)展和應(yīng)用，圖像識(shí)別概念，我相信大家都有所了解，知道它是什么，簡(jiǎn)單來(lái)件，就是對(duì)圖像進(jìn)行識(shí)別，目前，圖像識(shí)別技術(shù)被應(yīng)用社會(huì)中的各個(gè)行業(yè)領(lǐng)域，如：生物、醫(yī)療、機(jī)器人等等，數(shù)字科技的發(fā)展浪潮正在席卷社會(huì)，未來(lái)智能科技時(shí)代也許將真正到來(lái)。

2020-06-18 10:22:58

3234

OpenAI重磅推出語(yǔ)言模型DALL·E和圖像識(shí)別系統(tǒng)CLIP

圖像識(shí)別系統(tǒng)CLIP的通用性比當(dāng)前針對(duì)單個(gè)任務(wù)的系統(tǒng)更好，可以用網(wǎng)上公開的文字圖像配對(duì)數(shù)據(jù)集來(lái)訓(xùn)練。

2021-01-15 11:27:26

3812

機(jī)器視覺技術(shù)使用圖像識(shí)別算法來(lái)識(shí)別圖像中的物體

機(jī)器視覺技術(shù)使用圖像識(shí)別算法來(lái)識(shí)別圖像中的物體，并在不影響諸如工業(yè)自動(dòng)化、機(jī)器人技術(shù)、無(wú)人機(jī)和3D建模等廣泛應(yīng)用的情況下，為物體提供更詳細(xì)準(zhǔn)確的圖像而不會(huì)造成變形。

2020-12-28 14:16:36

5674

圖像識(shí)別技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用

隨著計(jì)算機(jī)技術(shù)的進(jìn)步，以圖像識(shí)別為代表的人工智能技術(shù)得以迅速發(fā)展并被廣泛用于航空、醫(yī)學(xué)等多個(gè)領(lǐng)域。今天，圖像識(shí)別技術(shù)也已成為發(fā)展現(xiàn)代農(nóng)業(yè)不可缺少的組成部分，成為實(shí)現(xiàn)農(nóng)業(yè)信息化與自動(dòng)化的重要技術(shù)力量。

2021-03-19 15:02:33

4789

全球首個(gè)開源圖像識(shí)別系統(tǒng)終于上線了！

影像的輔助診斷，圖像視頻的分析、編輯、再創(chuàng)造等等。。。有人會(huì)問，你說(shuō)的這些不都是圖像分類、目標(biāo)檢測(cè)的應(yīng)用么？但這背后遠(yuǎn)遠(yuǎn)不止這些，還有度量學(xué)習(xí)和圖像檢索等，現(xiàn)在更有集合各種功能的【通用圖像識(shí)別系統(tǒng)】，讓你擁

2021-06-23 16:20:11

2069

基于DSP的嵌入式圖像識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)總結(jié)

基于DSP的嵌入式圖像識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)總結(jié)(基于linux的嵌入式開發(fā)環(huán)境的搭建過程)-該文檔為基于DSP的嵌入式圖像識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)總結(jié)文檔，是一份很不錯(cuò)的參考資料，具有較高參考價(jià)值，感興趣的可以下載看看………………

2021-07-30 11:37:15

linkboy5.0正式發(fā)布，新增語(yǔ)音識(shí)別、圖像識(shí)別

linkboy 5.0正式版發(fā)布，界面風(fēng)格更新，增加語(yǔ)音識(shí)別，新增機(jī)器視覺實(shí)驗(yàn)室，圖像識(shí)別可支持開發(fā)板運(yùn)行和電腦端模擬仿真

2022-07-29 09:47:46

1959

圖像識(shí)別技術(shù)原理深度學(xué)習(xí)的圖像識(shí)別應(yīng)用研究

　　圖像識(shí)別是人工智能領(lǐng)域的一個(gè)重要方向。經(jīng)過多年的研究，圖像識(shí)別技術(shù)取得了一定的研究進(jìn)展。圖像識(shí)別主要包含特征提取和分類識(shí)別，而其中的特征提取是圖像識(shí)別技術(shù)發(fā)展的瓶頸問題，直接決定著識(shí)別

2023-07-19 10:27:04

模擬矩陣在圖像識(shí)別中的應(yīng)用

訊維模擬矩陣在圖像識(shí)別中的應(yīng)用主要是通過構(gòu)建一個(gè)包含多種圖像數(shù)據(jù)的模擬矩陣，來(lái)訓(xùn)練和測(cè)試深度學(xué)習(xí)模型，從而提高圖像識(shí)別的準(zhǔn)確性和效率。在圖像識(shí)別中，訊維模擬矩陣可以用來(lái)做以下幾方面的處理：圖像

2023-09-04 14:17:20

297

基于DSP的人耳圖像識(shí)別系統(tǒng)的設(shè)計(jì)

電子發(fā)燒友網(wǎng)站提供《基于DSP的人耳圖像識(shí)別系統(tǒng)的設(shè)計(jì).pdf》資料免費(fèi)下載

2023-10-07 11:11:46

圖像識(shí)別技術(shù)原理圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

圖像識(shí)別技術(shù)是一種通過計(jì)算機(jī)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它借助計(jì)算機(jī)視覺、模式識(shí)別、人工智能等相關(guān)技術(shù)，通過對(duì)圖像進(jìn)行特征提取和匹配，找出圖像中的目標(biāo)物體或模式，并進(jìn)行分類、檢測(cè)、跟蹤等任務(wù)

2024-02-02 11:01:42

474

已全部加載完成

搜索歷史

應(yīng)用展望 - 語(yǔ)音識(shí)別系統(tǒng)中增加圖像識(shí)別技術(shù)的設(shè)計(jì)應(yīng)用

3 應(yīng)用展望

本文導(dǎo)航

評(píng)論

　　3 應(yīng)用展望