中文字幕在线观看免费视频,亚洲穿环,我和子伦系列小说

在人工智能概念火熱的當下，人機交互的發展方向也正趨于多元化，從最初的鍵盤打字到觸控屏，再到現在的語音交互和手勢交互，無一不是前沿技術落地的結果。

12月14日消息，搜狗今天正式推出全新的人機交互新技術——唇語識別，這也是業內首個公開演示的唇語識別系統，通過機器視覺識別，不用聽聲音，僅靠識別說話人唇部動作，就能解讀說話者所說的內容。

與已有的語音識別產品不同，唇語識別是一項基于機器視覺與自然語言處理于一體的技術，因此在研發難度上比語音識別大得多。

搜狗語音交互中心技術總監陳偉告訴記者，搜狗的唇語識別技術首創了復雜端到端深度神經網絡技術進行中文唇語序列建模，通過數千小時的真實唇語數據訓練，加上搜狗在自然語言處理方面的強大優勢，最終取得了業界領先的唇語識別效果。

按照搜狗方面提供的數據顯示，在非特定人開放口語測試集上，搜狗唇語識別系統已經達到60%以上的準確率，超過google發布的英文唇語系統50%以上的準確率，在垂直場景如車載、智能家居等場景下甚至已經達到90%的準確率。

在這里要著重說明的是，中文唇語識別的難度要高于英文唇語識別。

陳偉解釋到，中文有四個聲調，英文的基本發音單元在50個左右，而如果中文的聲韻母切開來看，建模數量會超過200個。

在剛結束不久的烏鎮世界互聯網大會上，搜狗唇語識別技術亮相，在業內大多數唇語識別技術實用性尚待考證的環境下，成功完成了業內首個中文唇語識別系統的公開演示。

國內大部分企業都扎堆聚集在智能語音、圖像識別等領域，陳偉表示，搜狗開發唇語識別技術是希望解決嘈雜環境下的語音識別準確度問題。

目前有兩種方式可以解決這個問題：一是硬件層面的語音增強，對噪音進行屏蔽；二是增加多模態信息，比如唇語識別的圖像信息。

作為人機交互的形式之一，未來唇語識別技術可以輔助語音交互及圖像識別，在日常生活、安防、公益等各個領域實現廣泛應用。

比如在車載場景下，周圍噪音過大時會對語音指令產生干擾，通過唇語識別技術則可以規避干擾，保證人車交互的準確性和穩定性，日常不便發聲的公共場所也可以保證說話內容的私密性；在安防領域，由于目前多數監控只有攝像頭沒有麥克風，往往只能看清嘴型卻不知道在說什么，給案情分析帶來很多難題，而唇語識別技術可以幫助公安人員獲取重要的講話信息，為公共安全提供有效支持。

除此之外，唇語識別技術還能發揮巨大的公益價值，幫助先天性聽障人群或老年人，讓他們更好地理解和表達自己。

搜狗近年來一直在集中資源做自然語言的研究，目前在語音識別、語義理解、機器翻譯等方面均取得了比較領先的成果并實現產品落地，此次推出唇語識別技術，將推動整個AI行業的技術革新。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

搜狗

搜狗

+關注

關注
0

文章
90

瀏覽量
13939

原文標題：GGAI 技術前沿 | 搜狗推出“唇語識別”技術：不出聲也能“聽”懂你

文章出處：【微信號：ggservicerobot，微信公眾號：高工智能未來】歡迎添加關注！文章轉載請注明出處。

亮亮視野攜聽語者AR字幕眼鏡亮相2024福祉博覽會

全球康復輔具產業注入新的活力與動力！亮亮視野攜聽語者AR字幕眼鏡亮相展會，以其創新的科技和服務模式，獲得眾多參觀觀眾、機構的一致好評。

發表于 12-05 16:33 ?367次閱讀

語音識別與自然語言處理的關系

了人機交互的革命，使得機器能夠更加自然地與人類溝通。語音識別技術概述語音識別，也稱為自動語音識別（ASR），是指將人類的語音轉換成文本的

發表于 11-26 09:21 ?435次閱讀

語音識別技術的應用與發展

語音識別技術的發展可以追溯到20世紀50年代，但直到近年來，隨著計算能力的提升和機器學習技術的進步，這項技術才真正成熟并廣泛應用于各個領域。語音識別

發表于 11-26 09:20 ?521次閱讀

TAS5630強行復位后有時能放出聲音，但一會就保護了，為什么？

1.加電后，處于保護，SD低電平，otw1 otw2 高電平 2.強行復位后有時能放出聲音，但一會就保護了。請問是何問題？

發表于 11-05 07:52

tas5186為什么死活不出聲？

已經按照電路圖接好了，就是不出聲，reset 一點多伏，SD OTW負幾毫伏，實在不可能，都接好了啊，大神幫我分析下，電壓GVDD12.1V，PVDD33V，死活不出聲

發表于 11-01 08:26

使用TAS5630DKD 保護后，再上電怎么也不能恢復，為什么？

用同一塊電路板， 1、使用TAS5630DKD 保護后，再上電怎么也不能恢復（依舊保護）； 2、使用 TAS5630B DKD保護后再上電可以恢復，但某些時刻不能立刻恢復，得放置一段時間（時間沒有

發表于 10-25 07:49

TAS5754M在電腦上Motherboard板弄不出聲，是什么原因？

大家好，TAS5754M 在電腦上Motherboard板弄不出聲輸入是USB源是USB ，不知什么原因，附件是PurePath設置介面。我的初始化設置是這樣的 Page0： Reg 0x25

發表于 10-23 08:19

使用LM49350做音頻開發，調來調去還是發不出聲音怎么辦？

使用LM49350做音頻開發，LM49350的寄存器太多了，調來調去還是發不出聲音。因為項目時間比較緊，想請教一下大家有什么可以參考的LM49350的寄存器配置？

發表于 10-18 06:47

PCM1794A I2S 16bit數據不出聲音的原因？

PCM1794A支持I2S協議的16bit數據嗎？測試時不出聲音，切換到24bit數據就能夠正常出聲了，手冊里I2S協議給了參考波形是24bit數據的，PCM1794A是否支持向下兼容

發表于 09-30 08:06

知語科技無人機反制技術

知語科技無人機反制技術，顧名思義，是一種針對非法入侵無人機的技術手段。它通過采用雷達探測、光學識別、無線電干擾等多種方式，實現對無人機的精準定位、快速

發表于 06-11 16:26 ?349次閱讀

知語科技無人機反制新突破：激光打擊技術引領安全新風尚

在無人機技術迅猛發展的今天，如何有效應對無人機帶來的潛在威脅，成為公共安全領域亟待解決的問題。知語科技以其創新的無人機反制手段——激光打擊技術，為這一難題提供了切實可行的解決方案。知語

發表于 05-15 16:22 ?477次閱讀

**十萬級口語識別，離線自然說技術，讓智能照明更懂你**

NLP技術。該技術基于端到端語音識別技術及端側NLP技術，可識別端側十萬級別口語說法，打破傳統的

發表于 04-29 17:09

華為公開智能駕駛新專利：可識別唇語并報警

華為技術有限公司最近公開了一項關于“報警方法、裝置以及智能駕駛設備”的新專利，這項創新技術為智能駕駛領域注入了新的活力。

發表于 03-26 09:26 ?652次閱讀

顏色識別邊界問題

顏色識別出現這種樣的左右邊框可能是什么原因？我感覺代碼好像沒有問題上下邊界能畫出來左右邊界就畫不出來

發表于 03-08 17:29

車內語音識別技術：智能駕駛的革新之源

一、引言隨著科技的飛速發展，智能駕駛已經成為現代交通領域的熱門話題。作為智能駕駛的關鍵技術之一，車內語音識別技術正在改變我們對駕駛的認知。它不僅提高了駕駛的便捷性和安全性，

發表于 02-19 10:10 ?461次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

推出“唇語識別”技術，搜狗再上熱門不出聲也能“聽”懂你

評論

亮亮視野攜聽語者AR字幕眼鏡亮相2024福祉博覽會

語音識別與自然語言處理的關系

語音識別技術的應用與發展

TAS5630強行復位后有時能放出聲音，但一會就保護了，為什么？

tas5186為什么死活不出聲？

使用TAS5630DKD 保護后，再上電怎么也不能恢復，為什么？

TAS5754M在電腦上Motherboard板弄不出聲，是什么原因？

使用LM49350做音頻開發，調來調去還是發不出聲音怎么辦？

PCM1794A I2S 16bit數據不出聲音的原因？

知語科技無人機反制技術

知語科技無人機反制新突破：激光打擊技術引領安全新風尚

十萬級口語識別，離線自然說技術，讓智能照明更懂你

華為公開智能駕駛新專利：可識別唇語并報警

顏色識別邊界問題

車內語音識別技術：智能駕駛的革新之源

搜索歷史

推出“唇語識別”技術， 搜狗再上熱門 不出聲也能“聽”懂你

評論

推出“唇語識別”技術，搜狗再上熱門不出聲也能“聽”懂你