語音識別簡介
與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。中國物聯網校企聯盟形象得把語音識別比做為“機器的聽覺系統”。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。語音識別技術車聯網也得到了充分的引用,例如在翼卡車聯網中,只需按一鍵通客服人員口述即可設置目的地直接導航,安全、便捷。
語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。 語音識別聽寫機在一些領域的應用被美國新聞界評為1997年計算機發展十件大事之一。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發展技術之一。 語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。
語音分類應用
根據識別的對象不同,語音識別任務大體可分為3類,即孤立詞識別(isolated word recognition),關鍵詞識別(或稱關鍵詞檢出,keyword spotting)和連續語音識別。其中,孤立詞識別 的任務是識別事先已知的孤立的詞,如“開機”、“關機”等;連續語音識別的任務則是識別任意的連續語音,如一個句子或一段話;連續語音流中的關鍵詞檢測針對的是連續語音,但它并不識別全部文字,而只是檢測已知的若干關鍵詞在何處出現,如在一段話中檢測“計算機”、“世界”這兩個詞。
根據針對的發音人,可以把語音識別技術分為特定人語音識別和非特定人語音識別,前者只能識別一個或幾個人的語音,而后者則可以被任何人使用。顯然,非特定人語音識別系統更符合實際需要,但它要比針對特定人的識別困難得多。
另外,根據語音設備和通道,可以分為桌面(PC)語音識別、電話語音識別和嵌入式設備(手機、PDA等)語音識別。不同的采集通道會使人的發音的聲學特性發生變形,因此需要構造各自的識別系統。
語音識別的應用領域非常廣泛,常見的應用系統有:語音輸入系統,相對于鍵盤輸入方法,它更符合人的日常習慣,也更自然、更高效;語音控制系統,即用語音來控制設備的運行,相對于手動控制來說更加快捷、方便,可以用在諸如工業控制、語音撥號系統、智能家電、聲控智能玩具等許多領域;智能對話查詢系統,根據客戶的語音進行操作,為用戶提供自然、友好的數據庫檢索服務,例如家庭服務、賓館服務、旅行社服務系統、訂票系統、醫療服務、銀行服務、股票查詢服務等等。
語音識別原理
系統本質上是一種模式識別系統,包括特征提取、模式匹配、參考模式庫等三個基本單元,它的基本結構如下圖所示:
未知語音經過話筒變換成電信號后加在識別系統的輸入端,首先經過預處理,再根據人的語音特點建立語音模型,對輸入的語音信號進行分析,并抽取所需的特征,在此基礎上建立語音識別所需的模板。而計算機在識別過程中要根據語音識別的模型,將計算機中存放的語音模板與輸入的語音信號的特征進行比較,根據一定的搜索和匹配策略,找出一系列最優的與輸入語音匹配的模板。然后根據此模板的定義,通過查表就可以給出計算機的識別結果。顯然,這種最優的結果與特征的選擇、語音模型的好壞、模板是否準確都有直接的關系。
國內語音識別公司有哪些
科大訊飛股份有限公司
科大訊飛股份有限公司成立于1999年,是一家專業從事智能語音及語言技術、人工智能技術研究,軟件及芯片產品開發,語音信息服務及電子政務系統集成的國家級骨干軟件企業。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。
科大訊飛在智能語音核心技術研究領域,一直秉承“從市場中來、到市場中去”,“用正確的方法、做有用的研究”等核心理念,致力于建立智能語音及語言核心技術和核心技術應用產業化兩大方面的競爭力。科大訊飛的核心技術主要包括:語音識別技術、語音合成技術、自然語言理解技術、語音評測技術、聲紋語種技術、手寫識別技術等。科大訊飛始終堅持提供國際領先的語音及語言整體解決方案,不斷推出符合國家和社會需求的智能語音及語言技術產品及應用服務。
匯頂科技
匯頂科技成立于2002年,作為全球人機交互及生物識別技術領導者,目前已在包括手機、平板電腦和可穿戴產品等在內的智能移動終端領域構筑了領先優勢,先后推出全球領先的單層多點觸控芯片、全球首創的觸摸屏近場通信技術Goodix LinkTM、全球首家應用于Android手機正面的按壓式指紋識別芯片、全球首創的Invisible Fingerprint Sensor(IFSTM)、全球首創支持玻璃蓋板的指紋識別芯片、全球首創應用于移動終端的活體指紋檢測技術Live Finger DetectionTM、全球首創的顯示屏內指紋識別技術等。
其中,Live Finger DetectionTM憑借其卓越的創新應用價值斬獲了2017國際消費電子展(CES)全球創新金獎,這是匯頂科技繼2016年憑借IFSTM(觸控與指紋識別一體化技術)和Goodix LinkTM(觸摸屏近場通信技術)兩項技術獲得CES創新大獎后再次得到CES創新獎項,匯頂科技也由此成為首家榮獲CES全球創新金獎的中國IC設計公司。目前,產品和解決方案主要應用于華為、OPPO、vivo、小米、中興、魅族、聯想、金立、錘子、TCL、Nokia、Dell、HP、LG、ASUS、acer、 TOSHIBA、Panasonic等國際國內知名品牌,服務全球數億人群。
漢王科技股份有限公司
漢王科技股份有限公司成立于1998年,是全球文字識別技術與智能交互產品引領者,多年來,通過不斷自主創新,在手寫識別、光學字符識別(OCR)、筆跡輸入等領域擁有多項具有自主知識產權的核心技術,綜合技術水平在國內外均處于領先地位,手寫漢字識別獲得國家科技進步一等獎,OCR獲得國家科技進步二等獎。
漢王科技以核心技術為基礎,面向市場需求,已形成了以識別技術為核心的、針對不同細分市場的軟硬件產品系列,既有通用產品,如e典筆、漢王電紙書、漢王筆、文本王、名片通、繪圖板等,也有針對教育、金融等行業應用的文表識別解決方案;既有手寫手機、OCR等多種技術授權方案,也有輔助方案實施的硬件產品,如證照識別等。
山東共達電聲股份有限公司
山東共達電聲股份有限公司是專業的電聲元器件及電聲組件制造商、服務商和電聲技術整體解決方案提供商,是國家級高新技術企業、中國電子元件百強企業。
公司始創于2001年,自設立以來,堅持“共融、共創、共享、共達”的企業核心價值觀,秉承“和諧、超越、高效、求是”的企業精神,專注于電聲元器件產品的研發和制造,致力于成為世界一流的電聲技術整體解決方案提供商,主要產品包括微型麥克風、微型揚聲器/受話器及其陣列模組,廣泛應用于移動通訊設備及其周邊產品、筆記本電腦、平板電視、個人數碼產品、汽車電子等消費類電子產品領域。
拓爾思
拓爾思是一家技術驅動型企業,歷經二十余年的深耕和積累,在中文檢索、自然語言處理等領域始終處于行業前沿,公司2011年在深交所創業板上市,股票代碼300229,是第一家在A股上市的大數據技術企業。拓爾思以大數據+人工智能為發展戰略,旨在幫助客戶實現從數據洞察到智慧決策的飛躍。
拓爾思的核心業務包括軟件產品研發,行業應用解決方案和數據分析挖掘云服務三大板塊,涉及大數據管理、信息安全、互聯網營銷和人工智能等應用方向。
拓爾思是自主可靠軟件產品領域的領軍企業,TRS中文全文檢索系統、WCM內容管理平臺、CKM中文文本挖掘等軟件均代表了國內相關領域自主創新的最高水平。同時拓爾思不斷拓寬產品線和綜合服務能力,為政府、媒體、安全、金融等多個行業提供領先的產品、技術和解決方案。為了迎接云計算時代的來臨,公司近年來加快了基于云服務的數據分析和知識服務的發展步伐,旨在實現軟件企業的戰略轉型和升級。
精倫電子股份有限公司
精倫電子股份有限公司是“武漢·中國光谷”國家級高新技術企業,成立于1994年,于2002年上市,是中國首家以全自然人作為發起人的上市公司,注冊資本24,604.46萬元,股票代碼:600355。現有精倫工業園位于武漢總部,占地310畝。
精倫電子致力于各類電子智能終端的研發、設計與生產。目前公司主營產品包括:電子廣告媒體終端;電子伺服系統終端;二代身份證閱讀終端;電子交易終端;電力終端;家庭媒體娛樂終端;導航定位終端等。涵蓋了:通訊、電力、傳媒、三網融合、工業縫紉制造、公共安全等多個領域。并提供各類產品的服務平臺、系統及整體設計、運營方案。
精倫電子一直秉承自主知識產權和核心技術為基礎的理念,每年投入銷售利潤的較大部分作為研發投入,與華中科技大學、上海浦東等地建立合作研發基地。擁有國家人事部批準的博士后科研工作站,在嵌入式操作系統、嵌入式硬件設計、嵌入式軟件設計、音頻視頻信號處理、智能卡應用技術、大型數據庫應用設計、網絡信息安全設計技術等方面形成了自主核心技術體系。承建了多項國家高技術實施項目。公司正在逐步成為業界領先的智能終端研發與設計基地。
上海益深電子有限公司
上海益深電子有限公司,為專業從事語音芯片和家電控制芯片開發、生產、銷售的高科技企業。主營單片機和DSP芯片以及相關電子產品和模組,承接各種專業控制方案開發。公司秉承“顧客至上,銳意進取”的經營理念,堅持的原則,為廣大客戶提供最優質的服務。業務范圍:涉及汽車電子、多媒體、安全防盜、通信器材、家電控制、醫療器械、工業自動化控制、益智玩具及互動消費類產品等領域。
南京子佩軟件科技有限公司
南京子佩軟件科技有限公司是是從事通訊類產品研發、生產、銷售及提供相關通訊運營服務的高科技企業,公司擁有一批經驗豐富、技術過硬,致力于語音通訊和數據通訊產品開發與應用的技術隊伍,公司是目前國內最有影響的電話語音卡/電話語音盒/電話錄音盒系列話務信息產品提供商之一,公司采用ISO9001質量保證體系和當前全球先進的語音通訊前沿技術,致力于為中國及全球企業提供高品質系列話務信息產品。
廣州科靈電子有限公司
廣州科靈電子有限公司是智能一卡通設備制造企業,主營:停車場收費管理系統、停車場設備、高清車牌識別一體機、遠距離藍牙系統、道閘/擋車器、人行通道閘(三輥閘、擺閘、翼閘)、電子巡更系統、車位/區位引導系統、電動伸縮門、崗亭、門禁考勤系統、梯控管理系統、交通輔助設施等系列產品,公司擁有完整、科學的質量管理體系。
深圳伊蘭度科技有限公司
是專業從事停車場門禁設備研發,生產為一體的高科技公司。公司研發中心分為硬件、軟件、機電三個研發部門,座落于深圳硅谷動力產業園內,主要從事停車場一卡通軟件硬件產品的研發設計,并為客戶提供軟件,硬件個性化的定制服務。 產品有:道閘機、停車場系統、藍牙遠距離、車牌自動識別系統、地感控制器、票箱、售飯機、售飯系統、消費機、食堂售飯機、食堂刷卡機、巡更機、巡更棒、巡更器、巡更系統、巡檢器等產品。
評論
查看更多