當前,隨著智能語音技術(shù)日益成熟,越來越多的互聯(lián)網(wǎng)巨頭、傳統(tǒng)終端制造廠商以及初創(chuàng)公司進軍智能語音領(lǐng)域,新產(chǎn)品、新技術(shù)不斷涌現(xiàn),智能語音產(chǎn)業(yè)進入快速發(fā)展階段。本報告重點對智能語音產(chǎn)業(yè)生態(tài)、產(chǎn)業(yè)發(fā)展前景、行業(yè)痛點等進行了全面梳理,并結(jié)合我市智能語音產(chǎn)業(yè)發(fā)展提出有關(guān)建議。
智能語音產(chǎn)業(yè)概述
智能語音產(chǎn)業(yè)結(jié)構(gòu)分為三層,上游基礎(chǔ)層包括芯片、模組、傳感器以及云計算服務和大數(shù)據(jù)平臺等;中游技術(shù)層主要提供語音識別、語音合成、深度/機器學習、人機交互等技術(shù)研究和服務;下游應用包括智能手機、智能家居、智能汽車、可穿戴設(shè)備、虛擬助力、家庭機器人等B2C應用,以及金融、教育、醫(yī)療、安防等B2B應用。
圖1 智能語音產(chǎn)業(yè)架構(gòu)
智能語音產(chǎn)業(yè)概述
(一)谷歌
谷歌一直致力于語音交互市場,2011年已收購語音通信技術(shù)公司SayNow、語音合成技術(shù)Phonetic Arts等技術(shù)公司,2014年收購了SR Tech Group的多項語音識別相關(guān)的專利。2016年,谷歌開放了語音識別API,即谷歌語音搜索和語音輸入的支持技術(shù),包括80多種語言,適用于各種實時語音識別與翻譯應用。2017年,谷歌發(fā)布了用于語音交互的Actions on Google平臺,可支持所有Google Assistant所支持的平臺,并在功能方面允許用戶通過語音完成交易。
谷歌作為全球知名互聯(lián)網(wǎng)巨頭,依托已有的產(chǎn)品基礎(chǔ),將語音交互技術(shù)融入到搜索、地圖、智能家居、機器人等產(chǎn)品中,構(gòu)建一個新的應用平臺。目前,谷歌語音助手已接入全球智能手機、汽車與智能家庭設(shè)備等產(chǎn)品達5億臺以上,進入了80多個國家與地區(qū)。根據(jù)Capvision統(tǒng)計數(shù)據(jù)顯示,谷歌占據(jù)全球智能語音市場28.4%的份額,位居全球第二。
(二)科大訊飛
科大訊飛是從事智能語音技術(shù)、人工智能技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務及電子政務系統(tǒng)集成的國家級重點軟件企業(yè)和創(chuàng)新型企業(yè),擁有語音及語言信息處理國家工程實驗室、國家級企業(yè)技術(shù)中心、國家博士后科研工作站等榮譽稱號??拼笥嶏w是我國智能語音與人工智能產(chǎn)業(yè)的龍頭企業(yè)之一,在語音合成、語音識別、口語評測、自然語言處理等多項技術(shù)擁有國際領(lǐng)先的成果,其產(chǎn)品占據(jù)中文語音識別服務市場70%的份額,在專業(yè)領(lǐng)域的應用更是占到80%的市場份額。
在業(yè)務布局方面,科大訊飛持續(xù)推進“平臺+賽道”的人工智能戰(zhàn)略,推出了國內(nèi)首個以智能語音和人機交互為核心的人工智能開放平臺,為移動互聯(lián)網(wǎng)、智能硬件的廣大創(chuàng)業(yè)開發(fā)者和海量用戶提供人工智能開發(fā)與服務能力,圍繞人工智能開放平臺積極構(gòu)建產(chǎn)業(yè)生態(tài)。在“賽道”上,把握垂直入口或行業(yè)的剛需,在教育、政法、智能汽車等領(lǐng)域?qū)崿F(xiàn)了規(guī)模應用。2018年,科大訊飛實現(xiàn)營業(yè)收入79.17億元,同比增長45.41%,凈利潤達5.42億元。
(三)思必馳
思必馳是國內(nèi)擁有全套語音類知識產(chǎn)權(quán)的公司,在語音識別、語義理解、聲紋識別、對話管理、音頻分析等方面均有深厚技術(shù)積累,是國際上極少數(shù)擁有自主產(chǎn)權(quán)、中英文綜合語音技術(shù)的公司之一。2017年9月,思必馳對外發(fā)布了DUI語音交互開放平臺,把語音相關(guān)技術(shù)整合成AIOS人機對話操作系統(tǒng),作為安卓系統(tǒng)之上的一層標準接口,提供給硬件合作伙伴。同時針對不同場景,AIOS分成了不同版本,針對車載、家居、機器人等產(chǎn)品做垂直領(lǐng)域下的對話式交互。
在產(chǎn)業(yè)生態(tài)構(gòu)建上,思必馳主要依托自身語音交互技術(shù)優(yōu)勢,面向車載、家居、機器人等垂直領(lǐng)域,為互聯(lián)網(wǎng)企業(yè)、智能硬件企業(yè)提供語音交互技術(shù)解決方案。其中,在車載方向,思必馳在車載后裝市場占有率已達到行業(yè)第一,并逐步向前裝市場延伸,與一汽、長城、大眾、海馬、小鵬汽車等十余個車廠企業(yè)建立合作關(guān)系;在智能家居方向,思必馳的技術(shù)被應用于貓精靈X1/M1、騰訊聽聽、小米小愛同學、聯(lián)想智能音箱等多款知名產(chǎn)品,在音箱市場占有率行業(yè)第一;在家用機器人、兒童故事機等領(lǐng)域,思必馳已與浙江大華、步步高等企業(yè)建立合作關(guān)系。同時,思必馳通過DUI開放平臺,面向開發(fā)者提供完整的智能對話交互方案,支持快速自定義開發(fā),打造開放的生態(tài)圈。
(四)聲智科技
聲智科技成立于2016年5月,是全球領(lǐng)先的遠場智能交互系統(tǒng)提供商之一,主要面向智能家居、智能汽車、智能會議、智能安防、智能金融、智能教育、智能醫(yī)療、智能法院、智能交通和機器人等行業(yè)領(lǐng)域,為客戶提供麥克風陣列芯片與模組以及智能網(wǎng)關(guān)/機頂盒、智能電視、智能車機、智能手機、智能玩具等技術(shù)解決方案。
在產(chǎn)業(yè)生態(tài)構(gòu)建方面,聲智科技主要依托自身遠場交互技術(shù),為互聯(lián)網(wǎng)企業(yè)、智能硬件等客戶提供應用解決方案,同時發(fā)布了AZERO遠程智能交互平臺,連接相關(guān)智能終端產(chǎn)品,為終端客戶提供更多的功能服務。目前聲智科技已與小米、百度、阿里、華為、騰訊、中國移動、聯(lián)想、創(chuàng)維、金蝶、浪潮、國美等龍頭企業(yè)建立合作關(guān)系,小易精靈帶屏智能音箱、百度小度智能音箱、華為AI音箱、聯(lián)想MINI智能音箱、國美智能音箱GOMEPOD等產(chǎn)品均使用了聲智科技遠場語音交互方案。
智能語音產(chǎn)業(yè)發(fā)展前景
(一)市場需求助力產(chǎn)業(yè)拓展
5G通信技術(shù)高速率、大帶寬、低時延、高可靠、海量連接的特性加速了“萬物互聯(lián)”時代發(fā)展,有效激發(fā)了智能語音進入更多應用場景,為語音識別與語義識別提供更大的數(shù)據(jù)量和更有利的數(shù)據(jù)環(huán)境,從而橫向衍生出更豐富的功能和產(chǎn)品。智能語音應用在智能手機、平板電腦等移動智能終端的普及,移動互聯(lián)網(wǎng)用戶中使用智能語音的數(shù)量正大幅增長。在金融、電信、教育、醫(yī)療、軌道交通等垂直領(lǐng)域,智能語音技術(shù)和產(chǎn)品的應用正快速發(fā)展,實現(xiàn)從輔助技術(shù)手段向關(guān)鍵應用的發(fā)展。智能語音產(chǎn)業(yè)規(guī)模持續(xù)快速增長,預測2019年國內(nèi)智能語音市場規(guī)模破2000億元大關(guān)。
(二)政策利好推動行業(yè)發(fā)展
我國利好政策持續(xù)推動智能語音行業(yè)的發(fā)展。早在2017年11月5日,科技部召開《新一輪人工智能發(fā)展規(guī)劃》暨重大科技項目啟動會,會上宣布了首批四家國家新一代人工智能開放創(chuàng)新平臺名單,明確依托科大訊飛建設(shè)智能語音國家新一代人工智能開放創(chuàng)新平臺。2018年3月5日,國務院總理***在十三屆全國人大一次會議政府工作報告時表示,要加強新一代人工智能研發(fā)應用,在醫(yī)療、養(yǎng)老、教育、文化、體育等多領(lǐng)域推進“互聯(lián)網(wǎng)+”, “人工智能”再次被寫入政府工作報告。隨著人工智能上升到國家戰(zhàn)略地位,智能語音作為其基礎(chǔ),未來發(fā)展也將受益。
(三)智能家居場景帶來機遇
2018年全球智能家居市場出貨量約為6.56億臺,其中,中國市場累計出貨近1.5億臺,同比增長36.7%。智能音箱等單品的爆發(fā)、語音交互的普及以及智能平臺的崛起,將促使消費者購買更多的智能家居設(shè)備,智能家居產(chǎn)品和服務可用性也會明顯增加,全球智能家居市場將持續(xù)快速增長。在人工智能快速發(fā)展的環(huán)境下,語音已經(jīng)成為智能家居產(chǎn)品的重要環(huán)節(jié)。2018年,中國智能家居設(shè)備市場語音助手搭載率達到28.6%,同比增長177.6%。
(四)科技巨頭紛紛開展布局
在語音生態(tài)方面,百度宣布語音識別技術(shù)及能力全面開放。騰訊、搜狗語音開放平臺相繼上線。在語音技術(shù)應用方面,各大廠商對家居、車載、可穿戴等環(huán)節(jié)的關(guān)注明顯升溫。智能家居領(lǐng)域,百度發(fā)布了Baiduihome,阿里聯(lián)合智能家電廠商推出天貓魔盒,搜狗聯(lián)手魅族發(fā)布了魅族電視盒子。智能車載領(lǐng)域,百度分別推出了手機智能互聯(lián)產(chǎn)品Carlife、私有云服務平臺MyCar和智能行車助手CoDriver。阿里云和上汽合作推出車載操作系統(tǒng),騰訊發(fā)布了路寶App+路寶盒子,可與騰訊云連接,以實現(xiàn)車輛診斷、油耗分析、車友社交等功能。搜狗則和四維圖新合作,推出飛歌導航??纱┐黝I(lǐng)域,百度采取扶持外部產(chǎn)品,內(nèi)置百度服務,形成開放生態(tài)思路,分別推出inside智能硬件平臺、基于健康云的Dulife智能健康平臺等應用,以吸引硬件廠商加入。
智能語音行業(yè)發(fā)展痛點(一)人才欠缺,創(chuàng)新成效低
智能語音和人工智能技術(shù)產(chǎn)業(yè)化趨勢愈發(fā)明顯,國內(nèi)外知名IT企業(yè)紛紛加大對智能語音業(yè)務的投入,不僅加劇了語音技術(shù)的國際競爭,也增大了語音技術(shù)人才需求缺口。在風險投資的追捧下,人工智能領(lǐng)域高端人才離職創(chuàng)業(yè)數(shù)量增多,近年來微軟、百度、阿里、騰訊、IBM、英特爾中國等都出現(xiàn)了研究院院長等核心人才離職創(chuàng)業(yè)的現(xiàn)象。同時由于國內(nèi)智能語音及人工智能行業(yè)的特殊性、高水平科研人才的稀缺性以及人才培養(yǎng)的滯后性,智能語音和人工智能人才將面臨持續(xù)短缺,吸引和培養(yǎng)高水平人才隊伍的力度不足,智能語音行業(yè)今后發(fā)展存在潛在風險。
(二)重點關(guān)鍵技術(shù)有待突破
從智能語音技術(shù)發(fā)展來看,當前語音合成技術(shù)已經(jīng)較為成熟,合成清晰度和自然度已經(jīng)達到較高水平,但是語音識別技術(shù)仍有許多需要提升的技術(shù)難點。目前大部分語音識別的研究和應用,主要是基于英語、漢語、阿拉伯語和法語等大語種,而世界上一共有6900多種語言,快速實現(xiàn)一套基于任何語言的語言識別系統(tǒng)是非常困難的。
(三)語音交互平臺“各自為政”
目前各個語音交互開放平臺各自為政,相關(guān)真實數(shù)據(jù)訓練彼此分散,在語義理解和圖譜識別等認知技術(shù)方面也尚未形成通用的技術(shù)框架,智能手機、智能可穿戴設(shè)備、智能音箱、智能電視等不同產(chǎn)品類型、不同品牌間語音交互技術(shù)不統(tǒng)一,影響用戶使用體驗,不利于構(gòu)建融合、開放的智能終端應用生態(tài),制約語音交互市場和產(chǎn)業(yè)發(fā)展。
我市智能語音發(fā)展建議
(一)構(gòu)建產(chǎn)業(yè)生態(tài)圈
加快推進智能語音應用平臺布局,引導和支持已落戶的科大訊飛聯(lián)合百度、騰訊、思必馳等智能語音公司,在渝搭建開放共享平臺,統(tǒng)一開發(fā)者和用戶入口,為智能音箱、智能家電、智能可穿戴設(shè)備等不同類型、不同品牌的智能產(chǎn)品用戶提供統(tǒng)一的平臺入口和功能服務,構(gòu)建智能應用生態(tài)圈。鼓勵歐珀、維沃、傳音、美的、海爾等本地智能手機廠商、智能家電廠商加強與統(tǒng)一開放平臺的合作,植入智能語音技術(shù)與服務,推進產(chǎn)品提檔升級。
(二)加強公共平臺建設(shè)
整合大數(shù)據(jù)資源,建立支持智能語音產(chǎn)業(yè)發(fā)展的基礎(chǔ)數(shù)據(jù),引導建設(shè)基于語音的海量訓練資源庫和標準測試數(shù)據(jù)集。通過新建或協(xié)議使用等方式,引導建設(shè)滿足深度學習等智能計算需求的國家超級計算中心、新型計算集群共享平臺、云端智能分析處理服務系統(tǒng)、智能系統(tǒng)安全服務平臺等基礎(chǔ)資源平臺,降低人工智能創(chuàng)新成本。鼓勵和支持現(xiàn)有眾創(chuàng)空間等創(chuàng)新孵化平臺加大對智能語音項目的培育。
(三)加強技術(shù)創(chuàng)新
研究制定專項政策,下大力引進培育5G、智能語音等關(guān)鍵技術(shù)研究、產(chǎn)品開發(fā)、應用創(chuàng)新等方面的人才或研發(fā)團隊。推動產(chǎn)業(yè)鏈各方加強深度協(xié)作,推動智能語音交互、智能可穿戴設(shè)備、智能服務機器人、材料及系統(tǒng)的關(guān)鍵技術(shù)突破和成果轉(zhuǎn)化。鼓勵企業(yè)離岸創(chuàng)新,將境外智能語音技術(shù)形成創(chuàng)新成果后在園區(qū)實現(xiàn)產(chǎn)業(yè)化。加強與本地高校聯(lián)動,合力制定語言學和人工智能交叉的復合型人才聯(lián)合培養(yǎng)計劃,推動人才引進與培養(yǎng)。
-
機器學習
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132714 -
智能語音
+關(guān)注
關(guān)注
10文章
786瀏覽量
48793
原文標題:行業(yè)專報丨智能語音產(chǎn)業(yè)發(fā)展研究
文章出處:【微信號:cqiota,微信公眾號:重慶市物聯(lián)網(wǎng)產(chǎn)業(yè)協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論