近日,在2019全球人工智能創業者大會上,云知聲聯合創始人兼副總裁康恒博士在《物聯網人工智能的落地路徑》的主題演講中表示,IoT結合AI化浪潮,需要全新的AIoT芯片,多模態AI芯片是關鍵一步。
康恒表示,AI與IoT的疊加要求傳統解決方案朝五大方向轉型:從通用架構到AI架構、從依賴硬件到軟硬件一體、從PPA模式到垂直場景模式、交互從單模態轉向多模態、設備從獨立到協同。
圖:物聯網設備和數據規模進入爆炸式增長階段。
康恒認為,萬物互聯已經成為大趨勢,從計算機、手機、平板、手環等,到工業、汽車、家居,聯網設備的數量在2014年到2020年間的年復合增長率預計將達23.1%,到2020年物聯網設備數量達到501億。百億級聯網設備將帶來數據爆炸式增長,IDC預測2020年全球數據總量將突破40ZB,達2011年的22倍。
進入AI IoT時代,數據將呈現爆發式增長。這些數據必須通過AI計算進行提煉,產生數字機構化信心,才能為人類所用。“物聯網的落地,有大規模的設備出現,而且這些設備會呈現一些多樣化、碎片化、長尾化的趨勢。AI交互成為內生的需求。”康恒博士指出。
“在智能家居領域,云知聲是首家做智能家居語音交互的企業,同時率先提出了一系列智能語音的測試標準,在5米范圍內能夠輕松實現人機交互,目前仍是業界公認的通用測試標準。云知聲在智能醫療領域,是國內首家推出醫療云服務的企業,并完成近百家醫院系統語音測試。” 康恒認為,云知聲和語音識別領域的領先企業科大訊飛選擇賽道不同,科大訊飛更多把語音業務集中在企業服務和教育行業,云知聲選擇IoT、消費類場景,智能硬件,該公司認為,AI服務行業的可選擇面非常寬廣。
AI芯片落地要和場景密切結合
成立六年的云知聲,開始在AI芯片領域發力。作為一家專注于語音領域的人工智能公司,云知聲早在2015年就有了打造芯片的想法,并且開始組建團隊。2016年,云知聲正式宣布研發芯片,2018年5月份,雨燕發布。
為什么一家初創AI企業選擇做芯片?眾所周知,過去做芯片的企業都需要非常長時間的積累,芯片行業的技術難度、人才高度、資金難度都是挑戰。云知聲是怎樣考慮的?
康恒強調說,在AI行業不做芯片,前途不明朗。“我們看到以純粹軟件的方式,甚至說以平臺化,或者以云端服務的形式,這些方式越來越不可能去跟垂直行業做深度的結合。第二、做芯片,如果做不出好的芯片,AI落地應用是無法完成的。一旦AI芯片完成了,可以給自己樹立一個門檻。增強自身的競爭力。”
最開始,云知聲選擇做通用芯片,很快發現了通用架構在AI落地中遇到三大挑戰:1、及時性、帶寬成本和無網狀態下,需要邊緣算力來解決;2、在保障邊緣算力的前提下降低成本;3、功耗不僅涉及芯片,還與場景、應用和算法有關。從數據維度,不僅處理用戶的聯網數據,還有傳感器獲取的語音數據,環境數據等等,在給定成本和功耗的情況下,通用架構是否能夠達到很好的效果;新的硬件基于深度學習的算法能夠滿足要求。通用AI芯片顯然掣肘眾多。
圖:通用架構在AI落地中遇到三大挑戰。
在康恒看來,云知聲同時具備算法、場景以及芯片設計方面的三個關鍵要素,因此有條件產出物聯網場景下最好的AI芯片。
芯片的發展與最初選擇技術落地場景緊密相關,雨燕由云知聲自主設計研發,同時包含了通用CPU、AI加速器(DeepNet)以及數字信號處理器(uDSP)架構,采用自主AI 指令,面向語音AI場景,支持6個模擬/數字麥克風接入。康恒提到,深度神經網絡性能較通用方案提升超50倍。據悉,雨燕在智能家居方向分為兩種方案,分別對應智能音箱和智能家居。
云知聲向客戶提供軟硬件云+端一體化的解決方案是最常見的合作方式。此前,在白電領域大規模出貨的智能硬件模組就是以這種方式為不少大公司服務,諸如美的、格力等等。
物聯網落地的過程中,需要把算法跟互聯網的硬件去結合起來。即把算法、應用程序放到芯片上。“云知聲選擇了軟硬結合路徑,云端芯一體化展示。我們把算法、云端能力和本地的應用程序結合起來,以一整套的方式推給客戶。“康恒分析說,”這個路徑最大的優點是,客戶不需要再做芯片選型、算法移植和軟件設計。云知聲提供的解決方案已經是充分的測試過,推動客戶整個的研發過程會大幅度縮短,快速幫助我們的客戶進行產品的量產化。
交互模式轉變引領廠商從單模態AI芯片向多模態AI芯片演進
人機交互只是依靠語音交互,是否足夠?康恒的回答是,單模態語音的方式是無法實現真正的人機交互。只有語音沒有圖像,就像一個瞎子。
“云知聲的技術路線要從單模態AI芯片變為多模態AI芯片,支持語音、圖像、視覺環境,環境感知。多維度的傳感信息結合起來,去實現主動的、智能的交互模式。這就是我們下一代芯片的設計的來源。”康恒強調指出,“當然,多模態需求下提供更好的芯片制程。”
圖:云知聲的語音合成到語音交互。
圖:云知聲AI芯片演進圖。
云知聲提出了AI On Chip概念,打造了DeepNet2.0多模態神經網絡處理器IP,兼容多種神經網絡。應用該成果,云知聲實現了超聽限同向降噪等技術。云知聲今年還將基于該IP推出新的AI芯片“蜂鳥“。
雨燕是語音行業的一顆通用芯片,云知聲把更多的冗余裁剪掉,讓語音更專業,往專業化上走一步,這意味著蜂鳥的定位更加輕巧、靈活,可以持續降低客戶的門檻,甚至將語音模組降低到一個更適宜市場接受的價格區間。
2019年,無論AI芯片,還是AI技術落地,已經走向一個深水區,智能家居、智能車載、智慧醫療領域,云知聲都在不斷切入。以語音識別在醫療領域的應用為例。云之聲在醫療行業做了蠻多的工作和嘗試,為醫生提供電子病歷的語音錄入,原來一天需要4小時的病例錄入縮短到2個小時,準確率達到95%以上,到了今天,已經有超過500多家醫院在跟云知聲合作。
“智慧城市場景中,云知聲從家庭和出行出發,未來進一步延伸到社區,現在我們提供的智能語音服務主要是控制家居里面的設備,比如智能電視、智能空調等,未來我們可以將這個設備連接社區的服務,將社區的線下服務變為社區的線上服務,我們關注的是最終用戶。“康恒最后表示,“云知聲的優勢是優質的AI團隊,我們打造的多模態芯片和AI技術,都需要比同行做得體驗更好,價格更優,未來才能在更多的場景運用中得到拓展。”
-
科大訊飛
+關注
關注
19文章
800瀏覽量
61238 -
語音交互
+關注
關注
3文章
286瀏覽量
28002 -
云知聲
+關注
關注
0文章
179瀏覽量
8387 -
AI芯片
+關注
關注
17文章
1879瀏覽量
34990
發布評論請先 登錄
相關推薦
評論