本次云知聲開放日聚焦 AI 技術(shù)、應(yīng)用和產(chǎn)業(yè),云知聲董事長/CTO 梁家恩博士與多位云知聲技術(shù)專家向深圳的合作伙伴、行業(yè)人士全面的秀出了全棧 AI 硬核技術(shù),并與騰訊杰出科學(xué)家/騰訊 AI Lab 副主任俞棟、攜住科技聯(lián)合創(chuàng)始人葉明、同行者科技聯(lián)合創(chuàng)始人葉維、金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博、三諾聲智聯(lián)副總經(jīng)理喬嶠等多位嘉賓,剖析了 AI 技術(shù)在酒店、車載、教育等領(lǐng)域的應(yīng)用及落地。
全棧:技術(shù)能力全棧,產(chǎn)業(yè)服務(wù)全棧
梁家恩博士作為人工智能行業(yè)的資深從業(yè)者,在現(xiàn)場與我們復(fù)盤了發(fā)展歷程,他表示,在 AI 大潮退去之后,技術(shù)的產(chǎn)業(yè)化能力成為了決勝的關(guān)鍵。技術(shù)如果不能解決產(chǎn)業(yè)問題,那么技術(shù)將化為企業(yè)“炫技”的產(chǎn)物。基于此,梁家恩博士將云知聲的 AI 哲學(xué)概括為“全棧”和“硬核”。
“全棧”包含了全棧 AI 技術(shù)能力和全棧 AI 落地能力兩個維度。經(jīng)過多年的發(fā)展,目前,云知聲的 AI 能力已經(jīng)超了單一的語音技術(shù),覆蓋了 Atlas 機器學(xué)習(xí)超算平臺,信號、語音、圖像、文本的感知和表達能力,知識、理解、分析、決策等認(rèn)知技術(shù),并朝著多模態(tài)人工智能系統(tǒng)方向發(fā)展。同時,云知聲通過將能力封裝在自研 AI 芯片之上,打磨了“云端芯”一體化產(chǎn)品體系,推動 AI 技術(shù)在家居、車載、兒童、教育、醫(yī)療、金融、零售等多個領(lǐng)域?qū)崿F(xiàn)落地,實現(xiàn)了從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。
硬核:確實、有效地解決產(chǎn)業(yè)規(guī)模化痛點
“硬核”,指技術(shù)方案能夠確實、有效地解決產(chǎn)業(yè)規(guī)模化痛點,為終端用戶提供相對成熟的用戶體驗。
以當(dāng)時最熱門的智能語音為例,經(jīng)歷了兩年的市場教育,現(xiàn)如今,語音交互技術(shù)被廣泛應(yīng)用到各大場景中,成為了 AI 技術(shù)落地最典型的應(yīng)用案例。然而,在實際使用中,AI 需要面對的情況比實驗室中要復(fù)雜得多,一旦產(chǎn)品軟硬件的某一環(huán)處理不好,便容易出現(xiàn)“聽不到、聽不懂、答非所問”等問題。針對這類行業(yè)痛點,在本次云知聲開放日深圳站現(xiàn)場,云知聲的技術(shù)團隊從語音交互技術(shù)的拾音、識別和交互等維度,深度剖析了技術(shù)難點和解決方案。
在 AIoT 場景下,設(shè)備首先要解決的便是遠場拾音問題。云知聲 AI Labs 技術(shù)專家關(guān)海欣表示,解決遠程語音識別的關(guān)鍵在前端信號處理階段,解決回聲、混響和噪音 3 大核心問題,以確保設(shè)備可以準(zhǔn)確識別到用戶指令。目前,云知聲在回聲消除、混響抑制、噪聲處理等方向均已有成熟的技術(shù)方案,相關(guān)技術(shù)指標(biāo)均達行業(yè)一流水準(zhǔn)。另外,未來遠程語音識別還將呈現(xiàn) DSP+DL 結(jié)合、分布式拾音兩大趨勢,對此,云知聲也已經(jīng)展開了相應(yīng)的技術(shù)部署。
在語音識別階段,則需要在聲學(xué)和語言層面,賦予機器感知并語音指令的能力。云知聲 AI Labs 技術(shù)專家李軼杰表示,聲學(xué)方面,云知聲基于大數(shù)據(jù)、前沿聲學(xué)建模、自適應(yīng)學(xué)習(xí)搭建了聲學(xué)模型;在語言層面,云知聲創(chuàng)建了一個數(shù)據(jù)規(guī)模大、融合能力強、靈活和個性化的語言模型,以上模型在還將基于超算平臺不斷優(yōu)化迭代。此外,云知聲還將其語音識別能力延展到語音評測、聲紋識別、情緒識別等多個方向。
在對話階段,圍繞更加自然的人機交互,云知聲打造了流式交互、語用計算與知性會話 3 大硬核能力。云知聲 AI Labs 技術(shù)專家單波介紹到,流式交互最大的特點是在多輪對話免喚醒,大大的提升了人機對話過程中的流暢程度;語用計算則是將人機對話內(nèi)容放置到對應(yīng)的語境中,讓設(shè)備準(zhǔn)確的理解人的意圖;最后,知性會話則是通過將知識圖譜應(yīng)用到人機對話過程中,讓設(shè)備準(zhǔn)確的響應(yīng)用戶的問題。
基于上述技術(shù),2013 年,云知聲面向合作伙伴開放對話技能開放平臺(語義云),幫助合作伙伴打造更加自然的人機交互體驗,同時在實踐中不斷提升語義解析能力。目前這一平臺已經(jīng)支持 200 多個的對話內(nèi)容,覆蓋通訊、休閑娛樂、醫(yī)療健康、交通出行、設(shè)備控制等多個場景,語義解析準(zhǔn)確率高達 93%。
值得一提的是,語音感知與表達、語言與知識計算只是云知聲硬核 AI 技術(shù)的冰山一角,目前,云知聲硬核技術(shù)還包含了 AIoT 芯片、超算平臺與圖像、翻譯拓展等。
落地:覆蓋酒店、汽車、兒童、音箱等場景
在大數(shù)據(jù)、深度學(xué)習(xí)、超算平臺的加持下,人工智能底層技術(shù)將沖破閥值,帶來成熟的體驗,在技術(shù)和需求的雙重推動下,人工智能將邁入發(fā)展的黃金階段,并掀起新一輪的 AIoT 產(chǎn)業(yè)變革。在下午的「智能+」分論壇中,云知聲副總裁康恒、云知聲 AIOS 架構(gòu)師郭洪光、與攜住科技、同行者科技、金鷹卡通、三諾聲智聯(lián)等多位合作伙伴,結(jié)合實際案例,深入探討了 AI 技術(shù)的在酒店、汽車、兒童和音箱等場景中的應(yīng)用。
云知聲副總裁康恒表示,在整個產(chǎn)業(yè)鏈中,AI 技術(shù)是個“基礎(chǔ)設(shè)施”,且這一基礎(chǔ)設(shè)置不可能在不加以定制的情況下適用全部場景。AI 在落地過程中,需要充分考慮使用場景和落地行業(yè)。基于對場景和產(chǎn)業(yè)的深度思考,2014 年,云知聲便開始結(jié)合產(chǎn)業(yè)鏈,將云知聲的 AI 技術(shù)賦能到個行業(yè)中去。
面向行業(yè),云知聲推出了一站式人工智能平臺 UniOS。云知聲 AIOS 架構(gòu)師郭洪光表示,與同類產(chǎn)品相比,UniOS 具備開放、垂直兩大特性,其中,開放指的是云知聲面向行業(yè)和合作伙伴開放技能平臺和設(shè)備平臺,并在此基礎(chǔ)上兼容第三方 AIOS;垂直則代表 UniOS 會針對特定的行業(yè)需求輸出解決方案,以此來幫助產(chǎn)業(yè)轉(zhuǎn)型。
攜住科技聯(lián)合創(chuàng)始人葉明跟我們介紹了 AI 技術(shù)在酒店場景中的應(yīng)用案例。葉明表示,針對酒店場景,攜住科技基于 AIoT 技術(shù),通過多種設(shè)備聯(lián)動、場景定制,為酒店客戶帶來全新智能互聯(lián)的場景體驗;另一方面,通過信息整合和大數(shù)據(jù)分析,AI 還將提高酒店管理效率。
同行者科技聯(lián)合創(chuàng)始人葉維分享了 AI 語音技術(shù)如何助力汽車產(chǎn)業(yè)升級。葉維表示,在車載場景下,語音即為服務(wù)——語音是用戶與設(shè)備、與互聯(lián)網(wǎng)連接的主要手段,承載了車聯(lián)網(wǎng)資源整合與用戶觸達的功能。因此,車載場景下的 AI 必須聚合豐富的內(nèi)容和服務(wù),并根據(jù)場景進行智能匹配,打造千人千面的智能化體驗。
金鷹卡通衛(wèi)視產(chǎn)品總監(jiān)戴文博分享了金鷹卡通對兒童產(chǎn)品智能化的思考。戴文博指出,兒童和家長對智能產(chǎn)品的需求與普通場景十分不同,基于此,金鷹卡通圍繞兒童場景的特征,將 AI 技術(shù)與“麥咭”的形象做了深度整合,打造麥咭智能親子智能產(chǎn)品生態(tài)。
以帶屏音箱為例,屏幕為人機交互補充重要的視覺信息,更加接近用戶本能,“未來 5 年,單帶屏的智能音箱就會達到 3 億多臺,超過 PC 的規(guī)模。”
關(guān)于云知聲 Open Day
OpenDay 是云知聲一年一度的對外進行技術(shù)分享與交流的活動,是云知聲面向人工智能硬核科技,與合作伙伴、相關(guān)學(xué)術(shù)和產(chǎn)業(yè)研究機構(gòu)等共話人工智能前沿技術(shù)與產(chǎn)業(yè)應(yīng)用并探討合作的平臺。2019 首屆云知聲 OpenDay 設(shè)北京、深圳、上海、廈門四站。繼北京、深圳站之后,上海站活動將于5月上旬正式開啟。
關(guān)于云知聲
云知聲成立于 2012 年,是一家專注于物聯(lián)網(wǎng)人工智能,擁有自主知識產(chǎn)權(quán)的智能語音人工智能企業(yè)。是中國人工智能行業(yè)成長最快、商業(yè)化落地最好人工智能企業(yè)之一。云知聲業(yè)務(wù)主要覆蓋智慧生活和智慧服務(wù)兩大場景,在包括家居、車載、醫(yī)療、教育、政府、機器人等領(lǐng)域擁有廣泛布局。客戶涵蓋格力、美的、長虹、海爾、華帝、北京協(xié)和醫(yī)院、吉利、平安集團、京東、360等。
2018 年 5 月份,云知聲正式推出第一代 UniOne 物聯(lián)網(wǎng) AI 芯片及其解決方案——雨燕(Swift)。該芯片由云知聲自主設(shè)計研發(fā),采用云知聲自主 AI 指令集,性能較通用方案提升超過 50 倍。基于該芯片的標(biāo)準(zhǔn)化解決方案,可幫助傳統(tǒng)硬件產(chǎn)品在更短的時間周期內(nèi),以更少的成本快速實現(xiàn) AI 化,實現(xiàn)人機交互智能。
-
AI
+關(guān)注
關(guān)注
87文章
31097瀏覽量
269433 -
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112712
原文標(biāo)題:助力AI產(chǎn)業(yè)落地,云知聲展示全棧AI硬核技術(shù)
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論