色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

汽車AI語音交互 正在讓機器交互更接近真人交互

jf_f8pIz0xS ? 來源:智能相對論 ? 作者:胡楊 胡皓 ? 2020-07-25 12:03 ? 次閱讀

現在,情況有了改善。當用戶詢問車機“明天出門需要帶傘么?”,車機就會播報明天的天氣情況,如果需要再查詢其他時間或者城市的天氣,那么用戶不用重新喚醒,也不需要說出完整表達,只需要說“那大后天呢?”、“那杭州呢?”。在用戶和車機在自然連續對話的過程中,語義理解服務會記住會話的歷史,并結合歷史處理用戶的請求,通過這種方式,用戶的多次連續交互就可以形成一個會話流,與用戶的交互也更加自然。

自然連續對話,是車載語音交互從“人工智障”邁向“人工智能”的重要一步。不過斑馬網絡最近推出的斑馬智行VENUS系統,打破了對用戶說話規則的要求,用戶可以按照自身的說話習慣來進行交流,交互過程更加人性化。這會不會是一個跨越?

從科幻到現實,語音交互一直在進化

提到智能語音交互,普羅大眾對于技術刷屏的記憶停留在2018年的Google開發者大會“Google I/O”開幕式上。當Google Assistant以驚人的流利會話,打電話和店家溝通,預約理發店、餐廳,并用一句俏皮的“嗯哼”作為回應時,觀眾給予了熱烈的掌聲。這是技術愿景美好、激勵人心的一面。

有趣的是,同年2月的美國第五十二屆超級碗的天價廣告上,亞馬遜賣力黑了自家的智能音箱和智能助手——Alexa。喚醒失誤、識別不準、響應困難等等用戶槽點,被廣告創意表現得淋漓盡致。這是技術的現實。

但不論是基于場景的未來暢想,還是對當下缺陷的大膽自嘲,兩個科技巨頭都將業務重心的一角,押注在了語音交互賽道上。

亞馬遜首席技術官Werner Vogels斷言:未來,人和數字世界對的交互,一定是以“人”為核心,而不是機器驅動;我們終將構建出更人性化的交互,讓人機互動更加融合。

在“以人為核心”、“更加融合”的人機交互中,語音交互(簡稱VUI)是核心。VUI允許更自由、高效的人機交互,其本質上比任何其他形式的用戶界面都更“人性化”。斯坦福大學教授,Wired for Speech的合著者,克利福德·納斯寫道:“語音是人類交流的基本手段……。所有文化主要通過語音來說服,告知和建立關系。”

VUI允許用戶使用語音作為媒介與機器進行交互。從《2011太空漫游》中的HAL到《星球大戰》中的C-3PO,人們在科幻電影里暢想著能夠與機器自由溝通。事實上,早在1952年,貝爾實驗室的工程師就開發出了Audrey(奧黛麗):它可以識別數字0-9的發音。盡管奧黛麗能夠以超過90%的精度識別語音輸入,但其體積大,成本高昂,未曾步入大規模商業化的發展通道。

自此,人類開啟了長達半個多世紀的語音交互探索。1962年,IBM推出了第一臺真正意義上的是語音識別機器。工程師William Dersch開發出的Shoebox可以收聽操作員說出的數字和命令。例如“5+3+8+6+4-9,總和”,機器將打印出正確答案:17。

1970年,隱馬爾可夫模型(HMM)為語音識別的發展插上了算法的翅膀,讓語音識別從文字匹配進化到了可預測的高度。20世紀80年代,Covox,Dragon Systems,Speechworks相繼成立,推動了語音識別的商用化進程。

90年代,語音識別技術迎來了大規模商用和普及。1995年,Dragon發布了單詞聽寫級的語音識別軟件。這是人類歷史上首個面向廣大消費者的語音識別產品。僅一年之后,Charles Schawab(嘉信理財)和Nuance(紐昂斯)聯合推出了一套“語音股票經紀人”系統,可同時響應360個客戶的股票詢價電話。1997年,如今隸屬Nuance旗下的聲龍系統(Dragon system)推出了“NaturallySpeaking”軟件,這是歷史上第一個可用的“連續語音”聽寫軟件。它標志著單詞級不停頓語音交互的開始。

最近的20年,Google,Apple,Amazon先后推出了大眾耳熟能詳的智能語音助手,并通過智能手機、智能音箱等產品,來到普羅大眾身邊。據Juniper Research統計,截至2019年2月,全球使用中的語音助手達32.5億;預計到2023年,該數字將達到80億。

語音交互技術上的高山一:自然連續對話

隨著軟硬件的快速迭代,如今的ASR(語音識別)技術已近成熟,未來智能語音交互的核心競爭力在于在復雜場景下準確理解用戶的意圖,并為其提供差異化服務。更加智能的自然連續對話能力,將讓語音交互系統更具人類的親和力特質和邏輯思維能力,能帶給用戶更具情景化、更有溫度的用車體驗和服務潛力。

“智能相對論”認為,自然連續對話是一個系統的工程,涉及到從車機端的聲學前端處理、語音喚醒、語音識別、語義理解、對話管理、自然語言生成、語音合成等核心交互技術。斑馬智行VENUS的AI語音得益于阿里達摩院的重磅加持以及科大訊飛、思必馳等合作伙伴的大力支持,極大提升了語音能力。斑馬基于AliOS系統,可以更好地將語音核心技術能力與系統能力相結合,更大程度地發揮出語音核心技術的優勢,將多種引擎的協作發揮到極致,達到“1+1》2”的效果。

語音交互技術上的高山二:個性化,即聲音克隆

如果說自然連續對話為更自由的交互和差異化服務提供可能,那語音定制化則將個性化、情感化的語音交互率先落地。

2017年9月,一家名為Lyrebird的加拿大初創公司在推特上發布了一段10秒的錄音。錄音是內容AI模仿美國總統特朗普的話語。在此之前,Google旗下的DeepMind曾經公布了一個用AI合成人聲的研究成果:WaveNet,達到以假亂真的地步。Adobe也發布過一款名為Project VoCo的原型軟件,在傾聽20分鐘音頻樣本之后可以進行模仿。而Lyrebird將音頻采樣的輸入時間縮短到了60秒。

如今,國內智能網聯行業也首次迎來了語音定制——“聲音克隆”產品。斑馬智行VENUS系統“聲音克隆”操作流程非常簡單。用戶只需在斑馬智行APP錄制20句話即可合成私人語音包,一鍵發送至車機便可全局使用,無論是導航引導、天氣查詢,還是預訂餐廳,和你對話的都是你最想聽的聲音。

聲音是車載AI語音交互功能的“靈魂”,基于“聲音克隆”技術,斑馬智行VENUS系統將為用戶提供“千人千聲”的定制化服務,用戶可以“克隆”親人和愛人的聲音,讓陪伴更長久,讓駕駛更舒心。

據介紹,斑馬智行VENUS系統“聲音克隆”操作流程非常簡單。用戶只需在斑馬智行APP錄制20句話即可合成私人語音包,一鍵發送至車機便可全局使用,無論是導航引導、天氣查詢,還是預訂餐廳,和你對話的都是你最想聽的聲音。斑馬網絡AI語音相關負責人表示,斑馬智行VENUS系統能在錄制“傾聽”中“掌握”每個人說話時的字母、音位、單詞和語句的發音特點,通過深度學習技術推理并模仿聲音中的語音音色、語調,“說”出全新的語句。

攀登技術高山,如何讓機器交互能夠更接近真人交互依然在等待更好答案

語音是人類最舒適,最直觀的交流方式之一。如今的智能語音交互產品,變得越來越像人一樣聰明且富有感情。它可以準確理解信息輸入、高效處理并提供理想的信息輸出。“智能相對論”認為,在人工智能和5G迅速發展的背景下,語音平臺有機會成為物聯網時代下新的“操作系統”,連接全新的產業生態,包括各類服務、應用、硬件等。

在各類應用場景中,除了智能家居,汽車產品對于語音交互的需求顯而易見。不論是點擊、滑動等觸摸交互方式,在車載環境下都存在安全隱患且并不高效,語音交互是天然適應車載環境的交互方式。不過想要設計、開發、應用一套成熟的車載語音交互系統,要翻越重重高峰:行車噪音干擾如何處理、方言口音如何適配、自然的表達如何更好支持、系統的誤觸發如何控制在可用范圍。

而隨著用戶對汽車智能化要求的越來越高,更自然的交互成為語音交互的發展方向。如何讓機器交互能夠更接近真人交互?多模態融合理解、自然全雙工對話、自然語義理解成為了新的需要攀登的高峰。

斑馬智行的系統底層——AliOS,在傳統觸控、按鍵交互模式的基礎上,將語音交互能力、視覺交互能力以及場景信息在系統層進行融合互通,更大程度得發揮了各個交互能力的優勢,使得多模態融合理解、融合交互以及更自然的全雙工對話、擁有更多信號輸入的自然語義理解成為可能。同時在各種交互能力融合后對上層應用進行開放,使得最終呈現給用戶的交互更自然。

語音交互帶來的產業機遇方興未艾。如果說,未來的主流交互方式存在多樣的可能性,那更高率、更自然、更接近于人本能的方向一定是人機交互的未來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1206

    瀏覽量

    55384
  • AI
    AI
    +關注

    關注

    87

    文章

    30731

    瀏覽量

    268893
收藏 人收藏

    評論

    相關推薦

    基于語音識別的智能會議系統具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將語音識別技術在智能
    的頭像 發表于 12-20 10:35 ?35次閱讀

    基于智能語音交互的智能呼叫中心工作機制

    作為實現智能呼叫中心的關鍵技術之一的智能語音交互技術,它通過集成自然語言處理(NLP)、語音識別(ASR)和語音合成(TTS)等先進技術,實現了與客戶的智能
    的頭像 發表于 12-03 16:44 ?274次閱讀
    基于智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機制

    聲智科技超低成本部署,打造AI硬件與AI交互產業生態

    7月31日,聲智科技在北京·海淀舉行AI媒體溝通會,以“大模型·新交互”為主題,聲智科技副總裁黃赟賀公布了AzeroGPT 的算法技術升級成果,并發布了兩款新品——AI 交互新品“千面
    的頭像 發表于 08-02 10:00 ?591次閱讀

    立功科技ISD智能交互車燈技術方案

    隨著智能汽車的快速發展,車燈產業正在經歷從功能車燈向智能車燈轉型發展,ISD智能交互車燈憑借成熟的產業鏈以及不斷升級的技術方案,正逐步成為市場主流。本文為大家介紹立功科技ISD智能交互
    的頭像 發表于 07-18 14:26 ?1049次閱讀
    立功科技ISD智能<b class='flag-5'>交互</b>車燈技術方案

    聆思CSK6視覺語音大模型AI開發板入門資源合集(硬件資料、大模型語音/多模態交互/英語評測SDK合集)

    豐富外設配件 配套多模態應用示例,支持快速上手體驗大模型語音交互、智能視覺等 AI 應用 板載 DAPLINK 調試器,外接一條USB 線即可實現燒錄、調試、串口日志查看 板載網絡模組,支持開發聯網類
    發表于 06-18 17:33

    觸翔X86工控主板在交互機器人中的應用

    X86工控主板在交互機器人中的應用主要體現在其高可靠性、抗干擾性和穩定性等方面,為交互機器人的正常運行和精確控制提供了有力支持。以下是關于X86工控主板在
    的頭像 發表于 05-28 15:48 ?469次閱讀

    智能語音交互技術如何助力設備實現人機自然對話

    隨著現代人工智能在各行業的普及,智能語音交互技術也越來越多的在日常工作、生活中應用,智能語音交互的出現不僅僅大量節省了人工的工作時間提高了工作效率,為人們工作生活帶來便利的同時,也改變
    的頭像 發表于 05-23 15:16 ?716次閱讀
    智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>技術如何助力設備實現人機自然對話

    智能語音交互技術如何助力設備實現人機自然對話

    智能語音交互技術是指通過語音識別、語音合成和自然語言理解等技術,實現人與機器之間自然語言的交流和互動。隨著現代人工智能在各行業的普及,智能
    的頭像 發表于 05-23 15:14 ?376次閱讀

    WTK6900G語音識別芯片在車載語音交互氛圍燈上的應用案例解析

    隨著智能汽車的快速發展,車載語音交互技術逐漸成為提升駕駛體驗的關鍵技術之一。傳統的車載燈光控制系統往往依賴于手動操作,不僅操作繁瑣,而且在駕駛過程中容易分散駕駛員的注意力。因此,開發一種高效、便捷
    的頭像 發表于 05-17 13:57 ?406次閱讀

    **十萬級口語識別,離線自然說技術,智能照明懂你**

    自然說技術,用戶不用死記硬背,提供了自然、更靈活、智能的語音交互方式。 方案框圖 在方案設計上,啟英泰倫充分考慮了產品功能、復雜程度和制造成本等因素。通過將
    發表于 04-29 17:09

    人機交互的三個階段 人機交互的常用方式

    交互經歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發表于 03-13 17:25 ?3031次閱讀

    人機交互技術有哪幾種 人機交互技術的發展趨勢

    的幾種形式: 圖形用戶界面(GUI):圖形用戶界面是目前最為常見的人機交互技術形式。它通過圖形化的方式展示信息,用戶可通過鼠標、鍵盤等設備進行操作。GUI簡單直觀,易于學習使用,適用于大眾用戶。 語音交互技術:
    的頭像 發表于 01-22 17:47 ?3592次閱讀

    設備聰明 |離線自然說,開啟智能語音交互新體驗!

    離線語音識別是指不需要依賴網絡,在本地設備實現語音識別的過程,通常以端側AI語音芯片作為載體來進行數據的采集、計算和決策。但是語音芯片的存儲
    的頭像 發表于 01-10 08:15 ?1006次閱讀
    <b class='flag-5'>讓</b>設備<b class='flag-5'>更</b>聰明 |離線自然說,開啟智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新體驗!

    設備聰明 |啟英泰倫離線自然說,開啟智能語音交互新體驗!

    啟英泰倫新推出「離線自然說」——一種輕量級的離線NLP技術。通過該技術,語音芯片可支持數萬條離線詞條,泛化能力強,幾乎可涵蓋用戶日常所有說話習慣,可以為用戶提供自然、豐富、更靈活的離線語音
    的頭像 發表于 01-04 11:24 ?792次閱讀
    <b class='flag-5'>讓</b>設備<b class='flag-5'>更</b>聰明 |啟英泰倫離線自然說,開啟智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新體驗!

    思必馳語音算法與芯片的完美結合 人機交互

    TH1520芯片解決方案AISpeech思必馳深圳羲頓科技有限公司TH1520是深聰智能(思必馳旗下的芯片設計企業)根據語音交互市場及算法的需求及發展方向,自主定義開發的“芯片+算法”的人
    的頭像 發表于 12-29 11:43 ?997次閱讀
    思必馳<b class='flag-5'>語音</b>算法與芯片的完美結合 人機<b class='flag-5'>交互</b>
    主站蜘蛛池模板: rio 快播| 成人性生交大片免费看4| 最新老头恋老OLDMAN| 2019夜夜| 超碰免费视频caopoom9| 国产成人无码视频一区二区三区| 国产成人8x视频一区二区| 国产色婷婷亚洲99麻豆| 精品国产中文字幕在线视频| 老鸭窝毛片| 人人啪日日观看在线| 校草让我脱了内裤给全班看| 一区二区三区国产| 99视频在线观看免费| 国产精品久久久久久搜索| 精品久久日日躁夜夜躁AV| 免费女人光着全身网站| 日韩欧美1区| 亚洲乱亚洲乱妇在线观看| 69国产精品人妻无码免费| 动漫美女喷水| 黑吊大战白xxxxxx| 女人高潮被爽到呻吟在线观看| 色在线视频亚洲欧美| 一本道无码字幕在线看| WWW国产精品内射老师| 国产人妻久久久精品麻豆| 麻豆乱码一卡二卡三卡视频| 色姐妹久久综合在线av| 一二三四高清中文版视频| www色小姐| 国色精品VA在线观看免费视频| 蜜臀亚洲AV永久无码精品老司机| 视频成人永久免费看| 中文字幕在线观看亚洲| 九九热精品免费观看| 欧美精品专区免费观看| 亚洲国产成人爱AV在线播放丿 | 色欲狠狠躁天天躁无码中文字幕| 亚洲精品免费视频| vagaa哇嘎黄短片|