4月17-18日,蓋世汽車2024第二屆汽車人工智能大會在上海國際汽車城舉行。大會圍繞大模型技術、汽車機器人、AI智艙等熱點話題展開討論,共話AI如何重塑汽車行業。思必馳智能汽車事業部高級產品總監曾春華出席會議并作《思必馳大模型塑造智能座艙場景大融合》的主題分享。
基于對話式AI技術不斷升級基座模型,深入車載語音場景
曾春華表示,思必馳在智能汽車領域已有多年深耕與積累,截止到目前,已合作54家汽車品牌、160款量產車型、累計上車量超過1000萬。據蓋世汽車研究院及佐思汽研對國內語音供應商市場搭載量排行統計,思必馳排名前三。
在AI大模型領域,思必馳于2023年7月發布了針對垂域的、具有通用智能的行業語言大模型DFM-2,并針對通用模型事實不準、私域知識無法包含、專用領域理解性能不足等問題進行了一系列技術改造,形成DFM-2行業大模型,具備場景專業化、模型專用化、體驗專精化三大特點。
DFM-2大模型通過與思必馳語言計算平臺DUI 2.0相結合,基于對話式AI技術不斷升級基座模型,深入車載語音場景,重構車載語音交互能力。目前,思必馳DFM-2大模型不僅成為江蘇省首個完成雙備案的行業大模型,更與多家車企達成合作,實現在汽車領域量產落地。
以融合架構為核心的“中樞大模型”解決方案
縱觀國內大模型市場,截止到2024年第一季度,國內共發布了243個人工智能大模型,AI大模型領域可謂百花齊放。思必馳在與車企合作伙伴的溝通中了解到,由于不同的大模型各有所長,車企伙伴在選擇大模型的時候往往難以取舍,不同的大模型之間也存在一定的融合難度。
針對市面上單點模型“孤島化”、無法與座艙深度融合的情況,思必馳基于自研全鏈路智能語音語言交互技術、DFM大模型以及大數據構建“中樞大模型”架構,打造“1+ N”模式,即“1”個百模中臺(中樞大模型)與“N”個專業大模型組合上車,打通前端語言處理、用車場景與后端模型生態,形成車載垂域的生態圈,使車載AI體驗從“語音指令”邁向“語言智能”+“工具智能”。
思必馳“中樞大模型”方案改變了單一大模型模式,升級為以中樞大模型為底座的多模型融合車載Agent框架,支持端側與云側分布式部署、支持解耦,便于后續輕量化升級。通過新的大模型云端框架,可支持垂域模型實現插拔式靈活升級,打造更加開放的垂域生態。
通過對出行高頻應用場景進行分析,思必馳發現座艙用戶的語音請求主要集中在導航、車控、多媒體等場景。曾春華表示,大模型的賦能需圍繞用戶需求,基于用戶的高頻使用場景有的放矢。為此,思必馳中樞大模型方案將以全面賦能出行最高頻應用場景為目標,通過融合大模型的方式對智能座艙語音交互全技能、全場景進行重構升級。
目前,基于多模融合大模型方案打造的天琴語音助手7.0版本已可實現多人設自由切換、大模型行程規劃、跨域上下文意圖理解、一句話百變壁紙等多個首創式落地應用。全域端到端速度以及多輪對話語音合成速度均可控制在3s以內,引領行業標準。與此同時,拒識+響應的整體準確率在92.7%,其中非閑聊類準確率可達98%以上,大大降低用戶閑聊聲音對座艙交互的影響,讓用戶感受更加自由自在的座艙語音交互體驗。
從2022年思必馳DFM-1大模型應用,在智能汽車領域打造了基于限定任務的規則對話、全時全雙工對話、全場景可見即可說、多路同時交互等經典應用;到2024年基于多模融合大模型方案的天琴語音助手7.0版本的推出,思必馳從未停止在智能汽車領域的研發與創新的腳步。曾春華表示,未來,隨著DFM-3多模融合大模型的發展,多模態跨領域交互、類人交互,以及終端車載家庭互聯場景融合的時代終將到來,“大模型+大融合”將重新定義人機交互。
審核編輯:劉清
-
機器人
+關注
關注
211文章
28380瀏覽量
206919 -
思必馳
+關注
關注
4文章
284瀏覽量
14282 -
ai技術
+關注
關注
1文章
1266瀏覽量
24288 -
智能座艙
+關注
關注
4文章
948瀏覽量
16335 -
大模型
+關注
關注
2文章
2423瀏覽量
2645
原文標題:汽車人工智能大會 | 思必馳大模型塑造智能座艙場景大融合
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論