这里只有精品在线,五月天精品在线,亚洲精品一区二三区在线观看

作為本年度人工智能領(lǐng)域最重要的突破之一，大語言模型相關(guān)研究始終是各大相關(guān)領(lǐng)域的關(guān)注焦點。

近日，來自清華大學、中國科學院、MIT的科研人員對于大語言模型在人機交互領(lǐng)域中的應(yīng)用進行了研究，設(shè)計了一種名為Co-Pilot的人機交互框架，使用提示引導(dǎo)ChatGPT（gpt3.5）在考慮人主觀意圖的同時完成簡單的自動駕駛任務(wù)。

論文標題：

ChatGPT as Your Vehicle Co-Pilot: An Initial Attempt

論文鏈接：

https://www.researchgate.net/publication/374800815_ChatGPT_as_Your_Vehicle_Co-Pilot_An_Initial_Attempt

該研究作為最早一批使用原生語言大模型直接介入自動駕駛?cè)蝿?wù)的嘗試，揭示了大語言模型在自動駕駛領(lǐng)域進一步深入應(yīng)用的可能性，也為后續(xù)相關(guān)研究指明了方向 [1]。

研究背景：為什么使用大語言模型？

人車交互作為智能汽車發(fā)展的重要功能之一，對降低司機駕駛負擔、提升乘客出行體驗有很大幫助，相關(guān)功能也成為了消費者在選擇時的重要標準。盡管現(xiàn)有人機交互系統(tǒng)已經(jīng)可以實現(xiàn)語音識別、指令執(zhí)行等功能，但大多數(shù)情況下系統(tǒng)僅能根據(jù)既定指令的訓(xùn)練在有限范圍內(nèi)給出回答或響應(yīng)，存在一定的局限性。相比之下，大語言模型在此類能力上具有更好的表現(xiàn)： 1. 可以理解人的意圖：大語言模型具有推理能力，其可以從文字中理解說話者的真正意圖，并給出相應(yīng)的回應(yīng)； 2. 擁有常識：得益于大量的訓(xùn)練數(shù)據(jù)中包含的知識，大預(yù)言模型具有一定的常識，并掌握許多特定領(lǐng)域的基礎(chǔ)知識與能力； 3. 對于不同任務(wù)的高度適應(yīng)性：通過調(diào)整提示詞，大語言模型對于不同任務(wù)具有很好的適應(yīng)性，可快速適配不同種類的任務(wù)，極大提升了應(yīng)用與落地的效率。基于此，大語言模型為解決人機共駕問題提供了一種新的思路。為了探索大語言模型在自動駕駛?cè)藱C交互領(lǐng)域的應(yīng)用，研究人員提出了「Co-Pilot」架構(gòu)，用于實現(xiàn)乘客、大語言模型以及車輛之間的交互。為了驗證方案的可行性，研究人員設(shè)計了兩個不同種類的任務(wù)對其進行測試，實驗效果達到了預(yù)期。

Co-Pilot：架構(gòu)與核心 Co-Pilot架構(gòu)如下圖所示：

Co-Pilot主體機構(gòu)包含了以下模塊：

1. 編碼器：將必要的信息組成提示，通過專用API發(fā)送至大語言模型。

2. LLM：大語言模型，本工作使用ChatGPT（GPT3.5-turbo-0301）。

3. 解碼器：將自然語言回應(yīng)解析為指令或數(shù)據(jù)，用于車輛的交互與控制。

4. 保險機制：考慮到大語言模型作為概率模型的本質(zhì)，現(xiàn)階段難以杜絕其在回答中出錯，故預(yù)留該保險機制防止存在明顯錯誤的指令影響車輛運行。

5. 記憶機制：保存Co-Pilot完成任務(wù)所必須的數(shù)據(jù)及其他信息，作為輸入的重要組成部分，可在工作過程中被實時更新。

Co-Pilot主要擁有兩種工作流程：

1. 實現(xiàn)流程：Co-pilot依據(jù)不同任務(wù)完成一次工作周期的流程。

2. 調(diào)優(yōu)流程：車輛專家依據(jù)不同任務(wù)調(diào)整記憶機制的前置優(yōu)化流程。

記憶機制 本文按照人類認知心理學對大語言模型內(nèi)部的知識儲存進行模擬[2]，提出了記憶機制用來劃分自動駕駛場景中可能涉及到的信息，旨在全面提升Co-Pilot信息利用效率。

專家主導(dǎo)的黑箱優(yōu)化 該方法利用黑箱優(yōu)化中在低維空間進行無梯度優(yōu)化的思想，利用專家的主觀標注來評估任務(wù)完成效果，從而更新記憶中的內(nèi)容來增強提示詞，使得LLM進行少樣本學習。

仿真實驗

為了驗證Co-Pilot架構(gòu)的可靠性，本文設(shè)計了兩個任務(wù)，在以MATLAB/Simulink為基礎(chǔ)的仿真平臺中開展。 實驗一：軌跡跟隨控制器選擇 在該實驗中，假設(shè)有一輛自動控制的汽車在預(yù)設(shè)路徑上行駛，研究人員給定Co-Pilot當前車輛狀態(tài)、路段情況等信息，要求其選擇最符合當前乘客意圖（如保證速度、緊隨軌跡、體驗舒適）的運動控制器。運動控制器為已有預(yù)設(shè)模塊，分別為NMPC控制器、Stanley + Preview控制器、PID控制器。

▲賽道總覽

▲實驗一的Co-Pilot具體結(jié)構(gòu)

在調(diào)優(yōu)環(huán)節(jié)中，研究人員分別對語義記憶與情景記憶進行了更新，其中語義記憶僅能提供對控制器的種類（A1）或定性描述（A2），而情景記憶可以提供對控制器在過去相似場景下的具體表現(xiàn)（A3）。賽道被分為五個區(qū)段，研究人員根據(jù)Co-Pilot是否在各區(qū)段選出了最符合當前乘客意圖的控制器進行打分（每個區(qū)段最優(yōu)1分，次優(yōu)0.5分，最差0分，賽道總分最高為5分），分析不同記憶對于Co-Pilot表現(xiàn)的影響，研究人員在「精確跟蹤」與「保持穩(wěn)定」兩種意圖下分別測試，測試結(jié)果顯示，A1僅取得3分，Co-Pilot在所有區(qū)段均選擇了NMPC控制器。由于此時提供的信息有限，其只能根據(jù)訓(xùn)練中積攢的常識「NMPC的控制效果很好」做出判斷。A2取得了7.5分，而A3取得了8.5分，證明情景記憶在相似任務(wù)中對Co-Pilot的推理最有幫助，使其可結(jié)合人類意圖給出合理的反應(yīng)。接著，研究人員使用了調(diào)優(yōu)后的A3提示模式開展了更復(fù)雜的實驗。在此實驗中，五個區(qū)段的人類意圖不再保持一致且引入了更口語化表達的新意圖「刺激」。實驗結(jié)果如下圖所示，Co-Pilot在每個區(qū)段都能選出最符合乘客意圖的控制器(由于控制器在切換時受到上一區(qū)段的車輛狀態(tài)影響，導(dǎo)致被選控制器的效果與預(yù)期可能存在細微差異)。

實驗二：雙移線避障軌跡規(guī)劃 在本實驗中，研究人員將重點轉(zhuǎn)移到規(guī)劃類任務(wù)，向Co-Pilot描述當前路況，并要求其給出未來10s內(nèi)的路徑。

在調(diào)優(yōu)環(huán)節(jié)中，研究人員更加側(cè)重對于程序記憶的組織與優(yōu)化，語義記憶與情景記憶中包含的信息基本不存在差異。在此的前提下，不同提示帶來的顯著結(jié)果差異更加值得深入探究。

▲四種提示的區(qū)別以及十次測試的平均得分情況（打分依據(jù)：合理性滿分5分、完成度滿分3分、正確性滿分2分）

▲四種提示下的代表軌跡在使用B4提示的前提下，進一步引入不同種類的乘客意圖，得到的代表性軌跡如下，可以看出在給出正確避讓軌跡的基礎(chǔ)上，Co-Pilot可以進一步調(diào)整軌跡使其符合乘客意圖。

▲不同乘客意圖的代表軌跡，均符合乘客意圖

結(jié)果討論 實驗中我們可以注意到，提示中不同記憶的組合，對于LLM的表現(xiàn)有著顯著影響。 1. LLM可根據(jù)常識以及記憶中包含的信息進行推理，在提供的信息不足以實現(xiàn)合理推斷時，LLM可根據(jù)其訓(xùn)練中積累的經(jīng)驗做出決策； 3. 提示中的程序記憶在任務(wù)本身的描述上有時并不存在本質(zhì)區(qū)別，但卻對LLM的表現(xiàn)產(chǎn)生了很大影響。這些現(xiàn)象引出了后續(xù)可能值得研究的更多問題：類似交通等復(fù)雜場景應(yīng)該如何高效描述以發(fā)揮LLM的優(yōu)勢？LLM內(nèi)部實現(xiàn)推理/完成任務(wù)的機制究竟如何？這些問題與大模型乃至人工智能的可解釋性、安全性等重要問題息息相關(guān)。

未來展望與挑戰(zhàn) Co-Pilot是一種創(chuàng)新的嘗試，它將LLM應(yīng)用于人機混合智能[3]。LLM大大提高了人機通信的效率，使人類和機器更好地理解彼此。人類專家對Co-Pilot進行調(diào)優(yōu)的過程可以被視為系統(tǒng)的自適應(yīng)學習。這使得深入的人機合作成為可能，并且在測試和調(diào)整人工智能系統(tǒng)方面具有巨大潛力。

▲LLM與現(xiàn)有平行學習架構(gòu)[4]相結(jié)合，可進一步提升機器學習的效率

另一方面，正如本文實驗中展示的，大語言模型通過海量數(shù)據(jù)訓(xùn)練得到的常識能在其工作中發(fā)揮重要作用。后續(xù)在此基礎(chǔ)上，多模態(tài)混合大模型（如視覺+語言模態(tài)）能夠進一步打通「感知-規(guī)劃-執(zhí)行」的流程，使得此類大模型可勝任自動駕駛、機器人等需要與現(xiàn)實世界交互的復(fù)雜任務(wù)[5]。當然，研究過程中涌現(xiàn)出的許多潛在挑戰(zhàn)也值得關(guān)注：例如，怎樣進一步提升LLM的性能？如何保證LLM表現(xiàn)得一致性、穩(wěn)定性？在面對更復(fù)雜的動態(tài)場景時，如何保證LLM正確完成任務(wù)？

總結(jié) 本工作提出了一種將大語言模型直接用于人機共駕任務(wù)的Co-Pilot架構(gòu)，并設(shè)計對應(yīng)實驗初步證明了架構(gòu)的可靠性以及大語言模型在自動駕駛類任務(wù)中的可適用性，討論了相關(guān)領(lǐng)域研究的潛在機遇及挑戰(zhàn)。該項工作已于近日發(fā)表于IEEE Transactions on Intelligent Vehicles，來自清華大學深圳國際研究生院的王詩漪以及來自清華大學自動化系的朱宇軒為本文共同第一作者，通訊作者為清華大學自動化系李力教授。其他合著者為清華大學李志恒副教授，中科院自動化研究所王雨桐助理研究員，以及麻省理工學院賀正冰高級研究員。

參考文獻

?[1] S. Wang, Y. Zhu, Z. Li, Y. Wang, L. Li, Zhengbing He, "ChatGPT as your vehicle Co-Pilot: An initial attempt," IEEE Transactions on Intelligent Vehicles, https://ieeexplore.ieee.org/document/10286969/[2] T. Sumers, S. Yao, K. Narasimhan, T. L. Griffiths, “Cognitive Architectures for Language Agents.” arXiv, Sep. 05, 2023. doi: 10.48550/arXiv.2309.02427.[3] L. Li, Y. Lin, Y. Wang, F.-Y. Wang, "Simulation driven AI: From artificial to actual and vice versa," IEEE Intelligent Systems, vol. 38, no. 1, pp. 3-8, 2023.[4] L. Li, Y.-L. Lin, N.-N. Zheng, F.-Y. Wang, "Parallel learning: A perspective and a framework," IEEE/CAA Journal of Automatica Sinica, vol. 4, no. 3, pp. 389-395, 2017.[5] D. Fu, X. Li, L. Wen, M. Dou, P. Cai, B. Shi, Y. Qiao, “Drive Like a Human: Rethinking Autonomous Driving with Large Language Models,” arXiv, Jul. 14, 2023,doi: 10.48550/arXiv.2307.07162.

原文標題：把ChatGPT塞進副駕駛！清華、中科院、MIT聯(lián)合提出Co-Pilot人機交互框架

文章出處：【微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

物聯(lián)網(wǎng)

物聯(lián)網(wǎng)

+關(guān)注

關(guān)注
2916

文章
45232

瀏覽量
380166

原文標題：把ChatGPT塞進副駕駛！清華、中科院、MIT聯(lián)合提出Co-Pilot人機交互框架

文章出處：【微信號：tyutcsplab，微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

清華牽頭深開鴻參與：混合智能人機交互系統(tǒng)獲批立項

近日，一個由清華大學牽頭、深開鴻重點參與的“面向混合智能的自然人機交互軟硬件系統(tǒng)”研發(fā)計劃項目，正式獲得了立項批準。該項目是國家“十四五”重點研發(fā)計劃“先進計算與新興軟件”專項中的一項關(guān)鍵核心技術(shù)

發(fā)表于 01-23 16:33 ?474次閱讀

深開鴻參與國家重點研發(fā)項目，聚焦新型自然人機交互軟硬件前沿

近日，由清華大學牽頭、深開鴻重點參與的“面向混合智能的自然人機交互軟硬件系統(tǒng)”研發(fā)計劃項目正式獲批立項。該項目屬于工業(yè)和信息化部主責的“十四五”國家重點研發(fā)計劃重點專項中的“先進計算與新興軟件”項目

發(fā)表于 01-22 16:12 ?239次閱讀

深開鴻參與國家重點研發(fā)項目，聚焦新型自然<b class='flag-5'>人機交互</b>軟硬件前沿

漢陽大學：研發(fā)自供電、原材料基傳感器，開啟人機交互新篇章

近日，韓國漢陽大學王偉教授團隊在人機交互技術(shù)領(lǐng)域取得重要突破，提出了一種自供電、原材料基、具有最小化信號通道數(shù) 的傳感器陣列設(shè)計方法。這一研究為傳感器在低成本、高效人機交互中的應(yīng)用開辟

發(fā)表于 01-06 17:42 ?239次閱讀

漢陽大學：研發(fā)自供電、原材料基傳感器，開啟<b class='flag-5'>人機交互</b>新篇章

啟英泰倫新推出多意圖自然說，重塑離線人機交互新標準！

智能語音識別技術(shù)作為人機交互領(lǐng)域的一場革命性突破，正逐步重塑我們與智能設(shè)備的交互方式。近期，啟英泰倫新推出了多意圖自然說技術(shù)，進一步增強了人機交互的自然流暢度與操作便捷性。AI語音2.0——多意

發(fā)表于 01-03 16:01 ?242次閱讀

啟英泰倫新推出多意圖自然說，重塑離線<b class='flag-5'>人機交互</b>新標準！

芯海科技ForceTouch3.0：重塑人機交互新境界

在追求極致用戶體驗的智能時代，每一次技術(shù)的革新都是對未來的深度探索。芯海科技，作為業(yè)界領(lǐng)先的芯片設(shè)計企業(yè)，憑借其ForceTouch3.0技術(shù)，正引領(lǐng)著一場人機交互的變革，為智能手機、智能穿戴、家電乃至汽車電子等領(lǐng)域注入了全新的活力與可能。

發(fā)表于 11-28 09:20 ?384次閱讀

芯海科技ForceTouch3.0：重塑<b class='flag-5'>人機交互</b>新境界

具身智能對人機交互的影響

在人工智能的發(fā)展歷程中，人機交互一直是研究的核心領(lǐng)域之一。隨著技術(shù)的進步，人機交互的方式也在不斷演變。從最初的命令行界面，到圖形用戶界面，再到現(xiàn)在的自然語言處理和語音識別，每一次技術(shù)的突破都極大

發(fā)表于 10-27 09:58 ?580次閱讀

字節(jié)跳動與清華AIR成立聯(lián)合研究中心

近日，清華大學智能產(chǎn)業(yè)研究院（AIR）與字節(jié)跳動共同宣布成立“可擴展大模型智能技術(shù)聯(lián)合研究中心”（SIA Lab），并在清華大學舉行了隆重的成立儀式。

發(fā)表于 10-12 15:24 ?537次閱讀

聚徽-工控一體機是如何實現(xiàn)人機交互的

工控一體機實現(xiàn)人機交互的方式是多種多樣的，結(jié)合搜索結(jié)果，我們可以歸納出以下幾種主要的實現(xiàn)方式：

發(fā)表于 09-10 09:31 ?474次閱讀

基于傳感器的人機交互技術(shù)

基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之一，它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù)，包括其基本原理、關(guān)鍵技術(shù)、應(yīng)用領(lǐng)域以及未來發(fā)展趨勢。

發(fā)表于 07-17 16:52 ?1204次閱讀

人機界面交互方式的介紹

人機界面（Human-Computer Interaction, HCI）是研究人與計算機之間交互方式的學科。隨著計算機技術(shù)的發(fā)展，人機交互方式也在不斷地演變和創(chuàng)新。以下是對各種人機交互

發(fā)表于 07-01 14:22 ?1127次閱讀

人機交互界面是什么_人機交互界面的功能

人機交互界面（Human-Computer Interaction Interface，簡稱HCI或HMI），也被稱為人機界面（MMI）、操作員界面終端（OIT）、本地操作員界面（LOI）或操作員

發(fā)表于 06-22 11:03 ?3099次閱讀

工業(yè)平板電腦在人機交互中的應(yīng)用

工業(yè)平板電腦在人機交互（Human-Machine Interaction，HMI）中扮演著至關(guān)重要的角色，它們通過直觀的界面和強大的計算能力，極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應(yīng)用：

發(fā)表于 06-18 12:00 ?376次閱讀

人機交互與人機界面的區(qū)別與聯(lián)系

隨著信息技術(shù)的飛速發(fā)展，人機交互（Human-Computer Interaction，HCI）已成為現(xiàn)代社會不可或缺的一部分。人機交互技術(shù)，作為實現(xiàn)人與計算機之間有效通信的橋梁，不僅改變了我們

發(fā)表于 06-07 15:29 ?1282次閱讀

芯海科技“壓容二合一SoC”系列芯片打造極致人機交互體驗

5月7日晚，蘋果春季新品發(fā)布特別活動推出全新升級的Apple Pencil Pro，持續(xù)深度布局壓力觸控人機交互領(lǐng)域。

發(fā)表于 05-11 10:00 ?610次閱讀

人機交互的三個階段 人機交互的常用方式

機交互經(jīng)歷的三個階段：命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。

發(fā)表于 03-13 17:25 ?3572次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

把ChatGPT塞進副駕駛！清華、中科院、MIT聯(lián)合提出Co-Pilot人機交互框架

評論

清華牽頭深開鴻參與：混合智能人機交互系統(tǒng)獲批立項

深開鴻參與國家重點研發(fā)項目，聚焦新型自然人機交互軟硬件前沿

漢陽大學：研發(fā)自供電、原材料基傳感器，開啟人機交互新篇章

啟英泰倫新推出多意圖自然說，重塑離線人機交互新標準！

芯海科技ForceTouch3.0：重塑人機交互新境界

具身智能對人機交互的影響

字節(jié)跳動與清華AIR成立聯(lián)合研究中心

聚徽-工控一體機是如何實現(xiàn)人機交互的

基于傳感器的人機交互技術(shù)

人機界面交互方式的介紹

人機交互界面是什么_人機交互界面的功能

工業(yè)平板電腦在人機交互中的應(yīng)用

人機交互與人機界面的區(qū)別與聯(lián)系

芯海科技“壓容二合一SoC”系列芯片打造極致人機交互體驗

人機交互的三個階段人機交互的常用方式