編者按:智能汽車正在從傳統的“制造”到“制造+服務”模式轉變。它將連接城市和個人,在個人消費、城市管理和企業服務方面,都有著非常大的想象空間。
近日,在2021世界智能汽車大會上,商湯科技聯合創始人、移動智能事業群總裁王曉剛教授發表主題演講《通用智能拓展智能汽車邊界》。
他指出,通用智能不僅可以解決大量的長尾問題,還能夠不斷豐富智能汽車的應用場景。商湯致力打造的SenseCore商湯AI大裝置,正通過超級算力和超大模型,為智能汽車構建通用智能的能力,推動智能汽車與各個產業相互融合,不斷創新駕乘體驗。
以下為王曉剛教授演講內容,商湯君整理分享給大家: 非常榮幸今天能有機會與大家分享未來人工智能發展的一個重要趨勢——通用智能如何打破智能汽車的邊界。 智能汽車正在從傳統的“制造”到“制造+服務”模式轉變。它將連接城市和個人,因此在個人消費、城市管理和企業服務方面,都有著非常大的想象空間。
我們知道,人工智能有三大要素:算力、算法和數據。 從算力的角度看,智能汽車的算力是智慧城市視覺感知終端算力的百倍,是智能手機的幾十倍。
由于汽車處于移動狀態,其產生的感知數據無論在數據體量還是數據質量方面,都遠高于其他領域。智能汽車就是一個巨大的、移動的數據生產源,關鍵是如何通過人工智能算法去挖掘這些數據背后的價值,我們認為有四類人工智能的模型: 第一類是智能感知模型。車載會產生大量的視頻、圖像,還有3D的非結構化數據,需要通過智能的感知將這些數據高效地進行結構化。 第二類是決策智能。數據結構化之后,需要更好地去做決策,包括更好地完成人機交互。 第三類是智能內容生成。人工智能、增強現實、混合現實技術的發展為我們的物理世界打造了一個平行的虛擬世界。智能內容生成能夠為虛擬世界高效地生成大量內容,讓虛擬世界更加精彩。
第四類是智能內容增強。在高速運動、極暗等各種極端情況下,仍能得到高質量的圖像和視頻,也是人工智能模型能給數據帶來的價值。
通用智能拓展智能汽車邊界
通過人工智能拓展智能汽車的邊界,需要解決兩方面的問題:
第一,需要解決大量的長尾問題。比如在智能駕駛的過程中,有很多場景出現的頻次很低,也沒有大數據的支撐去做訓練,但是一旦出現其產生的后果會非常嚴重。未來,不同汽車智能駕駛功能的差異化,就在于誰能夠去解決更多的長尾問題,滿足消費者更好的體驗。
第二,要不斷豐富智能汽車的應用場景。比如智能駕駛中,從高速路自動巡航,到普通城區中的自動駕駛,從有高精地圖到沒有高精地圖覆蓋的廣大區域;在智能車艙中,從駕駛員感知到對老人、兒童、寵物的關愛,再到智慧健康功能的應用;又如智能汽車和城市的元宇宙、增強現實、混合現實應用的融合;再如多模交互,通過基于視覺的姿態、表情、唇語的識別和語音以及自然語言理解相結合,帶來更好的人機交互新體驗。
隨著智能汽車對人工智能的功能和需求不斷提高,場景不斷豐富,也就對通用人工智能提出了要求。 不同于以往的單一智能,單個AI模型輸入的數據類型是單一的,只能完成單一任務、適應單一場景,利用通用人工智能技術,一個模型能夠輸入語音、圖像、文字,還有激光雷達的3D點云等多種類型的數據,并完成各種各樣的任務。
通用模型的出現,能夠幫助我們實現不同行業之間的融合,實現產品和場景應用的創新。
商湯致力于打造的人工智能基礎設施SenseCore AI大裝置,同時支撐四個領域的眾多行業,包括智慧商業、智慧城市、智慧生活和智能汽車。在這些領域中,結合數據和大量行業反饋,又能夠助推我們打造通用智能的研發平臺和模型。
當AI大裝置不斷迭代,探索下一代研發體系時,就能夠同時推動各行業研發體系的升級和飛躍,這將成為推動社會生產力發展非常有效的迭代方式。
基于AI大裝置,商湯以“一橫一縱”的方式打造了智能汽車的創新底座,推出了智能汽車解決方案的獨立品牌——SenseAuto商湯絕影智能汽車平臺。
“一縱”是指能夠提供智能駕駛和智能車艙的全棧解決方案,“一橫”是指將基礎的軟硬件設施提供給車廠和合作伙伴,賦能不同的主機廠。商湯也建立起路云感知平臺,將車載數據、路端感知數據和其他行業的數據匯集起來,不斷拓展智能汽車的應用場景。
商湯絕影的戰略定位有三個: 第一,幫助商湯的生態合作伙伴和客戶深度挖掘汽車感知數據的價值。 第二,連接智能汽車和商湯智慧產業生態,實現服務輸出。
第三,實現商湯與汽車產業和生態的共生共贏。 從2016年開始商湯進入智能汽車行業,截至今年上半年已有30+車企客戶、50+個合作伙伴,覆蓋50+種車型,在未來數年內將向2000多萬輛汽車提供絕影產品。
新一代通用視覺技術體系“書生” 不久前,我們聯合上海人工智能實驗室、香港中文大學、上海交通大學,共同發布新一代通用視覺技術體系“書生”(INTERN)。 書生訓練一個通用視覺模型分幾個階段:首先匯集行業中的數據,共同打造一個通用的“通才模型”,不單會寫文章,還琴棋書畫樣樣精通,實現更強的適應性。
在此基礎上,結合各個專業領域,各個場景中少量的數據,打造某個專業的“專才模型”,如針對智慧城市、自動駕駛、文化旅游等不同領域的專才模型。經過這幾個階段,可以讓模型的通用性變得非常強。 我們也和世界上最頂級的研究成果進行了對比,相較于OpenAI的CLIP,“書生”在只有10%的數據的情況下,就能實現超過CLIP基于完整下游數據的準確度。
在商湯兩個階段的模型生產方法中,首先是訓練世界目前最大的300億參數的視覺模型。基于這一超大模型,可以衍生出超過2萬多個商用模型。
這一過程需要非常強的算力支持。我們在臨港新建的商湯智算中心AIDC,擁有每秒3.74百億億次浮點運算的總算力、全套的自動數據標注、隱私保護和數據安全能力,同時還能夠形成數據閉環。并可選擇需要哪些數據進行回流,回流之后進行自動標注和模型更新。所有這些都基于AIDC和超大模型。 商湯也把智能汽車和多個行業緊密地結合在一起。舉一些例子: 在今年世界人工智能大會上,商湯發布世界上第一款自動駕駛AR小巴。
我們將上海的一個城區進行了三維數字化,借助車載大屏和車外視覺感知設備,就可以形成虛擬世界和物理世界的融合。乘客坐在車里可以體驗到城市的發展、經濟文化的創新,就像坐在穿梭的博物館中。
此外,數字人已經應用于各行各業,商湯也把它引入到了智能車艙中,根據消費者的喜好,實現千人千面。 商湯還把智慧健康引入到車艙當中,讓乘員在車艙中即可檢測心率、呼吸頻率、血壓等情況,通過視覺手段,給消費者帶來關愛和長期關懷。
人工智能正在快速從單一智能向通用智能發展。商湯也致力于打造人工智能基礎設施,促進產業融合,不斷拓展智能汽車的應用邊界和場景,與合作伙伴一起迎接智能汽車的新未來。
相關閱讀,戳這里
《車艙里就能健康檢測,商湯絕影:謝邀!》 《商湯絕影智能汽車平臺將賦能一汽南京,加速新一代智能汽車量產》
原文標題:商湯科技聯合創始人王曉剛教授:通用智能拓展智能汽車邊界
文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
智能手機
+關注
關注
66文章
18499瀏覽量
180408 -
人工智能
+關注
關注
1792文章
47380瀏覽量
238887 -
智能汽車
+關注
關注
30文章
2864瀏覽量
107355
原文標題:商湯科技聯合創始人王曉剛教授:通用智能拓展智能汽車邊界
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論