色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NeurIPS首屆多智能體競賽,中國團隊展現世界實力

DPVg_AI_era ? 來源:lq ? 2018-12-25 09:58 ? 次閱讀

同隊炸彈人聯手,在對手的兩側放炸彈圍堵,將其困在中間地帶后摧毀對手

由谷歌大腦、Facebook、牛津大學和NYU等聯合舉辦的NeurIPS首屆多智能體競賽中,中國團隊取得Learning組冠軍。基于啟元智能決策平臺訓練的獲勝智能體,訓練過程沒有人工干預,體現了自動調參體系的有效性和魯棒性,以及強化學習技術的價值。

近日,國際人工智能頂級大會NeurIPS2018順利落幕。8000多位來自全世界的人工智能研究人員齊聚加拿大蒙特利爾,討論分享過去一年全世界在人工智能的各個領域的最新進展。

該會議舉辦了一系列競賽來鼓勵學術界和工業界一起解決最有挑戰性的人工智能難題。作為人工智能領域歷史最悠久的學術會議之一,會議成果被視作人工智能領域的研究“風向標”。

NeurIPS首屆多智能體競賽,中國團隊展現世界實力

其中,由谷歌大腦、Facebook、牛津大學及在游戲AI界久負盛名的紐約大學等機構聯合舉辦多智能體競賽——炸彈人團隊賽(The NeurIPS 2018 Pommerman Competition)尤其引人矚目。

多智能體競賽-炸彈人團隊賽

來自中國啟元世界的彭鵬博士、中科院計算所助理研究員龐亮博士和北師大的袁鈺峰組成的賽隊,與美國、歐洲、日本、中國的24支一流隊伍進行了激烈角逐。

最終,基于啟元決策智能平臺訓練的Navocado雙智能體能力穩定提升,奪得了Learning組冠軍,展現了來自中國的決策智能團隊具備的世界級技術實力。

啟元世界是一家2017年成立的以認知決策智能技術為核心的公司,由前阿里、Netflix、IBM的科學家和高管發起,并擁有伯克利、CMU等知名機構的特聘顧問。團隊核心能力以深度學習、強化學習、超大規模并行計算為基礎,擁有互聯網、游戲等眾多領域的成功經驗。

炸彈人游戲:考驗多智能體協作、非完全信息博弈、持續學習等關鍵技能

決策智能目前是一個世界級的技術難題,決策過程也是人腦中最復雜的一種功能。

由于在游戲、交通、電力等領域具備極大的應用前景,決策智能近年也成為全球人工智能研究的熱點,DeepMind、Facebook、OpenAI、微軟、亞馬遜科技巨頭都成立了實驗室進行相關研究。

相較于單智能體,多智能體博弈的難度更是指數級增加。此次NeurIPS多智能體競賽是NeurIPS會議上首次開設多智能體競賽,將多智能體協作、非完全信息博弈,以及持續學習等關鍵問題濃縮到《炸彈人》這款游戲中,鼓勵全世界優秀的研發人員一起參加解決技術挑戰。

競賽采用激烈雙淘汰機制 (Double Elimination),25支參賽隊分別提供2個智能體參加2v2對抗賽。參賽隊伍的每個智能體初始都被困在一個封閉的區間中,智能體只有炸開附近的木箱才能進去其他區域。在幾乎所有障礙物都被清理干凈后,智能體進入到對抗階段,所有智能體都可以自由地在全局活動,這個階段智能體的主要目標就是炸掉對手。

炸彈人學會準確炸箱子,并且通過最短路徑尋路吃增強藥

競賽過程中智能體需要完成的任務包括:

1)清除障礙物,

2)躲避自己的炸彈火焰(智能體處于封閉區域),

3)收集裝備,

4)躲避自己和其他人的炸彈火焰(智能體相互對抗階段),

5)放炸彈殺死對手,

6)避免放炸彈殺死隊友。

整個過程,對智能體有效甄別和提取有效信息,同時對未知信息進行推理和假設,以及多智能體協作都提出了很高的技術要求。

炸彈人主動將炸彈朝對手方向踢出,精確擊潰對手

每個賽隊線下有2個月的時間進行模型訓練。最終,基于啟元決策智能平臺訓練的Navocado戰勝了來自加拿大的Skynet,拿下Learning組冠軍。Skynet的團隊來自加拿大近百人規模的科技公司Borealis.ai。

獲勝關鍵:分階段自適應調參與獎勵塑性

從對戰過程來看,啟元的Navocado智能體的主動進攻能力明顯強于對手。

從Skynet在官網公開的實現方案來看,Skynet模型在決策過程中加入了很多人工干預(比如限制炸彈人不能往火焰里走),這和Navocado模型在整個訓練和決策過程中不加人工干預、自主學會各項技能的方式也有較大的差距。

NeurIPS多智能體競賽終局:第600步(視頻中最下欄顯示),Navocado控制的一個炸彈人(黑色臉譜)在最正確的時機使用踢炸彈的方式將Skynet的一個炸彈人(白色臉譜)炸死。來源:啟元世界

視頻中展示的是Navocado和Skynet爭奪學習組冠軍的最后一戰。其中,兩個黑色臉譜的炸彈人屬于Navocado,而兩個白色臉譜的炸彈人屬于Skynet。

從視頻中可以看到,Navocado能夠在不產生多余步數的情況下,準確地炸開木箱和收集裝備,而Skynet在這兩方面就做不太好。這也是這局比賽后期Navocado能夠占據主導的原因。

在第600步(視頻中最下欄顯示),Navocado控制的一個炸彈人在最正確的時機使用踢炸彈,將Skynet的一個炸彈人炸死。在視頻最后,Navocado控制的另一個炸彈人,同樣通過踢炸彈的方式終結對手。

Navocado的內核模型是A2C,但是其最大的亮點在分階段自適應調參和獎勵塑型的過程。由于問題的復雜性,普通的訓練方式很難滿足Navocado長期成長的需求。

Navocado團隊介紹,他們的設計主要基于元學習的思想,將超參搜索 (Hyperparameter Search) 的過程由人工調參轉變為自動調參。這一技術在AlphaGo的調優過程和Google的AutoML系統中都明顯的體現。

傳統的超參搜索主要有兩種模式:并行搜索和序列化搜索。其中,并行化搜索對計算量要求高,而且效率并不出眾;而序列化搜索則更是需要大量的人工干預,優化效果并不穩定。

但是,在Navocado的訓練過程中,團隊通過基于群體競技的方式找出最優的超參,從提高算力使用效率和減少人工干預的角度。

Navocado智能體持續訓練過程中的效果提升曲線

technical report的鏈接: https://arxiv.org/abs/1812.07297

啟元智能決策平臺,體現強化學習技術價值

強化學習作為決策智能的核心技術,也是極具挑戰的一種機器學習方法。由于強化學習涉及到的鏈路很長,而強化學習算法本身對超參十分敏感,學術界中各人不同的實現或配置,都很容易導致出現訓練結果不可復現的現象。強化學習技術在可復現性、可復用性和魯棒性方面存在著挑戰。

啟元從2017年起打造的決策智能平臺,在這次賽事奪冠的智能體訓練中起到了關鍵作用。啟元決策智能平臺搭建了支持多智能體博弈的基礎架構,能夠通過競技的方式實現多智能體持續學習的能力。平臺還支持包括自動化資源調度和自動調參的元學習,使得模型訓練更加高效。

啟元世界彭鵬博士介紹,“啟元團隊對強化學習這個領域都很有Passion。這次我們在NeurIPS多智能體競賽奪冠的智能體,在每個階段的訓練過程沒有人工干預,學習曲線非常漂亮,進一步驗證了這套體系的有效性和魯棒性,驗證了強化學習技術的價值?!?/p>

在使用啟元決策智能平臺的過程中,賽隊可以快速地調度所需資源進行任務部署,配置對戰所需的智能體,并且在訓練過程實時觀察不同模型的對戰情況和勝率曲線,從而做出最快的調整。

圖3:啟元決策智能平臺架構

在此次NeurIPS多智能體競賽中,啟元決策智能平臺提供了三大助力:

第一,支持智能體持續學習的能力。

持續學習的能力是智能體訓練中關鍵的一環。在訓練階段,炸彈人競賽中的智能體需要在學習新技能的過程中保留過去學會的技能,才能達到很高的水平。啟元決策智能平臺通過智能體群體匹配競技的方式實現“自然選擇”,從而達到持續學習的效果。在競技過程中,強者留存,弱者被淘汰。在弱者被淘汰之后,空出來的位置被強者的克隆體代替,而強者的克隆體則根據新的超參設定持續進化。在固定計算資源預算的情況下,啟元決策智能平臺通過這套機制在探索新強者 (exploration) 和深挖舊強者 (exploitation) 之間平衡對計算資源的使用情況。

第二,支持復雜場景的多智能體聯合訓練。

在多智能體博弈問題中,不同智能體之間的相互克制較為常見,其收斂可能性極為復雜。在炸彈人競賽中,不同隊伍的智能體風格迥異,有的善攻,有的善守?;凇蚌T魚效應”的思想(指透過引入強者,激發弱者變強的效應),啟元決策智能平臺在訓練初期引入基于規則的高階對手,激發初期較弱的智能體在與強者的對決中學會各種基本技能,迅速提升變強;隨著訓練階段的深入,啟元決策智能平臺同時訓練多個智能體,使其在激烈的相互對抗中完善自我。

第三,支持基于私有云集群的大規模、高并發的模擬和大規模訓練。

啟元決策智能平臺將架構圖中所示的多個模塊進行組件化,并封裝到了容器中。通過云端自動化的方式管理數百CPU以及GPU資源并實現容器編排,降低了調度數十個炸彈人訓練任務的成本。大規模、高并發的模擬計算以及大規模的訓練同時在私有云集群中進行。另外,啟元決策智能平臺提供分布式存儲方案,并配置成共享模型池,為炸彈人智能體模型群體的持久化和共享提供支持。

啟元決策智能平臺v0.8版本目前已用于游戲、網絡智能及仿真等場景中。基于為客戶提供的高附加值服務,啟元世界在2018年商業化上小試牛刀,即已取得不錯的營收。

2019年,啟元世界計劃發布第一版啟元決策智能平臺型產品,為更多行業客戶、終端用戶帶去高體驗的服務。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47354

    瀏覽量

    238811
  • 智能體
    +關注

    關注

    1

    文章

    152

    瀏覽量

    10590
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121246

原文標題:NeurIPS首屆多智能體競賽,中國團隊獲Learning組冠軍

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    比亞迪亮相《中國創新科技盛典》

    近日,比亞迪亮相中央廣播電視總臺首屆中國創新科技盛典》(以下簡稱 央視“科晚”),向全球展現中國汽車科技的磅礴力量。
    的頭像 發表于 12-30 13:58 ?188次閱讀

    中國氣象局推出“中國天氣小助手”智能

    近日,中國氣象局華風氣象傳媒集團攜手支付寶,正式推出了首個國家級天氣智能——“中國天氣小助手”。這一創新服務由中國氣象局提供權威的氣象數據
    的頭像 發表于 12-02 18:06 ?547次閱讀

    螞蟻數科與浙大團隊榮獲NeurIPS競賽冠軍

    近日,在機器學習領域的頂級國際會議NeurIPS的特設競賽中,螞蟻數科旗下的摩斯聯合浙江大學計算機體系結構實驗室陳文智、魏成坤團隊組成的“Morse ARCLab”參賽隊伍憑借出色的表現,成功在激烈的競爭中脫穎而出,為
    的頭像 發表于 11-26 10:27 ?238次閱讀

    【書籍評測活動NO.51】具身智能機器人系統 | 了解AI的下一個浪潮!

    ,EAI)是一個集多學科技術與理論于一的研究領域,旨在探討智能如何在智能與其環境的互動中展現。 與傳統的人工
    發表于 11-11 10:20

    冠軍說|第二屆OpenHarmony競賽訓練營冠軍團隊專訪

    在剛剛結束的第三屆OpenHarmony技術大會上 今年的OpenHarmony競賽訓練營獲獎團隊 舉行了星光熠熠的頒獎儀式 10月11日,經過激烈的現場決賽角逐共有10個賽隊脫穎而出 其中來自
    發表于 10-28 17:11

    AMD贊助支FIRST機器人競賽團隊

    AMD 在 2024 賽季贊助了支 FIRST 機器人競賽團隊。FIRST 機器人競賽旨在教導高中生如何構建能夠執行特定任務的機器人,同時也讓他們有機會學習重要的商業和時間管理技能、
    的頭像 發表于 09-18 09:45 ?460次閱讀

    比亞迪彰顯中國制造的硬核實力

    以“中國品牌,世界共享;國貨潮牌,品筑未來”為主題的2024年中國品牌日活動在上海拉開帷幕,本次活動采用線上線下相結合模式舉辦,其中線下活動地點在上海世博展覽館,比亞迪攜旗下三款新能源車型及核心新能源產品隆重亮相,全方位展示比亞
    的頭像 發表于 09-13 10:53 ?514次閱讀

    中國科技企業競相加碼人工智能領域投資,引領未來科技浪潮

    在當今全球科技浪潮中,人工智能(AI)作為引領未來發展的重要引擎,正以前所未有的速度推動著各行各業的創新與變革。中國,作為世界第二大經濟和科技創新的重要力量,其科技巨頭們在這場AI
    的頭像 發表于 08-27 16:48 ?508次閱讀

    TE Connectivity AI Cup 第五屆全球競賽結果揭曉 中國高校團隊連續兩年奪得桂冠

    中國上海 - 2024 年 7 月 31 日 - 近日,由全球行業技術領先企業TE Connectivity(以下簡稱“TE”)主辦的TE AI Cup第五屆全球競賽圓滿收官。來自華南農業大學
    發表于 08-01 14:39 ?1994次閱讀
    TE Connectivity AI Cup 第五屆全球<b class='flag-5'>競賽</b>結果揭曉 <b class='flag-5'>中國</b>高校<b class='flag-5'>團隊</b>連續兩年奪得桂冠

    飛貓榮膺世界物聯網500強:引領行業創新,展現中國實力

    此次獲獎是公司成長歷程中的重要里程碑,也是中國物聯網行業整體實力提升的體現。隨著更多中國企業的加入,中國有望成為全球物聯網領域的重要領導者,引領行業創新與發展新趨勢。
    的頭像 發表于 08-01 14:18 ?543次閱讀
    飛貓榮膺<b class='flag-5'>世界</b>物聯網500強:引領行業創新,<b class='flag-5'>展現</b><b class='flag-5'>中國</b><b class='flag-5'>實力</b>

    偉創力蘇州斬獲客戶施耐德電氣最佳實踐競賽雙金獎

    在日前結束的施耐德電氣首屆PCBA制造最佳實踐競賽中,偉創力蘇州團隊以優異的表現,一舉奪得“工廠金獎”及“最佳生產效率提升單項金獎”。憑借對卓越制造的不懈追求,蘇州團隊目標堅定,雷厲風
    的頭像 發表于 07-24 17:39 ?711次閱讀

    慕尼黑電子展回顧:啟明智顯模態硬件智能引領科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺智能兩家子公司,共同為全球觀眾呈現了一場科技盛宴。本次展會,啟明智顯憑借其創新的模態硬件智能及一系列前沿產品,贏得了廣泛關注與好
    的頭像 發表于 07-10 16:17 ?386次閱讀
    慕尼黑電子展回顧:啟明智顯<b class='flag-5'>多</b>模態硬件<b class='flag-5'>智能</b><b class='flag-5'>體</b>引領科技潮流

    螞蟻集團發布首個開源金融場景智能框架

    在第七屆數字中國建設峰會上,螞蟻集團宣布了一項引人注目的舉措:正式開源其智能框架agentUniverse。這一框架不僅是金融領域的首個開源
    的頭像 發表于 05-28 09:25 ?722次閱讀

    蘇州固锝亮相2024德國漢諾威工業博覽會,展現中國功率半導體實力!

    蘇州固锝亮相2024德國漢諾威工業博覽會,展現中國功率半導體實力!
    的頭像 發表于 04-08 16:25 ?496次閱讀
    蘇州固锝亮相2024德國漢諾威工業博覽會,<b class='flag-5'>展現</b><b class='flag-5'>中國</b>功率半導體<b class='flag-5'>實力</b>!

    深維科技-北京大學合作團隊在FPGA&apos;24布線加速競賽中奪得佳績!

    美國西部時間2024年3月4日,我司與北大合作團隊在FPGA'24布線加速競賽中獲得優異的成績。
    的頭像 發表于 03-07 11:43 ?1186次閱讀
    深維科技-北京大學合作<b class='flag-5'>團隊</b>在FPGA&apos;24布線加速<b class='flag-5'>競賽</b>中奪得佳績!
    主站蜘蛛池模板: 人妻熟妇乱又伦精品视频中文字幕| xxxxx中国明星18| 久久久久久久尹人综合网亚洲| 99在线观看视频| 亚洲精品久久国产高清| 日本久久精品视频| 伦理片92伦理午夜| 国产在线精品视频二区| WWW国产精品内射老师| 永久免费在线视频| 无修肉动漫在线观看影片| 欧美成a人片免费看久久| 黃色带三级a级| 国产精品久久久久久久人人看| www.伊人| 9797在线看片亚洲精品| 亚洲伊人久久网| 亚州精品视频| 少女亚洲free| 日本黄 色大片全| 欧美日韩1区| 免费看国产精品麻豆| 久久久无码精品无码国产人妻丝瓜| 国产又黄又粗又爽又色的视频软件| 第九色区av天堂| yellow片高清视频免费看| 久久草这在线观看免费| 国产成人在线视频| 草莓AV福利网站导航| 60老妇性xxxxhd| 在线观看亚洲免费人成网址 | 国产欧美精品一区二区色综合 | 中文字幕亚洲男人的天堂网络| 亚洲精品第二页| 同居了嫂子在线观看| 精品日产1区2卡三卡麻豆| 国产精品免费视频播放| 国产成人亚洲综合无| 打扑克床上视频不用下载免费观看 | 久久看片网| 久久人妻AV一区二区软件|