色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊宣布其人工智能球隊獲首屆谷歌足球Kaggle競賽冠軍

lhl545545 ? 來源:21世紀(jì)經(jīng)濟報道 ? 作者:21世紀(jì)經(jīng)濟報道 ? 2020-12-30 15:58 ? 次閱讀

12月30日,騰訊宣布其人工智能球隊摘得了首屆谷歌足球Kaggle競賽冠軍。這是一場由Google Research與英超曼城俱樂部在Kaggle平臺上聯(lián)合舉辦的足球AI比賽,經(jīng)過多輪角逐,騰訊AI Lab研發(fā)的絕悟WeKick版本以1785.8的總分成為冠軍球隊。

創(chuàng)立于2010年的Kaggle是全球最大的數(shù)據(jù)科學(xué)社區(qū)和數(shù)據(jù)科學(xué)競賽平臺,今年,也是Kaggle首次針對足球AI領(lǐng)域發(fā)布賽題。

比賽使用Google Research Football強化Learning環(huán)境,基于開源足球游戲Gameplay Football開發(fā),采取11vs11的賽制,參賽團隊需要控制其中1個智能體與10個內(nèi)置智能體組成球隊。

WeKick的比賽場景該賽事發(fā)布后,吸引了來自世界頂級院校和研究機構(gòu)的1100多支隊伍參加,而騰訊此次派出的隊伍其實是11月底剛剛升級為完全體的“絕悟”,當(dāng)時,騰訊“絕悟”首次精通了王者榮耀所有英雄的所有技能,此次參加足球賽,就是在其基礎(chǔ)上進行了一些針對足球的調(diào)整。

AI如何踢足球?

Google Football(on Kaggle)以流行的足球游戲為模型,就像是一款由AI操作的FIFA游戲,智能體控制足球隊中的一個或所有足球運動員,學(xué)習(xí)如何在他們之間傳球,并設(shè)法克服對手的防守以進球。其競賽規(guī)則與普通足球比賽類似,比如目標(biāo)都是將球踢入對方球門以及越位、黃牌和紅牌規(guī)則。

不同于常見足球視頻游戲的統(tǒng)一調(diào)控式NPC球隊,在本次Kaggle競賽中,每個球員都各由一個單獨的智能體控制,而參賽的AI模型則根據(jù)比賽情況控制其中一個智能體,與其他10個內(nèi)置智能體配合。這要求每個球員不僅需要觀察對手的行為,還需要留意己方隊員的情況,背后需要非常復(fù)雜的團隊協(xié)作和競爭策略作為支撐。

比如,當(dāng)對方球員控球時,己方智能體不僅要根據(jù)球場上雙方球員的分布位置預(yù)測控球球員的下一步動作,還需要與己方其他球員協(xié)同如何合規(guī)地奪取足球的控制權(quán)。且由于球場動態(tài)瞬息萬變,因此高速的實時決策能力也是必需的。

此外,從零開始完全采用強化學(xué)習(xí)方法來訓(xùn)練完整的足球AI實際上也相當(dāng)困難。與MOBA游戲中不斷有經(jīng)濟、血量、經(jīng)驗等實時學(xué)習(xí)信號不同,足球的游戲激勵非常稀疏,基本只能依靠進球,而稀疏激勵一直是目前強化Learning一大難題。

“絕悟”的冠軍之路

據(jù)騰訊方面介紹,絕悟WeKick版本首先采用了強化學(xué)習(xí)和自博弈(Self-Play)來從零開始訓(xùn)練模型,并部署了一種異步的分布式強化學(xué)習(xí)框架。雖然該異步架構(gòu)犧牲了訓(xùn)練階段的部分實時性能,但靈活性卻得到顯著提升,而且還支持在訓(xùn)練過程中按需調(diào)整計算資源,使其能適應(yīng) 11 智能體足球游戲訓(xùn)練環(huán)境。

由于MOBA游戲和足球游戲任務(wù)目標(biāo)的差異,絕悟WeKick版本還采用了生成對抗模擬學(xué)習(xí)(GAIL)與人工設(shè)計的獎勵結(jié)合,在特征與獎勵設(shè)計上進行了擴展和創(chuàng)新。

該方案利用了生成對抗訓(xùn)練機制來擬合專家行為的狀態(tài)和動作分布,使得絕悟WeKick版本可以從其它球隊學(xué)習(xí)。然后,再將 GAIL 訓(xùn)練的模型作為固定對手進行進一步自博弈訓(xùn)練,進一步提升策略的穩(wěn)健性。

但這種通過自博弈強化學(xué)習(xí)得到的模型有一個天然的缺點:很容易收斂到單一風(fēng)格。在實際比賽的時候單一風(fēng)格的模型很容易發(fā)生由于沒見過某種打法而表現(xiàn)失常,最終導(dǎo)致成績不佳的情況。因此,為了提升策略的多樣性和穩(wěn)健性,絕悟還采用了針對多智能體學(xué)習(xí)任務(wù)的League(若干策略池)多風(fēng)格強化學(xué)習(xí)訓(xùn)練方案。

這種League多風(fēng)格強化學(xué)習(xí)訓(xùn)練方案的主要流程可簡單總結(jié)為先專精后綜合。

首先訓(xùn)練一個具備一定程度競技能力的基礎(chǔ)模型,比如運球過人、傳球配合、射門得分;

接著基于基礎(chǔ)模型訓(xùn)練出多個風(fēng)格化模型,每個模型專注一種風(fēng)格打法,在風(fēng)格化模型訓(xùn)練的過程中會定期加入主模型作為對手,避免過度堅持風(fēng)格,丟失基本能力;

最后基于多個基礎(chǔ)模型訓(xùn)練一個主模型,主模型除了以自己的歷史模型為對手以外,還會定期加入所有風(fēng)格化對手的最新模型作為對手,確保主模型能夠適應(yīng)風(fēng)格完全不同的對手。

最終,基于絕悟完全體的架構(gòu)遷移,定制化的框架改進,加上關(guān)鍵性的生成對抗模擬學(xué)習(xí)(GAIL)方案和 League (若干策略池)多風(fēng)格強化學(xué)習(xí)訓(xùn)練方案,使得絕悟?qū)崿F(xiàn)了優(yōu)于其它競爭AI球隊的優(yōu)勢,成就了冠軍之路。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6161

    瀏覽量

    105304
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238265
  • 騰訊
    +關(guān)注

    關(guān)注

    7

    文章

    1652

    瀏覽量

    49423
收藏 人收藏

    評論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進行定制化設(shè)計。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    冠軍說|第二屆OpenHarmony競賽訓(xùn)練營冠軍團隊專訪

    實現(xiàn)技術(shù)創(chuàng)新,解決現(xiàn)實問題的呢? 高校創(chuàng)新技術(shù)人才又將如何助力OpenHarmony技術(shù)生態(tài)的繁榮與活力? 點擊下方視頻一起聽冠軍說 探秘冠軍團隊與老師的獨家幕后分享 OpenHarmony 競賽
    發(fā)表于 10-28 17:11

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    Meta人工智能聊天機器人進軍新市場,挑戰(zhàn)ChatGPT

    Meta近日宣布,其人工智能聊天機器人將進軍21個新市場,與OpenAI的ChatGPT展開激烈競爭。
    的頭像 發(fā)表于 10-11 16:29 ?299次閱讀

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學(xué)家做了什么? 人工智能將如何改變我們所生
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國聯(lián)通、云天勵飛、考拉悠然、智航、力維智聯(lián)等國內(nèi)人工智能企業(yè)的深度參與和大力支持。 報名后即可到現(xiàn)場領(lǐng)取禮品,總計5000份,先到先選! 點擊報名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    德國人工智能:世界領(lǐng)先,未來可期

    在當(dāng)今日新月異的科技浪潮中,人工智能(AI)無疑已成為全球科技競賽的焦點。而在這場競賽中,德國憑借其深厚的技術(shù)底蘊和前瞻性的戰(zhàn)略布局,逐漸嶄露頭角,成為了人工智能領(lǐng)域的全球領(lǐng)導(dǎo)者。世界
    的頭像 發(fā)表于 06-12 15:25 ?697次閱讀

    體育與TDK:使足球運動越來越狂熱的VAR系統(tǒng)和傳感器技術(shù)

    足球是一項受歡迎的運動,在世界范圍內(nèi)擁有著非常多的運動員和觀眾。由FIFA (國際足球聯(lián)合會) 主辦的世界杯每4年舉辦一次,是全球32支球隊 (2026年48支球隊) 聚集在一起,角逐
    的頭像 發(fā)表于 03-27 14:19 ?792次閱讀
    體育與TDK:使<b class='flag-5'>足球</b>運動越來越狂熱的VAR系統(tǒng)和傳感器技術(shù)

    谷歌宣布在醫(yī)療保健領(lǐng)域推出人工智能計劃

    谷歌最近公布了一系列激動人心的計劃,將先進的人工智能模型引入醫(yī)療保健領(lǐng)域。據(jù)谷歌透露,其研究團隊正聯(lián)手旗下Fitbit公司,共同研發(fā)一項創(chuàng)新的人工智能功能。這一功能能夠從用戶的腕帶設(shè)備
    的頭像 發(fā)表于 03-21 10:54 ?638次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國內(nèi)外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式AI開發(fā)
    發(fā)表于 02-26 10:17

    消息稱Reddit與谷歌達成協(xié)議

    近日,知名社交媒體平臺Reddit宣布與全球科技巨頭谷歌達成一項價值約6000萬美元的合作協(xié)議。根據(jù)協(xié)議內(nèi)容,谷歌將獲得使用Reddit上發(fā)表的帖子來訓(xùn)練其人工智能模型的權(quán)限,旨在改進
    的頭像 發(fā)表于 02-23 11:12 ?724次閱讀

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(AI)模型之
    的頭像 發(fā)表于 02-04 15:10 ?1195次閱讀
    主站蜘蛛池模板: 国产精品色吧国产精品| 国产精品高清免费网站| 国产白丝精品爽爽久久蜜臀| 国产亚洲精品香蕉视频播放| 考好老师让你做一次H| 日本学生VIDEOVIDEOS更新| 亚洲精品久久午夜麻豆| 99RE8国产这里只有精品| 动漫女主被扒开双腿羞辱| 好硬好湿好爽再深一点视频| 久久久久国产精品美女毛片| 欧美雌雄双性人交xxxx| 四虎国产精品永久免费入口 | 羞羞影院午夜男女爽爽影院网站| 在线 国产 欧美 亚洲 天堂 | 性欧美13处14处破| 99久久精品国产高清一区二区| 国产乱人视频在线观看| 男男h开荤粗肉h文1v1| 亚洲黄网站wwwwww| 999zyz色资源站在线观看| 国产精品AV无码免费播放| 男人桶女人j的视频在线观看| 亚洲va久久久久| 97成人碰碰在线人妻少妇| 国产精品嫩草影院一区二区三区| 妈妈的朋友6未删减版完整在线| 色欲人妻无码AV精品一区二区| 一本色道久久综合亚洲AV蜜桃| 拔擦拔擦8X永久华人免费播放器| 国产午夜精品理论片免费观看 | 久久久久国产精品美女毛片| 日本日本熟妇中文在线视频| 樱桃BT在线观看| 国产人妻人伦精品久久久| 秋霞午夜一级理论片久久| 在线观看黄色小说| 好男人的视频在线观看| 涩涩视频下载| 把英语老师强奷到舒服动态图 | 国产视频精品免费|