色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

你們不是嫌棄世界冠軍OG團隊實力太水嗎?“你行你上”的機會來了

電子工程師 ? 來源:lp ? 2019-04-22 13:43 ? 次閱讀

你們不是嫌棄世界冠軍 OG 團隊實力太水嗎?“你行你上”的機會來了。

4 月 14 日凌晨,OpenAI Five 以 2:0 擊敗了 DOTA 世界冠軍團隊 OG 引發熱議。比賽當天,OpenAI 也宣布要開放 OpenAI Five 競技場模式,讓每個感興趣的人都參與其中。

4 月 18 日(太平洋標準時間)下午 6 點,OpenAI 如約開放了這一模式,全世界各路玩家都可以免費進行體驗。開放時間為期三天,4 月 21 日(太平洋標準時間)晚上 11 點 59 分關閉,要體驗一把人機對戰的話可得抓緊時間。

參賽鏈接:https://arena.openai.com/#/

目前從其官網賽況來看,截止今天早上 10 點,OpenAI Five 與參與者打了 424 場比賽,AI 以 112-0 完勝人類玩家。

以下是人類參與者的部分賽況:

據 OpenAI 官方介紹,參與者可以在競爭模式和合作模式下體驗 OpenAI Five。他們的 1v1 機器人可以通過巧妙的策略加以利用,但他們也并不知道 OpenAI Five 能在多大程度上可以做到這一點。

在此前決賽中,他們展示了 OpenAI Five 和人類在合作模式打游戲。一組是 Sheever、Blitz 和三個 OpenAI Five,對手是由 Capitalist、ODPixel 和三個 OpenAI Five 組成的團隊。

不過,通過 OpenAI Five 在決賽上的表現,OpenAI 團隊在最新的博客中分享了兩個驚喜:

盡管訓練 OpenAI Five 系統的目的是為了打敗其他機器人,但他們卻發現 OpenAI Five 其實還有與人類成為隊友的基本能力,也就是說可以將一個競爭型 AI 變為合作型 AI。他們認為,如果能更努力去開發,未來 AI 系統能為人類做出非常多的貢獻。

4 月 18 日 到 21 日的競技場模式測試將回答一個很重要的研究問題——OpenAI Five 的潛能可以被人類運用到何種程度,或者它們在其他哪些方面必定會被打敗。OpenAI Five 這一深度強化學習智能體系統,可能會成為有史以來人類能與之交互的最大的 AI 部署系統。

OG戰隊與OpenAI開發團隊

對于 OpenAI Five 競技場模式,有很多人報以期待,reddit 上有網友評論稱,“這特么太酷了,自從 OpenAI 1v1 首秀之后,人們已經要求要在網上跟機器人玩游戲了,現在它真的發生了!”

只是,如果在競爭模式跟 AI 打 DOTA,作為人類玩家的你會不會慘遭OpenAI Five 的虐殺,而輸得毫無懸念呢?祝你們好運。

當然,玩游戲之余,你可能也想知道:OpenAI Five 取得勝利背后的“秘訣”是什么?為什么這次的 OpenAI Five 系統要比去年在 TI 表演賽上敗給人類的AI系統更強?OpenAI 是如何訓練 OpenAI Five 系統的?OpenAI 團隊最近給出了解讀。

為什么是 DOTA2?

一開始,OpenAI 團隊研究 OpenAI Five 是為了解決超出現有深度強化學習算法能力范圍的問題,他們希望通過現有的方法解決當下無法解決的問題,原以為這需要復雜的算法思想(比如分層強化學習(Hierarchical RL)),但他們驚訝地發現只需要改進的是規模,但實現和利用這個規模并不容易,這成了其研究的主要內容。

OpenAI Five 把世界看作是一串必須破譯的數字。無論這些數字是以 DOTA 游戲形式(約 20000 個數字),還是以機械手形式(約 200 個),使用的都是通用學習代碼。

為了創建 OpenAI Five,OpenAI 團隊創造了一個名為 Rapid 的系統,用來以從未有過的規模去運行 PPO(Proximal Policy Optimization),結果出人意料,居然創造了一個不受任何基本性能限制的世界級 DOTA 機器人。

如今,RL 算法表現出了驚人的能力,但它在游戲或模擬環境之外卻用處不大,但這個限制可能并沒有聽起來的那么糟糕,例如可以使用 Rapid 來控制機械手來重新移動一個模塊,這需要首先進行模擬訓練,然后在物理機器人上執行。他們認為,對于 RL 的下一個挑戰是減少對經驗的依賴。

雖然他們決定不再讓 OpenAI Five 成為競爭對手,但社會進步和技術發展將繼續推動未來的研究,這也并非 DOTA 比賽研究的終點,他們認為 DOTA 比賽對 RL 開發來說是一個比現在使用的標準環境更有趣、更復雜、也更好理解的環境。

算力

與 DOTA2 在去年的 TI 表演賽的失利相比,OpenAI Five 在 4 月 14 日戰勝 OG 團隊的主要原因是其訓練的計算量增加了 8 倍。去年比賽后,OpenAI 團隊將項目中的絕大部分計算用于訓練 OpenAI Five 模型,同時還增加了訓練時間。

OpenAI Five 的 TrueSkill,由于已經使用了額外的訓練計算,所以用線來劃分主要的系統變化。這張圖的走向大致是線性的,意味著 OpenAI Five 不斷從額外計算中獲益。

總之 ,OpenAI Five 的當前版本已經訓練了 800 petaflop/s /天,并且在10個實時月的時間內進行相當于人類大約 45000 年時長的 DOTA 游戲自我訓練,相當于人類每天平均有 250 年的模擬訓練。OpenAI Five 的最終版本與 TI 版本相比,勝率是 99.9%。

18 個英雄

從訓練 5 名英雄到 18 名英雄時的訓練進度幾乎沒有放緩,他們已經假設同樣的情況如果發生在更多的英雄身上會怎樣。TI比賽后,又花了很多精力去整合新的英雄。

他們花了幾周時間去訓練多達 25 個英雄的英雄池,將這些英雄帶到大約 5k MMR(大約是95% DOTA 玩家的水平)。雖然在進步,但學習速度不夠快,無法在決賽前達到職業水平。研究人員還沒有時間去找到原因,但后來發現模型容量不足,需要更好的匹配來擴展英雄池,還需要更多的訓練時間來讓新英雄趕上老英雄。但想象一下,當一個人掌握了自己的英雄時,再去學習一個新英雄是多么困難。

對了,這里明明說訓練了 18 個英雄,但為什么在與 OG 比賽時只放了 17 個英雄?因為還有一個英雄在 DOTA v7.20 版本中出現了明顯變化,所以就沒用。

最后,這么好的機會,要不要去體驗下被機器人在 DOTA 中碾壓的酸爽感?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28607

    瀏覽量

    207884
  • 智能體
    +關注

    關注

    1

    文章

    163

    瀏覽量

    10603
  • 強化學習
    +關注

    關注

    4

    文章

    268

    瀏覽量

    11277

原文標題:“你行你上”:有本事跟OpenAI Five打一把DOTA?| 極客頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2024世界智能制造大會火熱進行中!尋跡智4D04,誠邀蒞臨~

    2024世界智能制造博覽會在南京國際博覽中心盛大開幕,尋跡智展示了緊湊型托盤堆垛車BR-F12SL,協作式機械臂AMR-BR-D001A在智能搬運領域的強大實力和創新能力,誠邀各位參觀交流。
    的頭像 發表于 12-22 20:01 ?227次閱讀
    2024<b class='flag-5'>世界</b>智能制造大會火熱進行中!尋跡智<b class='flag-5'>行</b>4D04,誠邀蒞臨~

    冠軍說|第二屆OpenHarmony競賽訓練營冠軍團隊專訪

    實現技術創新,解決現實問題的呢? 高校創新技術人才又將如何助力OpenHarmony技術生態的繁榮與活力? 點擊下方視頻一起聽冠軍說 探秘冠軍團隊與老師的獨家幕后分享 OpenHarmony 競賽
    發表于 10-28 17:11

    明明我說的是25G信號,卻讓我看12.5G的損耗?

    還是從理論來說,我們這里提到的25G和12.5G其實不是一個概念。25G是說這對差分信號的傳輸速率,單位是bps,也就是我們常說的比特率。而協議12.5G指的是頻率,單位是Hz。那么重點來了,25G
    發表于 10-23 09:11

    可穿戴芯片細分市場機會來了,大算力產品、出海布局加速

    市場。終端市場的增長給上游藍牙芯片廠商帶來了成長機會。電子發燒友網整理了恒玄科技、杰理科技、中科藍訊、泰凌微、炬芯科技這五家企業的業績情況,由此分析上述企業在今年上半年的技術布局以及市場開拓情況。 ? ? AI+ 可穿戴
    的頭像 發表于 09-19 09:27 ?3484次閱讀
    可穿戴芯片細分市場<b class='flag-5'>機會來了</b>,大算力產品、出海布局加速

    必知!如何有效保護的IP地址

    地址是一種通過加密和隧道技術在公共網絡建立專用網絡的方法。當你連接到服務器時,的真實IP地址會被隱藏,取而代之的是服務器分配給你的IP地址。 二、避免隨意點擊不明鏈接 網絡存在大量的惡意鏈接,這些鏈接可能會引導
    的頭像 發表于 09-07 11:16 ?443次閱讀

    認識貼片電阻嗎,對他了解多少?

    認識貼片電阻嗎,對他了解多少?
    的頭像 發表于 08-27 15:49 ?569次閱讀
    <b class='flag-5'>你</b>認識貼片電阻嗎,<b class='flag-5'>你</b>對他了解多少?

    喜訊!瑞隆源榮獲廣東省制造業單項冠軍企業

    獲得制造業單項冠軍不僅是對瑞隆源在通信電源過壓過流防護器件領域技術實力和市場地位的認可
    的頭像 發表于 08-05 10:19 ?330次閱讀
    喜訊!瑞隆源榮獲廣東省制造業單項<b class='flag-5'>冠軍</b>企業

    谷景告訴屏蔽繞線功率電感是不是感量越大性能越好

    谷景告訴屏蔽繞線功率電感是不是感量越大性能越好 編輯:谷景電子 屏蔽繞線功率電感是一種普遍的電路電感元件,它對于電路運行的穩定性特別重要。而電感量作為屏蔽繞線功率電感的一個性能指標,也是我們在做
    的頭像 發表于 06-10 18:48 ?578次閱讀

    豪威集團發布900萬像素CMOS全局快門傳感器OG09A10

    豪威集團近日發布了其最新力作——OG09A10,這是一款專為機器視覺應用量身打造的CMOS全局快門(GS)傳感器。這款傳感器采用1英寸光學格式,擁有高達900萬像素的分辨率,為機器視覺應用帶來了全新的視覺體驗。
    的頭像 發表于 05-29 14:35 ?903次閱讀

    世界電信日之知道嗎?

    請各位做好準備,這就帶大家踏上跨越時空的電信發展之旅,回顧一些過去的電信冷知識~什么是世界電信日?WORLDTELECOMMUNICATIONSDAY世界電信日是為了紀念國際電信聯盟(ITU)的成立
    的頭像 發表于 05-19 08:05 ?112次閱讀
    <b class='flag-5'>世界</b>電信日之<b class='flag-5'>你</b>知道嗎?

    德賽集團隊再次獲得惠州市“工信杯”迎春籃球賽冠軍

    繼去年奪冠后,德賽集團隊再次獲得惠州市“工信杯”迎春籃球賽冠軍!4月6日下午,歷時兩周的2024年惠州市“工信杯”迎春籃球賽圓滿落下帷幕。賽事吸引了來自政、企各單位共32支隊伍參加。
    的頭像 發表于 04-08 10:00 ?578次閱讀

    以為的RAM不是以為的RAM~

    一、DTCM和AXI連接的RAMSTM32H7系列處理器內部有多個RAM空間,每個RAM空間的大小和響應速度都不一樣。這里面我們重點關注DTCM總線矩陣連接的128KBRAM和AXI總線矩陣連接的512KBRAM。DTCMRAM128KB:MDK配置是IRAM1:起始地址是0x20000000,大小是0x20000,128KBAXIRAM512KB:MDK配
    的頭像 發表于 04-05 08:09 ?1541次閱讀
    <b class='flag-5'>你</b>以為的RAM<b class='flag-5'>不是</b><b class='flag-5'>你</b>以為的RAM~

    鴻蒙智旗下AITO全系交付新車31727輛,再次蟬聯月銷量冠軍

    3月,鴻蒙智旗下AITO全系交付新車31727輛,再次蟬聯中國市場新勢力品牌月銷量冠軍,并以領先優勢連續三個月奪得中國新勢力品牌銷量冠軍
    的頭像 發表于 04-02 10:03 ?979次閱讀
    鴻蒙智<b class='flag-5'>行</b>旗下AITO全系交付新車31727輛,再次蟬聯月銷量<b class='flag-5'>冠軍</b>!

    華寶新能獲評行業內首個獲得國家級單項冠軍殊榮的企業

    近期,國家工信部第八批制造業單項冠軍企業名單公示,華寶新能憑借頂尖的技術實力與領先的市場份額成功入選,是行業內首個獲得國家級單項冠軍殊榮的企業。
    的頭像 發表于 03-14 10:08 ?479次閱讀
    華寶新能獲評行業內首個獲得國家級單項<b class='flag-5'>冠軍</b>殊榮的企業

    沒有10年工作經驗,我猜都不會用電磁場來分析高速問題吧?

    不是線性,有沒有諧振,有問題時他們都很難直觀的告訴為什么是這樣,是哪里出了問題。因此假設已經有一定的設計和SI的積累后,高速先生今天給大家推薦一個對高速信號很有效的分析方法,通過電磁場分布來分析
    發表于 02-01 14:48
    主站蜘蛛池模板: 午夜射精日本三级| 久久强奷乱码老熟女| 国产福利秒拍weipai.ee| 狠狠爱亚洲五月婷婷av| 男人一进一出桶女人视频| 性色爽爱性色爽爱网站| couo福利姬图库| 国产亚洲精品久久久无码狼牙套| 牛牛精品专区在线| 伊人久久精品午夜| 国产手机在线亚洲精品观看| 琪琪婷婷五月色综合久久| 在线国产三级| 国产又黄又硬又粗| 少妇高潮久久久久7777| yellow免费| 久久精品综合电影| 亚洲精品久久久久AV无码| 成人在线观看视频免费| 女人被躁到高潮嗷嗷叫免费| 在线看无码的免费网站| 含羞草国产亚洲精品岁国产精品| 受被三个攻各种道具PLAY| se01国产短视频在线观看| 毛片999| 亚洲呦女专区| 国产亚洲精品视频在线网| 无码日韩人妻精品久久蜜桃免费| 第一次玩老妇真实经历| 全彩acg无翼乌火影忍者| 99在线观看视频| 欧美xxxxxbb| 99视频精品国产在线视频| 男人电影天堂手机| jazzjazzjazz欧美| 日本国产成人精品无码区在线网站| 99久久综合精品免费| 女生扒开尿口| brazzers欧美孕交| 欧美日韩亚洲中字二区| ppypp午夜限制不卡影院私人|