色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI Five是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么?

DPVg_AI_era ? 來源:lp ? 2019-04-19 09:29 ? 次閱讀

在上周末徹底攻陷了Dota人類頂級職業戰隊OG后,OpenAI站出來介紹了OpenAIFive是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

OpenAIFive是第一個在電子競技游戲中擊敗世界冠軍的人工智能,在上周末與2-0大敗世界冠軍Dota2團隊OG,這是AI第一次在直播中擊敗了電子競技專家。

OG和OpenAI開發組

本次比賽還得出了兩個驚人的發現:

盡管訓練的時候專注于擊敗其他瘋狂電腦,但OpenAIFive在比賽中卻展現出和人類玩家的優秀的團隊協作意識。這意味著未來的AI系統可以從競爭型AI轉變為合作型AI

總決賽讓OpenAI的科學家可以回答一個重要的研究問題:OpenAIFive在多大程度、以何種方式能夠被確定的打敗?并且可能是有史以來最大規模的、人們可以有意識地與之交互的高強度深層強化學習智能體的部署

徹底攻陷了人類頂級職業玩家后,OpenAI站出來介紹了OpenAIFive是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

為什么選擇Dota?

OpenAIFive的初衷是為了解決現有深度強化學習算法無法實現的問題。為此需要大幅增加工具的的能力、復雜的算法思想(例如分層強化學習)。

OpenAIFive將世界視為一堆必須破譯的數字。它使用相同的通用學習代碼,無論這些數字代表Dota游戲(約20,000個數字)或機器人手(約200個)的狀態

為了構建OpenAIFive,研究人員創建了一個名為Rapid的系統,以前所未有的規模運行PPO。結果超出了研究人員最大的期望,產生出了世界級的Dota機器人,沒有觸及任何基本的性能限制。

當今的監督學習算法之所以能有如此強大功能,是以大量經驗為代價的,這在游戲或模擬環境之外是不切實際的。研究人員認為減少經驗量是深度學習的下一個挑戰。

研究人員表示,從今天開始OpenAIFive將不會繼續打比賽,但取得的進步和技術的發展將繼續推動未來的工作。研究人員認為Dota對于監督學習開發來說比現在使用的標準環境更具有內在的趣味性和難度。

算力

OpenAIFive這次的勝利是由于一次重大變化:訓練計算量增加了8倍。前期階段研究人員通過提高培訓規模來推動進一步的發展,之后將絕大部分算力用于培訓單一的OpenAIFive模型,相當于延長了訓練時間。

總的來說,當前版本的OpenAIFive已經消耗了800petaflop/s-days,并且在10個實時月內獲得了45000年的游戲經驗,平均每天獲得250年的模擬經驗。OpenAIFive的總決賽版本與TI版本相比,勝率為99.9%。

遷移學習

盡管模型大小和游戲規則發生了變化,但目前版本的OpenAIFive自2018年6月以來一直在不斷訓練。在每種情況下,研究人員都能夠將模型轉移并繼續培訓,這對于其他領域的監督學習來說是一個開放的挑戰。

據悉,這可能是監督學習智能體第一次使用如此長期的訓練課程進行訓練。

更多Dota英雄

研究人員看到從訓練5個英雄到訓練18英雄速度并沒有減弱的很明顯,于是假設對更多英雄來說也是如此,隨后開始大量嘗試整合新英雄。

研究人員花了幾個星期的時間訓練英雄池,最多達到了25個英雄。將這些英雄帶到大約5kMMR(大約95%的Dota玩家)。盡管在進步,但學習速度還不夠快,無法在總決賽之前達到職業水平。

研究人員沒有太多時間調查原因,但他們認為可能需要更好的匹配擴展的英雄池,需要更多的訓練時間讓新英雄達到老英雄的同等水平。想象一下當你習慣了某個英雄后,學習新英雄的難度是多么大!

協同模式

它實際上感覺很好;我的毒蛇在某些時候為我獻出了生命。他試圖幫助我,想著“我確定她知道她在做什么”然后顯然我沒有。但是,你知道,他相信我。對于[人類]隊友,我并沒有那么多.-無論如何

在總決賽期間,研究人員展示了OpenAI Five與人類一起在團隊中的表現,兩隊的成員都是2個真人帶3個智能體

OpenAIFive與人類的協同作戰能力為人類與人工智能互動的未來提供了一個引人注目的愿景:人工智能系統能夠和人類協作并增強人類體驗。

玩家認為從機器人隊友哪里感受到了戰友之情,并從這些先進的系統中學到了很多東西,整體來說是一種有趣的體驗。

值得注意的是,OpenAIFive展示了zero-shot遷移學習,與人類并肩作戰或者對抗人類。研究人員非常驚訝這一點和它一樣有效。事實上,研究人員考慮在國際上進行協同作案韓比賽,但認為需要專門的訓練。

OpenAI Five Arena

目前研究人員還不知道OpenAIFive在多大程度上能夠通過更機智的策略被擊敗,所以研究人員推出了OpenAIFiveArena。這是一項公開的實驗,任何人都可以跟OpenAIFive組隊或者對戰。

競技場于4月18日星期四太平洋標準時間下午6點開放,并于4月21日星期日太平洋標準時間晚上11:59關閉。玩家需要注冊,所有游戲的結果將自動報告給競技場公共排行榜。

下一步干什么

一旦研究人員審查了OpenAIFiveArena的結果,研究人員將發布對OpenAIFive的更多技術分析,之后將繼續使用OpenAI中的Dota2環境。

研究人員已經看到過去兩年在監督學習能力方面取得了快速進展,并認為Dota2將在推進無論是通過較少的數據還是真正的人工智能合作實現有能力的表現方面,持續提供幫助。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238266
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121113
  • 遷移學習
    +關注

    關注

    0

    文章

    74

    瀏覽量

    5559

原文標題:官方揭秘OpenAI Five如何打敗人類:遷移學習+海量訓練,10個月訓練4.5萬年

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU是如何訓練AI大模型的

    AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練
    的頭像 發表于 12-19 17:54 ?86次閱讀

    訓練AI大模型需要什么樣的gpu

    訓練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性的GPU。在選擇時,需要根據具體需求進行權
    的頭像 發表于 12-03 10:10 ?107次閱讀

    如何訓練自己的AI大模型

    訓練自己的AI大模型是一個復雜且耗時的過程,涉及多個關鍵步驟。以下是一個詳細的訓練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務和應用領域需要不同類型的AI模型
    的頭像 發表于 10-23 15:07 ?1286次閱讀

    ai模型訓練需要什么配置

    較小的數據集和簡單的計算任務,如數據預處理、模型評估等。因此,選擇一款高性能的CPU對于提高AI模型訓練的整體效率至關重要。 推薦選擇Intel Core i7或更高性能的處理器,或者
    的頭像 發表于 10-17 18:10 ?1192次閱讀

    AI訓練的基本步驟

    AI(人工智能)訓練是一個復雜且系統的過程,它涵蓋了從數據收集到模型部署的多個關鍵步驟。以下是對AI訓練過程的詳細闡述,包括每個步驟的具體內容,并附有相關代碼示例(以Python和sc
    的頭像 發表于 07-17 16:57 ?1986次閱讀

    ai大模型訓練方法有哪些?

    AI大模型訓練方法是一個復雜且不斷發展的領域。以下是ai大模型訓練方法: 數據預處理和增強 數據清洗:去除噪聲和不完整的數據。 數據標準化:將數據縮放到統一的范圍。 數據增強:通過旋轉
    的頭像 發表于 07-16 10:11 ?1465次閱讀

    Stack Overflow引發用戶抗議,用戶貢獻被用于AI訓練

    近日,編程問答社區Stack Overflow與人工智能研究機構OpenAI簽署協議,允許后者通過API獲取平臺內容進行AI訓練,此舉引來了大量社區成員的不滿。
    的頭像 發表于 05-09 16:05 ?516次閱讀

    OpenAI勁敵Inflection AI官宣“加盟”微軟

    OpenAI的強勁對手Inflection AI近期宣布,將與科技巨頭微軟展開深度技術合作。這次合作意味著Inflection AI將其尖端技術授權給微軟,標志著這家初創公司正式轉向與企業客戶攜手
    的頭像 發表于 03-21 11:33 ?664次閱讀

    英偉達擅用版權作品遭起訴 AI訓練數據和版權的矛盾凸顯

    英偉達擅用版權作品遭起訴 AI訓練數據和版權的矛盾凸顯 據外媒路透社的報道,AI訓練數據和版權之間的矛盾日益凸顯。英偉達因為擅用版權作品訓練
    的頭像 發表于 03-11 14:17 ?551次閱讀

    DocuSign擬用用戶合同數據訓練AI,引爭議

    據了解,DocuSign計劃借助微軟Azure上的OpenAI工具,如GPT技術,以訓練其所謂的“撰寫協議”模型,并且從用戶提供的大量數據中,訓練出專屬的人工智能(AI)模型,但這部分
    的頭像 發表于 03-04 15:45 ?534次閱讀

    OpenAI迎戰紐約時報指控 非法使用其內容訓練人工智能模型

    OpenAI迎戰紐約時報指控 《紐約時報》提起版權訴訟指控OpenAI非法使用其內容訓練人工智能模型,OpenAI積極迎戰,OpenAI表示
    的頭像 發表于 02-28 15:05 ?537次閱讀

    英偉達缺貨?OpenAI選擇自研芯片

    ?電子發燒友網報道(文/周凱揚)在生成式AI和大模型帶來的AI洪流下,不少大廠都不約而同地選擇了自研AI芯片。即便這意味著組建新的團隊,花費大量的資金,但從長遠發展的角度來看,自研芯片
    的頭像 發表于 01-30 00:51 ?3711次閱讀

    新火種AI|這家“中國OpenAI”,能趕超OpenAI嗎?

    全面對標OpenAI,智譜AI能成為“中國的OpenAI”嗎?
    的頭像 發表于 01-18 17:56 ?646次閱讀
    新火種<b class='flag-5'>AI</b>|這家“中國<b class='flag-5'>OpenAI</b>”,能趕超<b class='flag-5'>OpenAI</b>嗎?

    因為生成式AI興起《紐約時報》起訴OpenAI和微軟

    因為生成式AI興起《紐約時報》起訴OpenAI和微軟 對于生成式AI技術在訓練AI時是否會侵犯版權這個問題一直沒有全面而準確的答案,極具爭議
    的頭像 發表于 12-28 17:08 ?669次閱讀
    主站蜘蛛池模板: 99久久999久久久综合精品涩| 久久99精国产一区二区三区四区 | 午夜国产理论| 国产1广场舞丰满老女偷| 色多多污版app下载网站| 国产成人午夜精品免费视频| 色多多污污在线观看网站| 国产AV精品国语对白国产| 四房播播开心色播| 亚洲AV國產国产久青草| 国产精品亚洲精品影院| 亚洲AV精品一区二区三区不卡 | 亚洲精品乱码久久久久久直播| 外国三级片名| www.av日韩| 欧美日韩无套内射另类| 97欧美精品大香伊蕉在人线| 狼与美女谐音歌词| 国产精品青青草原app大全| 日韩久久影院| 成人国产亚洲精品A区天堂蜜臀| 麻豆精品传媒卡一卡二传媒短视频 | 伦理片在线线手机版韩国免费6| 2019午夜福合集不打码| 麻豆精品一区二正一三区 | 亚洲看片网站| 久久综合中文字幕无码| 99久久99久久免费精品蜜桃| 人妻换人妻AA视频| 国产国拍亚洲精品av麻豆| 亚洲福利电影一区二区?| 久久国产一区二区三区| 607080老太太AW| 日本乱子人伦在线视频| 国产精品人妻无码久久久蜜桃| 亚洲精品免费观看| 麻豆高清免费国产一区| 成人性生交大片免费看4| 亚洲AV久久婷婷蜜臀无码不卡 | 无码任你躁久久久久久老妇双奶| 交换邻居波多野结衣中文字幕 |