色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

觀察AI如何找到出口 強化游戲體驗

ouxn_HW_Digital ? 來源:華為開發者社區 ? 作者:華為開發者社區 ? 2021-08-24 09:52 ? 次閱讀

作為一名快樂的肥宅,玩游戲是居家必備,無論是王者榮耀、吃雞、原神這些大熱游戲,還是跳一跳、合成大西瓜、2048、這些風靡一時得小游戲,咱都有涉及。但是為了成為一個“頭號玩家”,我總是瘋狂的去個各大社區、網站尋找各種攻略,跟著攻略成長,我時常在想,什么時候俺才能成為一代攻略大神啊,讓大家學習我的技術,豈不是很刺激!

靈光一閃,畢竟我是個有點小技術的肥宅,曾經也癡迷過deepmind,跑過AlphaGo,這不得訓練一個AI玩一玩。

強化學習訓練2048游戲,

觀察AI如何找到出口?

既然要練手,那就先從2048這種簡單,不考驗操作,純策略的游戲入手吧。在網上搜羅了一番,果然讓我找到了開源的2048游戲環境,GitHub地址:

https://github.com/rgal/gym-2048。

下一步就是把這個算法和強化學習結合了。

算法部分很簡單,目前我才用的是最傳統的DQN,10分鐘就可以達到一個還可以的模型效果。如果小伙伴們有想法,可以試試RainBow,PPO,A2C,SAC這類算法,相信會獲得更佳的效果。

我開發這個模型,用的是來自華為云的ModelArts(它是一個在線、開箱即用的AI平臺,還有免費的GPU算力,每天不限次數使用,不要太爽!),所以代碼是在ipynb中跑的。

整體步驟大概可以分為3步:

1.創建游戲環境

2.創建DQN算法

def learn(self, buffer): # 當replaybuffer中存儲的數據大于batchsize時,從中隨機采樣一個batch的數據學習 if buffer.size 》=self.args.batch_size: # 更新target_model的參數 if self.learn_step_counter %args.target_update_freq == 0: self.target_model.load_state_dict(self.behaviour_model.state_dict()) self.learn_step_counter += 1 # 從replaybuffer中隨機采樣一個五元組(當前觀測值,動作,下一個觀測值,是否一局結束,獎勵值) s1, a, s2, done, r =buffer.get_sample(self.args.batch_size) s1 =torch.FloatTensor(s1).to(device) s2 = torch.FloatTensor(s2).to(device) r = torch.FloatTensor(r).to(device) a = torch.LongTensor(a).to(device) if args.use_nature_dqn: q =self.target_model(s2).detach() else: q = self.behaviour_model(s2) # 每個動作的q值=r+gamma*(1-0或1)*q_max target_q = r +torch.FloatTensor(args.gamma * (1 - done)).to(device) * q.max(1)[0] target_q =target_q.view(args.batch_size, 1) eval_q = self.behaviour_model(s1).gather(1,torch.reshape(a, shape=(a.size()[0], -1))) # 計算損失函數 loss = self.criterion(eval_q,target_q) self.optimizer.zero_grad() loss.backward() self.optimizer.step() def get_action(self, state, explore=True): # 判斷是否探索,如果探索,則采用貪婪探索策略決定行為 if explore: if np.random.uniform() 》=args.epsilon: action = randint(0,self.action_dim - 1) else: # Choose the best action accordingto the network. q =self.behaviour_model(torch.FloatTensor(state).to(device)) m, index = torch.max(q, 1) action =index.data.cpu().numpy()[0] else: q = self.behaviour_model(torch.FloatTensor(state).to(device)) m, index = torch.max(q, 1) action =index.data.cpu().numpy()[0] return action classReplayBuffer: def __init__(self, buffer_size, obs_space): self.s1 = np.zeros(obs_space, dtype=np.float32) self.s2 = np.zeros(obs_space,dtype=np.float32) self.a = np.zeros(buffer_size,dtype=np.int32) self.r = np.zeros(buffer_size,dtype=np.float32) self.done = np.zeros(buffer_size,dtype=np.float32) # replaybuffer大小 self.buffer_size = buffer_size self.size = 0 self.pos = 0 # 不斷將數據存儲入buffer def add_transition(self, s1, action, s2,done, reward): self.s1[self.pos] = s1 self.a[self.pos] = action if not done: self.s2[self.pos] = s2 self.done[self.pos] = done self.r[self.pos] = reward self.pos = (self.pos + 1) %self.buffer_size self.size = min(self.size + 1,self.buffer_size) # 隨機采樣一個batchsize def get_sample(self, sample_size): i = sample(range(0, self.size), sample_size) return self.s1[i], self.a[i],self.s2[i], self.done[i], self.r[i]

3.創建網絡模型

此處我用的就是一個非常簡單的三層卷積網絡

classNet(nn.Module): #obs是狀態空間輸入,available_actions_count為動作輸出維度 def __init__(self, obs,available_actions_count): super(Net, self).__init__() self.conv1 = nn.Conv2d(obs, 128,kernel_size=2, stride=1) self.conv2 = nn.Conv2d(128, 64,kernel_size=2, stride=1) self.conv3 = nn.Conv2d(64, 16,kernel_size=2, stride=1) self.fc1 = nn.Linear(16,available_actions_count) self.relu = nn.ReLU(inplace=True) def forward(self, x): x = x.permute(0, 3, 1, 2) x = self.relu(self.conv1(x)) x = self.relu(self.conv2(x)) x = self.relu(self.conv3(x)) x = self.fc1(x.view(x.shape[0], -1)) return x

完成以上三步,就可以愉快的開始訓練啦:

print(‘

training.。。’)begin_t= time.time()max_reward= 0fori_episode in range(args.epochs): # 每局開始,重置環境 s = env.reset() # 累計獎勵值 ep_r = 0 while True: # 計算動作 a = dqn.get_action(np.expand_dims(s,axis=0)) # 執行動作 s_, r, done, info = env.step(a) # 存儲信息 memory.add_transition(s, a, s_, done,r) ep_r += r # 學習優化過程 dqn.learn(memory) if done: print(‘Ep: ’, i_episode, ‘| Ep_r: ’, round(ep_r, 2)) if ep_r 》 max_reward: max_reward = ep_r print(“current_max_reward{}”.format(max_reward)) # 保存模型 torch.save(dqn.behaviour_model,“2048.pt”) break s = s_print(“finish!time cost is {}s”.format(time.time() - begin_t))

我只訓練了10分鐘,在這個不能錯步的嚴格環境下,推理時可以達到256分,如果采用更先進算法,更長的訓練時間,2048不是夢。

詳細代碼獲取方式:

通過此鏈接可直接在線運行,或者下載

https://marketplace.huaweicloud.com/markets/aihub/notebook/detail/?id=3a11d09b-85f5-4ae4-b4a7-9b19be2b444d

這個技術來源是我在去年華為云AI全棧成長計劃中接觸到的,據說今年華為云又開始了新一輪【AI實戰營】,6大分類實戰營Python、ModelArts、MindSpore AI框架、深度、強化、機器學習,助我們成為“AI王者”!

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31133

    瀏覽量

    269460
  • 強化學習
    +關注

    關注

    4

    文章

    268

    瀏覽量

    11270
  • 華為云
    +關注

    關注

    3

    文章

    2607

    瀏覽量

    17478

原文標題:游戲“外掛”?- AI生成游戲最強攻略

文章出處:【微信號:HW-DigitalHome,微信公眾號:華為數字家庭】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    拜登擬在卸任前加強AI芯片出口管制

    拜登政府計劃在離任之際宣布對中國實施最廣泛的人工智能(AI)芯片出口管制,引發美國科技行業的廣泛批評。代表美國科技行業的貿易協會——美國信息技術產業理事會(ITI)7日敦促拜登政府不要在卸任前最后
    的頭像 發表于 01-09 17:27 ?69次閱讀

    巨人網絡發布“千影”大模型,加速“游戲+AI”布局

    近日,巨人網絡在2024年度中國游戲產業年會上,正式推出了名為“千影?QianYing”的有聲游戲生成大模型。這一創新舉措標志著巨人網絡在“游戲+AI”賽道上的又一重要布局。 “千影
    的頭像 發表于 12-16 09:45 ?288次閱讀

    如何使用 PyTorch 進行強化學習

    的計算圖和自動微分功能,非常適合實現復雜的強化學習算法。 1. 環境(Environment) 在強化學習中,環境是一個抽象的概念,它定義了智能體(agent)可以執行的動作(actions)、觀察
    的頭像 發表于 11-05 17:34 ?325次閱讀

    谷歌發布革命性AI游戲引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驅動的游戲引擎——GameNGen,這一創新技術標志著游戲開發領域的新紀元。GameNGen憑借其強大的計算能力,能夠在單個TPU上實現每秒20幀的實時游戲生成,每一幀畫面均源自精密的擴散模
    的頭像 發表于 08-29 18:07 ?900次閱讀

    微軟攜手Lumen Technologies擴容并強化AI網絡能力合作

    微軟在7月25日宣布了一項重大舉措,旨在通過深化其Copilot等生成式AI服務在企業、組織、教育及普通消費者領域的布局,來滿足日益增長的對AI算力及網絡能力的需求。為實現這一目標,微軟攜手網絡系統領域的領先企業Lumen Technologies,共同開啟了一段旨在擴容
    的頭像 發表于 07-25 14:39 ?626次閱讀

    紅魔9S Pro系列AI游戲手機正式發布

    在萬眾矚目中,紅魔電競宇宙今日迎來了激動人心的時刻——全新紅魔9S Pro+與紅魔9S Pro兩款AI游戲手機正式揭開神秘面紗,以顛覆性的姿態引領游戲手機市場邁入“游戲
    的頭像 發表于 07-04 15:15 ?763次閱讀

    MediaTek天璣開發者大會2024揭秘:AI Coaching游戲教學技術革新游戲體驗

    ,共同展示了基于天璣平臺的端側 AI 游戲教學技術——AI Coaching。這一創新技術不僅為玩家帶來了全新的游戲體驗,更是對游戲教學領域
    的頭像 發表于 06-27 10:59 ?603次閱讀

    育碧將運用AI技術打造活力四溢的游戲

    Guillemot 稱,AI 將被廣泛應用于公司業務的“自動化”過程。目前,育碧已組建兩支科研團隊研究生成式 AI —— 一隊負責市場營銷、銷售、IT、法律等事項;另一隊專注提升游戲品質及賦予
    的頭像 發表于 05-20 17:00 ?538次閱讀

    阿里云通義大模型助力“小愛同學”強化多模態AI生成能力

    小米的人工智能助手“小愛同學”近期與阿里云通義大模型達成戰略合作,共同提升其多模態AI生成能力,特別是在圖片生成與理解方面。這次合作不僅將強化“小愛同學”的功能,還將在小米的多個產品線,包括小米汽車和手機等設備上得到實際應用。
    的頭像 發表于 05-13 09:19 ?861次閱讀

    NVIDIA數字人技術加速部署生成式AI驅動的游戲角色

    NVIDIA 在 GDC 2024 大會上宣布,Inworld AI 等領先的 AI 應用程序開發者,正在使用 NVIDIA 數字人技術加速部署生成式 AI 驅動的游戲角色。
    的頭像 發表于 04-09 10:08 ?686次閱讀
    NVIDIA數字人技術加速部署生成式<b class='flag-5'>AI</b>驅動的<b class='flag-5'>游戲</b>角色

    美國BIS更新出口管制新規,強化半導體出口監管

    首先,對EUV掩膜基板追加管制。特別是專供EUV光刻制程之用的掩膜基板現已正式納入出口控制范圍,相關出口皆需遵循嚴格的許可要求。
    的頭像 發表于 04-08 09:25 ?688次閱讀

    美國商務部更新半導體出口管制細則

    實際上,浙商電子的研究報告指出,美方此次出口管制的核心轉變在于加強了對EUV掩模基板的管控,明晰了集成電路的性能關鍵參數定義及計算方法,強化了對集成電路整機產品的限制,對含特殊性能成分的芯片的出口采用了逐案審查政策。
    的頭像 發表于 04-03 15:41 ?781次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以在谷歌的官方網站或相關的開發者平臺上找到。具體地,您可以嘗試訪問谷歌的AI平臺或開發者社區,以獲取有關模型合成工具的最新信息和資源。
    的頭像 發表于 03-01 18:13 ?1598次閱讀

    新火種AI|游戲黑馬《幻獸帕魯》爆火,AI+游戲將有無限可能

    ? 作者:一號 編輯:美美 在游戲行業中,AI正在扮演越來越重要的角色。 2024年第一個月,一匹游戲黑馬就從萬千游戲中殺出重圍,上線僅4天,就賣出了600萬份,最高同時在線201萬人
    的頭像 發表于 02-19 10:05 ?562次閱讀
    新火種<b class='flag-5'>AI</b>|<b class='flag-5'>游戲</b>黑馬《幻獸帕魯》爆火,<b class='flag-5'>AI</b>+<b class='flag-5'>游戲</b>將有無限可能

    惠普推出新一代AI游戲本,并計劃推出首個AI PC本地AI解決方案

    近日,惠普發布了新一代AI游戲筆記本電腦,這些新款筆記本在性能和AI功能方面都有顯著提升。其中,14英寸暗影精靈10 SLIM被公認為惠普目前最輕的游戲筆記本,它搭載了酷睿Ultra
    的頭像 發表于 01-22 15:58 ?929次閱讀
    主站蜘蛛池模板: 国产精品第八页| 99久久精品国产自免费| 最近更新2019中文字幕国语 | 国产在线观看www| 色偷偷亚洲天堂| av淘宝 在线观看| 暖暖 日本 视频 在线观看免费 | 丰满人妻按磨HD| 人妻激情综合久久久久蜜桃| 99手机在线视频| 牛牛在线视频| 99热最新在线| 欧美整片华人play| 菠萝视频高清版在线观看| 日本无卡无吗在线| 电影日本妻子| 午夜国产羞羞视频免费网站| 国产三级级在线电影| 亚洲免费视频日本一区二区| 久久成人a毛片免费观看网站| 在线a亚洲视频| 男女久久久国产一区二区三区| np高h肉文| 视频一区视频二区ae86| 国产色婷亚洲99精品AV| 亚洲欧美日韩精品自拍| 久久精品一区二区免费看| 18禁在线无遮挡羞羞漫画| 欧美16一17sex性hd| 动漫美女禁区| 亚洲精品天堂无码中文字幕影院| 久久精品国产首叶| xxxxx69hd杨幂| 秀婷程仪公欲息肉婷在线观看| 簧片在线免费观看| 2020年国产理论| 日本人吃奶玩奶虐乳| 国产午夜福利伦理300| 中国人泡妞xxxxxxxx19| 秋霞特色大片18岁入口| 国产在线高清视频无码不卡|