在线观看国产久青草,亚洲天堂视频在线观看,在线观看222www

DeepMind 公司因為研制出會下棋的人工智能AlphaGo和AlphaZero而聲名鵲起，如今他們將注意力轉向了另一種棋盤游戲：強權外交（Diplomacy），也被稱為外交或者外交風云，是經典的桌面游戲之一。該游戲與圍棋不同，它是七人游戲，需要游戲玩家既競爭又合作，并且每回合玩家都會同時進行移動，因此，每個玩家都必須推理其他玩家的想法，非常復雜。

研制一個能玩外交游戲的人工智能軟件，DeepMind公司的計算機專家Andrea Tacchetti表示：“與游戲Go或國際象棋相比，這是一個本質上不同的問題?！?去年12月，Tacchetti和合作者在NeurIPS會議上就其系統發表了一篇論文，該論文介紹了能玩外交游戲的AI系統策略。

“外交”是一種策略游戲，在歐洲地圖上劃分為75個省。玩家建立并動員軍隊占領各省，直到控制了大部分補給中心的玩家獲勝。玩家每回合寫下自己的行動，然后執行。他們可以攻擊或防御對方玩家，或者支援對方玩家的進攻和防御，建立聯盟。在完整版中，玩家可以協商，為了方便人工智能研究，DeepMind公司使用了簡單版的“No Press”策略，不需要人工智能軟件發布策略與其他玩家進行溝通。

從歷史上看，人工智能使用人工制定的策略來發揮決策作用。2019年，蒙特利爾研究所的Mila通過使用深度學習系統取得了勝利。他們基于150000個人類游戲的數據集，訓練了一個稱為DipNet的神經網絡來模仿人類。DeepMind從DipNet版本開始，使用強化學習（一種反復試驗）來完善它。但是，僅通過反復試驗來探索可能性會帶來問題。因此，他們調整了強化學習算法。在訓練過程中，他們在每一步中都對對手的可能舉動進行采樣，計算出在這些情況下平均效果最佳的行動，然后訓練自己的權重以偏向于此行動。經過訓練，它跳過了采樣過程，僅根據其學習的知識進行工作。Tacchetti說：“我們論文的信息是：我們可以在這樣的環境中進行強化學習?！?他們設計的一個AI玩家與六個DipNet的AI贏了30％的時間（有14％的機會）。一個DipNet對抗他們的七個，僅贏得了3％的時間。

今年4月，Facebook將在ICLR會議上發表一篇論文，描述他們在“No Press”版本的外交游戲中的研究成果。他們建立了類似DipNet的網絡，但是沒有添加強化學習的元素，而是添加了一個“SearchBot”搜索玩家策略，SearchBot通過玩幾回合來評估玩家的每種潛在策略（假設每個人都根據神經網絡的首選選擇后續行動）。策略不是一個最佳行動組合，而是由50個可能行動組成的一組概率（由神經網絡建議）。

在真實游戲中進行這樣的探索會減慢SearchBot的速度，但可以使它更優于DipNet。SearchBot在外交游戲網站上與人類進行了匿名比賽，在玩家中排名前2％。Facebook的計算機專家、論文的共同作者亞當·勒勒（Adam Lerer）說：“這是第一個被證明具有能與人類競爭的機器人。”

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1791

文章
47229

瀏覽量
238325
強化學習

強化學習

+關注

關注
4

文章
266

瀏覽量
11250
DeepMind

DeepMind

+關注

關注
0

文章
130

瀏覽量
10854

原文標題：DeepMind又出AI大招

文章出處：【微信號：robotmagazine，微信公眾號：機器人技術與應用】歡迎添加關注！文章轉載請注明出處。

谷歌Vertex AI助力企業生成式AI應用

DeepMind 在模型技術方面積極探索創新，尤其著力于 Gemini 和 Imagen 的改進。我們的企業 AI 平臺 Vertex AI 也推出了數十項突破性功能。

發表于 09-09 15:59 ?498次閱讀

云開發AI助手

草帽王路飛

發布于 :2024年07月22日 14:41:54

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會議

谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了，瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。

發表于 07-16 18:29 ?575次閱讀

谷歌<b class='flag-5'>DeepMind</b>被曝抄襲開源成果，論文還中了頂流會議

AI終端應用元年到來，史密斯英特康突破AI芯片測試挑戰

2024年,文生視頻工具——Sora的誕生為已然熱鬧的AI 應用領域又添了一把火。近日,Google的人工智能(AI)研究實驗室DeepMind表示,它正在開發為視頻生成配樂的人

發表于 06-21 11:10 ?353次閱讀

<b class='flag-5'>AI</b>終端應用元年到來，史密斯英特康突破<b class='flag-5'>AI</b>芯片測試挑戰

谷歌AI新突破：為無聲視頻智能配音

近日，谷歌DeepMind團隊公布了一項革命性的技術——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。這一技術的出現，不僅為視頻創作領域帶來了新的可能，也為觀眾帶來了更加豐富的視聽體驗。

發表于 06-21 10:50 ?488次閱讀

蘋果WWDC 2024日程揭曉：大招碼上來

蘋果公司近日公布了備受期待的2024年度WWDC（全球開發者大會）的詳細日程安排。今年的WWDC將于太平洋時間6月10日至14日舉行，活動口號“大招碼上來”預示著蘋果將帶來一系列令人振奮的新技術和產品更新。

發表于 05-30 09:24 ?752次閱讀

谷歌DeepMind發布人工智能模型AlphaFold最新版本

谷歌DeepMind近日發布了人工智能模型AlphaFold的最新版本——AlphaFold 3，這一革命性的工具將在藥物發現和疾病治療領域發揮巨大作用。

發表于 05-10 11:26 ?587次閱讀

谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發AI模型，這一創新技術將為科學家們提供前所未有的幫助，使他們能更精確地理解疾病機制，進而開發出更高效的治療藥物。

發表于 05-10 09:35 ?393次閱讀

微軟斥資25億英鎊在倫敦新建AI Hub，推動AI技術發展與商業化落地

同時，微軟還在四月初宣布成立全新的Microsoft AI團隊，由DeepMind與Inflection聯合創始人Mustafa Suleyman擔任負責人，全力推動Copilot項目實施。Jordan Hoffmann則將領銜領導位于倫敦的Microsoft

發表于 04-09 16:22 ?483次閱讀

微軟宣布組織架構調整，組建Microsoft AI

微軟，這家全球市值最高的科技巨頭，近日宣布了一項重大的組織架構調整。公司決定組建全新的Microsoft AI部門，旨在統一管理和推進所有消費者AI產品和研究工作。為此，微軟特地挖角了人工智能領域的知名人物——DeepMind的

發表于 03-21 10:52 ?857次閱讀

谷歌DeepMind推出SIMI通用AI智能體

近日，谷歌的DeepMind團隊發布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），這是一個通用人工智能智能體，能夠在多種3D虛擬環境

發表于 03-18 11:39 ?953次閱讀

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺

據報道，谷歌公司的DeepMind團隊近期發布了AI模型Genie，此模型擁有多達110億個參數，能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。

發表于 02-27 14:53 ?774次閱讀

微軟與法國 Mistral AI聯手，拓展生成式人工智能領域

　值得注意的是，Mistral AI成立于2023年4月，由Meta和DeepMind前高管創立。截至2023年底，該公司募集資金大約4.15億美元，預計微軟的注資將進一步推動該公司市值上升。

發表于 02-27 10:40 ?574次閱讀

谷歌DeepMind資深AI研究員創辦AI Agent創企

近日，剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創辦了一家名為“AI Agent”的創企。Ioannis Antonoglou常駐倫敦，此前曾擔任谷歌

發表于 02-04 10:02 ?784次閱讀

谷歌DeepMind科學家欲建AI初創公司

據知情人士透露，谷歌人工智能部門DeepMind的兩名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創公司的事宜。

發表于 01-22 14:41 ?488次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

DeepMind又出AI大招

評論