近日,Github 一位開發(fā)者 danaugrs 開源了一個新項目——Huskarl,一個專注研究和快速原型的深度強化學習框架。
此框架基于 TensorFlow 2.0 構(gòu)建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環(huán)境的并行計算變得很容易,這將對加速策略學習算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環(huán)境無縫結(jié)合,并將計劃支持多代理環(huán)境和 Unity3D 環(huán)境。
OpenAI Gym:2016 年 OpenAI 發(fā)布的一個可以開發(fā)、對比強化學習算法的工具包,提供了各種環(huán)境、模擬任務等,任何人都可以在上面訓練自己的算法。
Unity3D:一個全面整合的專業(yè)游戲引擎,由 Unity Technologies 開發(fā)的一款可以讓玩家輕松創(chuàng)建三維視頻游戲、實時三維動畫等類型互動內(nèi)容的多平臺綜合型游戲開發(fā)工具。
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在計劃中。
最重要的是,TF 2.0 的 nightly 已經(jīng)發(fā)布,這個開源工具也是基于 TF2.0 開發(fā)的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環(huán)境:
這個工具還是新鮮出爐燙手的呢,大家趕緊來嘗鮮試一下~
地址:
https://github.com/danaugrs/huskarl
-
強化學習
+關(guān)注
關(guān)注
4文章
267瀏覽量
11263 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60537 -
開源工具
+關(guān)注
關(guān)注
0文章
27瀏覽量
4498
原文標題:新鮮開源:基于TF2.0的深度強化學習平臺
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論