新鲜开源：基于TF2.0的深度强化学习平台

wilbertzhou

2019-02-24

整理 | Jane

出品 | AI科技大本营（公众号id：rgznai100）

近日，Github 一位开发者 danaugrs 开源了一个新项目——Huskarl，一个专注研究和快速原型的深度强化学习框架。

此框架基于 TensorFlow 2.0 构建，使用了 tf.keras API，保证了其简洁性和可读性。Huskarl 可以使多环境的并行计算变得很容易，这将对加速策略学习算法（比如 A2C 和 PPO）非常有用。此外，Huskarl 还可以与 OpenAI Gym 环境无缝结合，并将计划支持多代理环境和 Unity3D 环境。

OpenAI Gym：2016 年 OpenAI 发布的一个可以开发、对比强化学习算法的工具包，提供了各种环境、模拟任务等，任何人都可以在上面训练自己的算法。Unity3D：一个全面整合的专业游戏引擎，由 Unity Technologies 开发的一款可以让玩家轻松创建三维视频游戏、实时三维动画等类型互动内容的多平台综合型游戏开发工具。

目前，Huskarl 已经支持了 DQN（Deep Q-Learning Network）、Multi-step DQN、Double DQN、A2C（Advantage Actor-Critic）等算法，还有 DDPG（Deep Deterministic Policy Gradient）、PPO（Proximal Policy Optimization）、Curiosity-Driven Exploration 等算法在计划中。

新鲜开源：基于TF2.0的深度强化学习平台

最重要的是，TF 2.0 的 nightly 已经发布，这个开源工具也是基于 TF2.0 开发的，所以大家要先安装一下 tf 2.0 nighty 版本。除此之外，还需要安装以下工具和环境：

新鲜开源：基于TF2.0的深度强化学习平台

这个工具还是新鲜出炉烫手的呢，大家赶紧来尝鲜试一下~

地址：https://github.com/danaugrs/huskarl

（本文为AI科技大本营原创文章，转载请微信联系 1092722531）

机器学习强化学习深度学习

安科网

新鲜开源：基于TF2.0的深度强化学习平台

wilbertzhou

wilbertzhou

相关推荐

强化学习到底是什么，它如何运作？

AlphaGo原来是这样运行的，一文详解多智能体强化学习

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

自动驾驶汽车深度学习如何应对挑战?

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

DJL 如何正确打开 [ 深度学习 ]

揭开AI、机器学习和深度学习的神秘面纱

用 Java 训练深度学习模型，原来可以这么简单！

面向深度学习的五大神经网络模型及其应用

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

wilbertzhou