Skip to content

Latest commit

 

History

History
75 lines (41 loc) · 3.23 KB

RELEASE_CN.md

File metadata and controls

75 lines (41 loc) · 3.23 KB

MindSpore Reinforcement Release Notes

View English

MindSpore Reinforcement 0.7.0 Release Notes

主要特性和增强

  • [BETA]重构环境接口,接口支持环境同步异步执行。
  • [BETA]提供环境Wrapper,提供将Python环境封装成MindSpore支持的环境 (PyFuncWrapper),动作归一化(ActionNormWrapper)等功能。

贡献者

感谢以下人员做出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任何形式对项目提供贡献!

MindSpore Reinforcement 0.6.0 Release Notes

主要特性和增强

  • [BETA] 支持GAIL(Generative Adversarial Imitation Learning Jonathan Ho et al..2016) 算法。算法解决了HalfCheetah环境问题,支持CPU,GPU和Ascend后端设备。
  • [BETA] 支持C51(Marc G. Bellemare et al..2017) 算法。算法解决了CartPole环境问题,支持CPU,GPU和Ascend后端设备。
  • [BETA] 支持CQL(Conservative Q-Learning Aviral Kumar et al..2019) 算法。算法解决了Hopper环境问题,支持CPU,GPU和Ascend后端设备。
  • [BETA] 支持AWAC(Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair et al..2020) 算法。算法解决了Ant环境问题,支持CPU,GPU和Ascend后端设备。
  • [BETA] 支持Dreamer(Danijar Hafner et al..2020) 算法。算法解决了Walker-walk环境问题,支持GPU后端设备。

贡献者

感谢以下人员做出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任何形式对项目提供贡献!

MindSpore Reinforcement 0.5.0 Release Notes

主要特性和增强

  • [STABLE] 增加现有接口的中文API文档。
  • [STABLE] 增加强化学习多智能体算法QMIX。

Contributors

感谢以下人员做出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任何形式对项目提供贡献!

MindSpore Reinforcement 0.3.0 Release Notes

主要特性和增强

  • [STABLE] 支持DDPG强化学习算法

接口变更

后向兼容变更

Python接口
  • 修改了ActorAgent类的接口。它们的方法名被修改成act(self, phase, params)get_action(self, phase, params)。除此之外,删除冗余方法(Actor类中的env_setter, act_init, evaluate, reset_collect_actor, reset_eval_actor, update, 和Agent类中的 init, reset_all)。修改配置文件中的层级结构,将actor目录下的ReplayBuffer移出作为algorithm_config中的一个单独键值。(Rearrange API PR !29)

  • 增加了Environment类的虚基类。它提供stepreset方法以及5个space相关的属性(action_space, observation_space, reward_space, done_spaceconfig)

Contributors

感谢以下人员作出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任意形式对项目提供贡献!