亿元级IT行业生态链
一站式解决方案提供商

24小时免费咨询电话
010-52725243

新闻资讯

AJIA NEWS

Google 开源新型强化学习框架 Dopamine

来源:开源中国社区 发布日期:2018-08-29

Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 Machado 等学者给出的建议,使用街机学习环境(Arcade Learning Environment)标准化经验评估。

基准测试

对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的完整训练数据,包括Arcade Learning Environment 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供一个网站,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。

阿甲 科技 Google 开源新型强化学习框架 Dopamine

越来越多的企业与软件加入到开源的行列,对于开源企业而言,可以不断获取竞争优势、降低开发成本,尤其有一些企业,将开源和自由软件的承诺放在其核心价值观之中;而对于开发者而言,可以加入到软件的不断优化之中,这对于阿甲科技研发团队的程序员而言,一方面提高开发效率,降低开发成本,为用户提供更好的解决方案,另一方面也是对自己能力提升的推动!

免责声明:本文由小编转载自网络,旨在分享提供阅读,版权归原作者所有,如有侵权请联系我们进行删除。

阿甲科技

欢迎访问阿甲科技集团官方网站!