培训课程 Chapter 12 并行强化学习A2C算法实战手机游戏AI实战项目中,Agent速度是非常慢的,因此并行能力十分重要,本文介绍并行AI算法A3C/ 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 03 Reward和GameOver算法开发讲解reward如何设计。 禁止转载,侵权必究!Update 2020.12.14 前言 前面系列教 阅读更多… 由ouyangshixiong,4年4年 前
Android Python操作Android-篇外本章介绍如何使用Python来操作Android App。 禁止转载,侵权必究! 前言 为了搭建Py 阅读更多… 由ouyangshixiong,4年4年 前
培训课程 Chapter 01 基于Flask的minicap开发基于minicap实时推送手机屏幕,用Flask自建手机游戏强化学习训练环境。 禁止转载,侵权必究! 阅读更多… 由ouyangshixiong,4年2年 前
培训课程 Chapter 11 PyGame-FlappyBird实现基于PyGame实现FlappyBird中的强化学习(基于DQN),自动玩游戏。 禁止转载,侵权必究 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 10 CartPole-DDPG算法实现DDPG是最简单、最经典的Actor_Critic算法之一。它解决了DQN无法处理的连续动作空间上的 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 09 CartPole-DQN算法实现CartPole又叫倒立摆。小车上放了一根杆,杆会因重力而倒下。为了不让杆倒下,我们要通过移动小车, 阅读更多… 由ouyangshixiong,4年3年 前