OMNIVERSE 篇外-Ubuntu双系统安装可随意转载Update2024.11.10 一、背景 在多智能体强化学习平台SMAC上,需要用Lin 阅读更多… 由ouyangshixiong,3年2周 前
培训课程 Chapter 07 多智能体强化学习基础本教程讲解多智能体强化学习的理论基础。 可随意转载! 多智能体强化学习的由来? 理论上使用马尔科夫决 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 12 并行强化学习A2C算法实战手机游戏AI实战项目中,Agent速度是非常慢的,因此并行能力十分重要,本文介绍并行AI算法A3C/ 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 03 Reward和GameOver算法开发讲解reward如何设计。 禁止转载,侵权必究!Update 2020.12.14 前言 前面系列教 阅读更多… 由ouyangshixiong,4年4年 前
培训课程 Chapter 01 基于Flask的minicap开发基于minicap实时推送手机屏幕,用Flask自建手机游戏强化学习训练环境。 禁止转载,侵权必究! 阅读更多… 由ouyangshixiong,4年2年 前
培训课程 Chapter 11 PyGame-FlappyBird实现基于PyGame实现FlappyBird中的强化学习(基于DQN),自动玩游戏。 禁止转载,侵权必究 阅读更多… 由ouyangshixiong,4年3年 前
培训课程 Chapter 10 CartPole-DDPG算法实现DDPG是最简单、最经典的Actor_Critic算法之一。它解决了DQN无法处理的连续动作空间上的 阅读更多… 由ouyangshixiong,4年3年 前