文泉课堂
- 年轻人的新知识课堂。
旗下网站
旗下产品
文泉考试
文泉题库
关注我们
文泉课堂公众号
课程
课程
登录
注册
登录
注册
首页
深度强化学习理论与实践(9787302625544/095306-01)
深度强化学习理论与实践(9787302625544/095306-01)
(0 评论)
价格
5.00元
5047
已收藏
收藏
分享
购买课程
课程概览
课时列表
0 介绍
07:00
1.1节 强化学习的简介
21:36
1.2节强化学习的模型
83:28
1.3节Gym介绍
45:04
2.1节 动态规划简介
14:22
2.2节 值函数与贝尔曼方程
50:28
2.3节 策略评估
45:07
2.4节 策略改进
44:33
2.5节 最优值函数与最优策略
27:06
2.6节 值迭代与策略迭代
26:25
2.7节 动态规划法求解最优策略
26:03
3.1节 蒙特卡罗法简介
14:19
3.2节 蒙特卡罗策略评估
82:19
3.3节 蒙特卡罗强化学习
42:25
3.4节 异策略蒙特卡罗法
73:23
4.1节 时序差分策略评估
83:02
4.2节 同策略时序差分强化学习
41:55
4.3节 异策略时序差分强化学习
32:26
4.4节 n步时序差分强化学习
17:37
5.1节 从感知机到神经网络
29:33
5.2节 深度神经网络
59:39
5.3节 激活函数、损失函数和数据预处理
84:38
5.4节 Pytorch深度学习软件包
103:32
6.1节 线性值函数近似法
83:18
6.2节 神经网络值函数近似法
62:35
6.3节 DDQN算法
11:43
6.4节 PrioritizedReplayDQN
23:24
6.5节 DuelingDQN算法
16:36
7.1节 策略梯度算法的原理
62:21
7.2节 策略梯度定理
27:31
7.3节 蒙特卡罗策略梯度算法
54:37
7.4节 演员-批评家策略梯度算法
33:51
8.1节 A3C
42:29
8.2节 DDPG
32:58
8.3节 PPO
60:32
6-6
6-7
6-8
6-9
6-10
6-11
7-2
深度强化学习理论与实践源码
深度强化学习配套资源
授课教师
文泉课堂
资源管理
最新学员
学员动态
史立勤
开始学习课时
2.2节 值函数与贝尔曼方程
史立勤
开始学习课时
2.1节 动态规划简介
史立勤
开始学习课时
1.2节强化学习的模型
史立勤
开始学习课时
8.2节 DDPG
史立勤
开始学习课时
8.1节 A3C
学
习
中
心
TOP