「LSTM 之父」亲笔万字长文,只为向世人证明:深度学习不是在母语为...
2019年11月12日 - 网易
其中包括:第一个强化学习(RL)神经经济学方法(NeuralBucketBrigade)[BB1][BB2]、用于局部时空循环神经网络的学习算法[BB1]、具有端到端可微子目标生成器的分层强化学习(HRL,详见第10章)、通过两个被称为控制器C和世界模型M的循环神经网络组合进行强化学习和规划、顺序注意力学习神经网络、学着...
详情
其中包括:第一个强化学习(RL)神经经济学方法(NeuralBucketBrigade)[BB1][BB2]、用于局部时空循环神经网络的学习算法[BB1]、具有端到端可微子目标生成器的分层强化学习(HRL,详见第10章)、通过两个被称为控制器C和世界模型M的循环神经网络组合进行强化学习和规划、顺序注意力学习神经网络、学着...