清华大学李克强院士领衔策划——智能网联汽车丨JME特邀专辑(中)
2024年8月24日 - 网易
基于贝叶斯逆强化学习的奖励函数建模:提出了一种基于贝叶斯神经网络的奖励函数模型,通过近似变分推理和蒙特卡洛方法,克服了人工构造奖励函数的局限性,提高了对复杂驾驶场景的泛化能力;不确定性认知型类人驾驶策略:引入奖励函数的不确定性度量与惩罚机制,提出了不确定性认知型类人驾驶策略,显著提升了驾驶策略的安全性、类人...
详情
最优控制思考错了? What Is Optimal about Motor Control
2024年4月11日 - 网易
这对于感觉运动处理(或学习)的贝叶斯公式没有任何影响,但对于最优性、成本函数和外部拷贝的概念有深远的影响。我们首先回顾主动推理,然后考虑最优控制方案。ActiveInference主动推理主动推理是自由能原理(Friston,2010)的一个推论,它认为行动和感知都在最小化惊奇。简而言之,这种最小化的动机在于解释生物系统如何...
详情