普林斯顿大学王梦迪:从基础理论到通用算法,看见更大的AI世界观
2021年12月23日 - 雷锋网
王梦迪与叶荫宇等人合作,结合经典的价值迭代算法,以及样本与方差缩减技巧,首次提出了能基于样本精确解决MDP的最优快速收敛算法,将马尔可夫决策链中的计算复杂度与样本复杂度做到了最优。他们的一系列工作(如“Near-OptimalTimeandSampleComplexitiesforSolvingMarkovDecisionProcesseswithaGenerativeModel”)...
详情
NIPS 2018 腾讯 AI Lab 入选 20 篇论文,含 2 篇 Spotlight
2018年10月25日 - 网易
研究者还发展了该方法的一种方差减小的变种,在强凸条件下可以证明它具有线性收敛性。研究者使用logistic损失函数进行了求解分类问题的数值实验,结果表明新方法在高维问题上的收敛速度优于SGD、SVRG、SAGA等经典算法。每次迭代成本为O(1)的随机原始-对偶方法(SPD1)使用了方差缩减的SPD118.方差缩减的...
详情