新研究提升人工智能决策算法适用性
当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。论文通讯作者、北京大学人工智能研...
新研究提升人工智能决策算法适用性,复杂系统信息交换成本可降低70...
新研究提升人工智能决策算法适用性,复杂系统信息交换成本可降低70%。近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能...
新研究提升人工智能决策算法适用性复杂系统信息交换成本可降低70%
马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更...
市政府关于表彰常州市第十三次自然科学优秀科技论文的决定
苏沛群、邓志辉、张西良(常州信息职业技术学院)21、主轴-刀柄和刀柄-刀具结合面参数辨识研究王二化(常州信息职业技术学院)22、TemperaturedependentthermopowerandelectricalconductivityofTenanowire/poly(3,4-ethylenedioxythiophene):poly(4-styrenesulfonate)microribbons马仕麟、Hung-taWang(常州机电职业...
4万字解读有关『端到端自动驾驶』的概念混淆、谎言及“路线之争...
1.1.1感知信息的无损传递在此前的报告中,我们提到,端到端的核心定义应为:感知信息无损传递、可以实现自动驾驶系统的全局优化。这个全局优化是如何实现的呢?具体地说,端到端模型通过神经网络的链式法则,从输出端(规划)向输入端(感知)贯通,输出结果可以将误差依次反向传播给所有模块,以最小化整体损失函数为目标,更...
清华大学李克强院士领衔策划——智能网联汽车丨JME特邀专辑(中)
论文亮点:基于值分布式强化学习的安全决策策略:提出了一种结合值分布式强化学习(FPQN)与条件风险价值函数(CVaR)的决策策略,专注于提高无信号灯十字路口场景下的驾驶安全性;决策不确定性估计框架的创新:引入集成学习理论,构建了基于集成FPQN的决策不确定性估计框架(EFPQN),能够实时量化决策风险,提高了系统应对驾驶风险...
...发布2023年度石油石化企业管理现代化创新优秀成果、优秀论文...
2023年度管理现代化创新优秀成果、优秀论文、优秀著作,充分反映了石油石化企业以习近平新时代中国特色社会主义思想为指导,把握新发展阶段,贯彻新发展理念,构建新发展格局,实施创新驱动发展战略,推动实现高质量发展方面的最新实践和工作成就,体现了石油石化企业管理现代化水平和趋势。同时,为其他企业提供了可学习借鉴的成功经验...
市政府关于公布南通市第十三届自然科学优秀学术论文的通知
14.助产士限制性会阴切开临床决策体验的质性研究刘华华(南通市妇幼保健院)、陈志芳、谷金丽15.偏轴载荷下平纹机织复合材料非线性解析模型(Ananalyticalnonlinearmodelforplain-wovencompositesunderoff-axisloads)王艳超(南通大学)、周晔欣、金春花...
「学术|动态」2023年5~8月法学核心论文概览·数据法领域
数据分类分级的刑法保护首先应当区分分类与分级的概念,而在此基础上,分类决定分级保护说将分级保护概念置于形式化地位,并不可取。刑法应当塑造分类和分级保护的独立关系理论,明确数据分类保护的内容属性和分级保护的危害属性的划分标准。类别保护的既有混淆模式容易导致定罪量刑的偏差和错乱,刑法应当构建信息数据和系统数据...
追问weekly | 过去一周,脑科学领域有哪些新发现?
阅读论文:认知科学新型神经网络RTNet展示人类感知决策特征乔治亚理工学院的研究团队在DobromirRahnev教授的带领下,致力于将人类决策科学应用于机器学习领域,以期开发出更为可靠的神经网络模型。该团队发表在NatureHumanBehaviour上的最新研究,展示了如何使神经网络RTNet在决策过程中表现出人类特征。