林爱珺 常云帆 | 人工智能大模型价值对齐的人文主义思考
“如果人工智能拥有了拟人化的情感、欲望和价值观,必然更为危险,因为人的欲望和价值观正是一切冲突的根源。”一方面,价值对齐的参照系是具有人性弱点和局限性的人类,这可能导致一些不利因素被引入人工智能系统中。另一方面,人类世界的道德标准很多时候并不是绝对清晰,存在着灰色地带,比如经典的伦理学困境——“电车难题...
ACL 2024 | MODPO:大语言模型的多目标对齐
图1:不同方法在安全对齐(左)和长篇回答(右)任务上的帕累托曲线表1:MODPO和MORLHF的GPUhours对比参考文献[1]OuyangL,WuJ,JiangX,etal.Traininglanguagemodelstofollowinstructionswithhumanfeedback[J].Advancesinneuralinformationprocessingsystems,2022,35:27730-...
周日直播·大模型安全与对齐读书会收官圆桌:人工智能风险红线声明
在集智x安远AI大模型安全与对齐读书会的最后一期,我们邀请到了来自价值对齐、可解释性、对抗鲁棒性、模型评估等不同领域等学者——段雅文(安远AI),陈欣(苏黎世联邦理工)与陈奕群(上海交大),在北京时间5月5日15:00-16:00,以圆桌论坛的形式共同展开对AI风险红线共识声明的探讨。内容简介AI系统有哪些不应该被...
AI对齐是控制论还是博弈论?
这种思路假定,AI系统所真正应对齐的目标,其对人类而言是清晰明了的,而问题仅在于有效地确保这一目标被AI所执行,确保错误规范和错误泛化都不会发生。这一进路的优势在于它的简洁性,通过把问题的范围缩小而获得了更高的实际可行性——RLHF这一最成熟方法归属于这一类进路,这绝不是巧合。但同时,它也忽略了...
CAAI名誉理事长李德毅等:机器认知四要素说
参考文献[1]孙瑞雪.完整的成长:儿童生命的自我创造[M].第2版.北京:中国妇女出版社,2014:25-41.[2]吴军.文明之光[M].北京:人民邮电出版社,2014:52-54.[3]DESCARTESR.Thephilosophicalwritingsofdescartes[M].Cambridge:CambridgeUniversityPress,1985:65—67....
走出误区:探索GnRHa治疗对CPP儿童BMI的影响
图2.GnRHa治疗对不同体重患儿BMI短期影响的森林图长期结果显示,CPP患儿达到成人身高后,BMI-SDS恢复到基线水平CPP患儿达到成人身高(AH)后,BMI-SDS恢复到基线水平(WMD=-0.03,95%CI:-0.39-0.32;P=0.815),这提示GnRHa治疗对BMI的影响会随着儿童的成长而消失(www.e993.com)2024年11月11日。
PRGdb:植物R基因数据库
基于BLoSuM62矩阵计算不同命中的对齐分数。对HMMs进行了更新(除了CNL和TNL类),并添加了三个新的蛋白质类:LYK,LYP和LECRK,以及所有其他非规范结构域组合。定义了DRAGO3的最小得分阈值,并分别使用COILS2.2和TMHMM2.0软件对CC域和TM域进行了相同的预测。
Nat. Commun全面解读:钙钛矿光电探测器用于抗干扰光通信
五、参考文献Min,L.,Sun,H.,Guo,L.etal.Frequency-selectiveperovskitephotodetectorforanti-interferenceopticalcommunications.NatCommun15,2066(2024).httpsdoi/10.1038/s41467-024-46468-5学术交流QQ群知光谷光伏器件学术QQ群:641345719...
从“智能涌现”到“超人类”,通往AGI巅峰的终极设想
??图3:不同自主等级达成的AGI层次,以及其可能引发的风险。图源:参考文献12,由追问译OpenAI的观点:AI发展及其对社会的影响今年更早些时候,OpenAI的CEO萨姆·奥特曼(SamAltman)在他的博客文章PlanningforAGIandBeyond[12]里,探讨了AGI对社会、技术和伦理的潜在影响,并强调了慎重规划和负责任的发展...
Sora:大型视觉模型的背景、技术、局限性和机遇综述 【官方论文】
通常,这些能力的出现不能通过从小规模模型的性能外推来直接预测。虽然许多LLMs,如ChatGPT和GPT-4,展示了新兴能力,但直到Sora的出现,展示类似能力的视觉模型还很少。根据Sora的技术报告,它是第一个展示确认新兴能力的视觉模型,标志着计算机视觉领域的一个重要里程碑。