大模型主要安全问题是什么?中国科学院院士何积丰:隐私保护和价值观对齐

2023-09-07 10:35:55 - 新浪科技

新浪科技讯9月7日上午消息,2023外滩大会上,中国科学院院士何积丰发言指出,大模型当前面临的安全问题主要涵盖两方面,分别是隐私保护和价值观对齐两大难题。

第一,隐私保护问题,在未经允许的情况下,大模型是否会收集、使用和泄露个人信息。

第二,价值观对齐问题,使得大模型的价值观与人类的价值观相对齐。使得大模型按照设计者的意愿行事,而不作出超出意图之外的举动。

何积丰指出,在价值观对齐方面,由于人类社会的价值观是多元化的,且有用的人工智能与无害的人工智能往往存在冲突,这导致了大模型价值观对齐存在很大的难度。因此,能否提供高质量的训练数据、同时让人工智能技术通过微调、精调满足人们的需求,仍是非常重要的。

何积丰强调,利用反馈修改强化技术来进行人工智能的价值观对齐,是非常重要且有效的技术路径。(文猛)

大模型主要安全问题是什么?中国科学院院士何积丰:隐私保护和价值观对齐

今日热搜