预见·科技 | 数据缺陷、受人蛊惑让AIGC变“坏”了？专家：可用模型监督模型|封面天天见

2023-12-28 10:43:00 - 封面新闻

封面新闻记者欧阳宏宇

癌症筛查、拍影视剧、辅助招聘……生成式人工智能正助力各传统行业突破天花板，与此同时，围绕内容安全、个人信息保护、知识产权归属等内生问题也引发了社会担忧。

这些问题产生的原因是什么？应如何进行预防？12月27日，《AIGC治理与实践白皮书》在北京发布，白皮书显示，目前，由于大语言模型具有深度神经网络固有的鲁棒性不足、可解释性缺乏、生成内容可控性较低等缺陷，导致生成式人工智能还存在着较大缺陷。这就需要判断其对人类权益和社会秩序构成的潜在风险，用审慎的态度规划技术发展路径，采取多元协同的方式聚各方合力确保技术在正确的轨道上发展和应用。

对此，专家建议，各界应在突破AI应用天花板的同时，筑牢AI发展防火墙，用AI破解更多社会难题，推动AI惠及更多人。

多因素造成大模型内生风险

需“防火墙+天花板”双管齐下

据了解，白皮书由中国电子技术标准化研究院和阿里巴巴集团联合编写，主要针对生成式人工智能可能存在的风险，从产生原因、治理框架、风险治理和多主体协同敏捷治理等多个方面进行论述。

白皮书显示，生成式人工智能本质上是一个被用户使用的算法服务，从生命周期上，分为模型训练、服务上线、内容生成、内容传播四个阶段。这一算法服务通常由大模型驱动，都离不开算力、数据、算法、生态和人才五个构成条件。

事实上，正是由于这几个构成条件才导致了大模型的内生问题。以模型训练中需要使用的数据为例，数据中原本就存在的风险点以及特定信息缺失都会对大模型引入风险。同时，对指令的遵循还可能让模型被部分用户诱导，从而学习到恶意导致模型输出风险内容。

此外，由于语言大模型属于深度神经网络，也很难摆脱固有的鲁棒性不足、可解释性缺乏、生成内容可控性较低等缺陷。

基于此，白皮书指出，生成式人工智能的风险治理需要贯穿产品的全生命周期，包括模型训练、服务上线、内容生成、内容发布与传播各阶段。

如在训练环节，首先需要对数据筛选和过滤，评测模型的安全性，并且审核算法机制机理。模型产品上线后，服务提供者还需要选择安全有效的模型作为基座构建完整的算法服务。同时，对用户账号、个人信息以及生成的内容进行保护和审核，避免模型被恶意输入和诱导。

大模型未来安全前景乐观

专家：AI应用宜疏不宜堵

面对AIGC带来前所未有的挑战，需要行业前瞻性地应对。在专家看来，AI大模型未来的安全前景仍然乐观。