关于向社会公开征求《可信数据空间发展行动计划(2024—2028年...

2024年10月21日 - 网易

指导可信数据空间运营者建立共建共治、责权清晰、公平透明的运营规则,探索构建数据价值评估模型,按照市场评价贡献、贡献决定报酬的原则分配收益。支持可信数据空间运营者与数据开发、数据经纪、数据托管、审计清算、合规审查等数据服务方开展合作,打造可信数据空间发展的良好生态。三、开展可信数据空间培育推广行动(四)积...

详情

人工智能时代新闻媒体的责任与使命

2024年10月14日 - 中国法院网

围绕人工智能发展、安全、治理等问题,《倡议》提出了“以人为本”“智能向善”等基本原则,为解决人工智能治理难题贡献了中国方案。????人工智能时代,新闻媒体面临哪些机遇与挑战?推动智能向善,新闻媒体应该如何履行职责使命?围绕这些问题,新华社国家高端智库课题组以中、英、法三种语言面向全球新闻媒体机构开展问卷调...

详情

加快建设人工智能大模型中文训练数据语料库

2024年7月23日 - 新浪

无效语料过多、缺乏高质量数据,导致人工智能语料库的整体质量较低。首先,数据源质量参差不齐。网络数据生成于不同渠道,如来自用户生成、社交媒体、开放数据平台等,不同来源渠道的数据质量具有较大差异,不加区分统一用于数据训练导致语料库质量较低。其次,数据真实性难以验证。互联网作为包容开放的数据平台,并未建立起针...

详情

丁道勤:生成式人工智能训练阶段的数据法律问题及其立法建议 |...

2024年9月29日 - 网易

CNIL还将继续设计AI系统和构建机器学习数据库的工作,提供具体建议,以期逐渐解决一系列问题,包括:为了训练数据库构建和再使用的目的而使用科研系统;目的原则在通用AI和大型语言模型等基础模型中的应用;界定解释组建数据库的主体(使用数据库训练模型的主体和使用模型的主体)间分享责任的承担。CNIL发布《公开数据的共享和再...

详情

国家数据局征求意见:到2028年建成100个以上可信数据空间

2024年10月18日 - 金融界

详情

方案全文来了!北京教育领域人工智能应用工作方案发布

2024年10月24日 - 新浪

通过智能推送+人工辅助的方式构建面向未来教育的新型“家长学校”,整合家国情怀教育、亲子沟通教育、学习成长教育、危机应对教育等资源,配套教育政策、育人方法理论与成功案例,开展大模型专业语料库训练,为家长提供泛在、精准的学习教育服务,协同共助学生成长(www.e993.com)2024年11月19日。

详情

语料筑基创造智能未来

2024年10月11日 - 百家号

因此，企业利用语料库进行模型训练的原则应该取决于自身所要发展的方向以及所应用的场景。也就是说，大模型语料应该着重关注能够应用到哪些场景中，并满足这些场景下的特定需求。例如，用大模型制作PPT，关于PPT文本和模板数据的获取，就会涉及很多专业问题。“大模型训练第一阶段主要是进行基础模型训练。基础模型相当于...

详情

国家数据局:到2028年建成100个以上可信数据空间

2024年10月18日 - 智通财经网

指导可信数据空间运营者建立共建共治、责权清晰、公平透明的运营规则,探索构建数据价值评估模型,按照市场评价贡献、贡献决定报酬的原则分配收益。支持可信数据空间运营者与数据开发、数据经纪、数据托管、审计清算、合规审查等数据服务方开展合作,打造可信数据空间发展的良好生态。

详情

徐宇翔|生成式人工智能发展背景下的金融消费者个人信息保护问题研究

2024年9月20日 - 上观

生成式人工智能的生成机制本质上是“生成型预训练语言转换器”,需要技术服务提供者通过各种方式收集海量数据形成语料库,然后通过连接语料库训练模型,使其可以学习并理解人类语言,从而进行交流对话和内容生成。金融业离不开数据收集与分析,涉及大量处理个人信息的活动,生成式人工智能以其庞大的数据处理量和运用模型在一定程...

详情

魏斌|法律大语言模型的司法应用及其规范

2024年9月19日 - 澎湃新闻

因此,检索增强方法在知识丰富度上有所提升,但在知识推理方面仍有不足。知识库的构建需要高质量的语料库和精细的索引机制,如果知识库内容不够完善或索引机制存在问题,会影响检索的精准性,直接导致召回率和命中率降低,使模型的回答准确率下降。4.法律语境理解的局限性...

详情

查看更多

建立语料库的常用工具
建立语料库的注意事项
如何建立语料库语言学
建立语料库的原则
创建语料库的原则包括
创建语料库的原则是什么
建立语料库用什么软件
语料库创建的具体实施步骤
建立语料库
创建语料库的原则有哪些