贵数所上线572个人工智能高质量训练数据集

2024-05-22 12:42:49 - 当代先锋网

近日,贵阳大数据交易所以全国首个数据要素登记行业节点DOID为载体,上线572个人工智能高质量训练数据集,首创数据要素行业稀有地图,为人工智能大模型发展精准赋能。

贵数所上线572个人工智能高质量训练数据集

本次上线的数据集具有五大特点,丰富数据资源汇聚,首批高质量人工智能大模型训练数据集供给方来自中文在线、中国开放数据、拓尔思、海天瑞声、曼孚科技、粟特方舟、国信数据等16家企业和机构,涵盖“数据要素×”金融服务、工业制造、医疗健康、商贸流通等多个重点领域,涉及文字、音频、图片、视频等多种模态,旨在汇聚全面、系统、权威的高质量人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。

“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。”北京中文在线阅读公司执行董事兼总经理杜嘉说,这些数据集对于目前的Ai大模型语料训练、数字图书馆建设、数字教育内容资源建设等可以发挥积极的作用,期待与贵数所协力共赢,共创数据要素新篇章。

贵数所上线572个人工智能高质量训练数据集

权威认证与质量保障,首批挂牌人工智能高质量训练数据集需经过贵州省数据流通交易服务中心审核,并取得数据要素登记凭证,确保数据授权链路清晰,为数据需求方提供可信赖的高质量数据源,提高人工智能大模型训练效率与效果。

数据要素行业稀有地图,贵阳大数据交易所创新性地推出数据要素行业稀有地图功能,对首批挂牌上市的人工智能高质量训练数据集稀缺性和独特性进行科学评估。需求侧方面,数据需求方进入贵阳大数据交易所平台,查找垂直行业高质量训练数据集一键搜索精准触达,结合自身需求选购标准数据集或进行定制化数据集采购。供给侧方面,数据要素行业稀有地图可以为数据提供方展示数据集在垂直行业的需求程度,指引数据商在数据集稀缺行业填补市场空白。

高端定制化服务,除汇聚标准人工智能高质量训练数据集外,贵阳大数据交易所提供高端定制化数据集需求撮合服务,可根据数据需求方个性化需求,定制专属数据集,满足人工智能模型训练要求。

高质量数据集激励计划,支持各类市场主体通过数据交易平台提供高质量数据集,为开发、训练、应用大模型提供支持,每年安排资金总额不超过500万元,对训练使用量、数据质量等综合排名前10的经营主体给予奖励。

贵州日报天眼新闻记者方亚丽

编辑朱登芳

二审李姗

三审岳振

今日热搜