...科技文献与技术情报智能服务平台建设——语料库建设公开招标公告
一、项目基本情况项目编号:0686-24300D033284N项目名称:机械工业信息研究院面向先进制造科技文献与技术情报智能服务平台建设——语料库建设预算金额:90.000000万元(人民币)采购需求:原始语料库及分类体系建设。包括原始资源的筛选、搜集、整合,并进行深度加工,形成指定领域的语料库,建设行业知识体系。并对语料内容...
播客|Vol.35 揭秘语料库:数字时代如何进行法律检索?
法律语料库语言学在司法解释领域内得到了极大的发展,应用在大量的案例分析中。欧盟则更多的是采用解构主义视角,运用谱系分析将语料库语言学的语料数据、技术、方法分别应用于领域法学和法学方法论中。回顾美国及欧洲地区有关法律语料库语言学的发展历程,对我国法学未来发展具有方法论意义。通过借鉴域外司法实践及学术研究...
人民网主流价值语料库首批入选2024“融媒有技”优秀案例
人民网长沙10月16日电10月15日,在湖南长沙2024中国新媒体大会上,人民网主流价值语料库作为人民日报社传播内容认知全国重点实验室参展内容,首批入选2024“融媒有技”优秀案例。2024中国新媒体大会技术应用论坛以“融合创新,智慧传播”为核心议题,旨在结合技术发展的新动向,聚焦于主流媒体的技术革新,为媒体深度融合...
科文相融 新智相生 丨媒体人的福音 人民日报社主流价值语料库深受...
由人民日报社传播内容认知全国重点实验室打造的主流价值语料库,重点建设基础语料、图文语料、问答语料等多种语料,赋能人工智能的价值观对齐,满足全面性、专业性、时效性、导向正确性的要求。现已完成3000多万篇基础语料,17万多道问答语料的建设工作。“人工智能大模型已经成为一种生成式信息传播工具,因此对于大模型价...
语料筑基 创造智能未来
在人工智能的飞速发展中,大模型语料库的建设成为了一个关键环节。语料库作为人工智能,尤其是自然语言处理(NLP)领域中的重要资产,其质量与规模直接影响到模型的性能和应用的拓展。不久前,多家机构联合发布了“语料运营平台1.0”、《语料库建设导则》,以及一批语料产品;上海交通大学生成式人工智能实验室推出了一...
腾讯联合多方发起AI向善语料库共创
近期,由腾讯公司的多个部门联合BottleDream、复旦大学老龄研究院、清华大学无障碍发展研究院,正在发起一项面向全社会的AI向善语料库共创行动:为那些在商业环节里失声的人群和话题,构建一个更具人文关怀的AI语料库,推动AI为人类的积极发展、福祉和幸福发挥更大的价值(www.e993.com)2024年11月18日。8月20日,由联合发起方及相关专家、...
首个语料库建设导则面世!近二十家企业共同发布
首个语料库建设导则面世!近二十家企业共同发布人民网上海7月6日电(记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递...
中国首场语料论坛在沪举行,开启AI新时代
三大领域语料技术白皮书发布。人民网记者王初摄为实现“语料数据资源共建共享”“鼓励多元主体共同推动高水平语料数据要素建设”的目标,库帕思公司会同覆盖多模态数据资源供应、加工、应用和运营全链的近二十家企业共同发布了团体标准《语料库建设导则》。
语料筑基,智生时代 ——2024世界人工智能大会语料主题论坛圆满举办
《高质量生命健康语料技术白皮书》从基础医学、药物研发、临床医学、健康管理、中医中药五个方向确立了生命健康语料库的路线图,创新了从寻源、清洗到标注、测试的工具体系。为实现"语料数据资源共建共享""鼓励多元主体共同推动高水平语料数据要素建设"的目标,库帕思公司会同覆盖多模态数据资源供应、加工、应用和运营全链...
加快建设人工智能大模型中文训练数据语料库
摘要人工智能大模型产业发展的三要素为算法、算力与数据,其中训练数据语料库的质量直接决定了人工智能大模型的能力。中文数据语料总量相较英文数据语料严重不足,同时存在数据采集行为违法风险较高、公共数据开放利用不足、线下结构化数据版权制度不协调、商业采购与合作数据无法确定数据权属等障碍,其已成为制约人工智能...