民生研究联合会议|三中全会决定解读
结论:坚守实物消耗类资产:第一,资源相关:能源(油、煤炭),有色金属(铜、铝、黄金),船运行业(油运、干散、造船);第二,超额收益并不依赖于主动偏股基金配置的内卷+绝对低估值的银行;第三,机构投资者减持较多,阶段性有边际变化的计算机自主可控相关领域;第四,底部有望出清的行业:轨交设备、制冷空调设备。风险提示:...
吴梦成 王东波 黄水清:古农书翻译与知识组织研究
SikuGPT和GujiGPT是南京农业大学提出的分别基于《四库全书》语料和殆之阁语料开发的生成式语言模型,通过因果语言模型(CausalLanguageModeling,CLM)训练而成。AncientGPT,基于GPT-2开发,是一种专注于古文生成的预训练语言模型,利用殆知阁的古文简体字语料库进行补充标点和训练。GPT2_Chinese则是基于15GB的中文语料库训...
大模型在研发效率提升方面的应用与实践 | 新程序员
常用的语料库构建方法有手工采集、自动化采集和混合采集。手工采集适用于小规模、高质量的语料库建设;自动化采集则可以快速地获取大量语料信息;混合采集则是结合前两种方法的优势,以获得高质量且大规模的语料库。做好语料库的管理和维护。为了确保语料库的安全性和可靠性,需要对语料库进行科学的管理和维护,这包括文件...
言治有理|程乐:人工智能发展趋势研判与规范引导思路
与以往的对话式人工智能(如微软小冰)相比,ChatGPT核心能力包括:对问题的理解能力大幅提升,可以实现连续多轮对话;
探寻生成式人工智能算法规制的思路
然而,一刀切要求训练数据和生成结果的真实性可能与生成式人工智能的技术本质存在一定冲突。第三个特点是数据依赖性,这是人工智能一直以来的典型特征,但是呈现了新的形式,例如中文语料库输入不足带来的文化偏见、数据虹吸效应带来的数据泄露风险等,相关法律义务应注意保持与上位法要求的一致性。
从舆情监测升级为舆情预警的思路研究
当前通常采取的研究路径主要是:通过信息技术快速进行文本的预处理,抓取含有情绪表达的文本并拆分,接下来通过人工建立语料库进而训练机器学习实现对情绪的标注和分类判别(www.e993.com)2024年11月6日。当然,还有一种路径是建构情绪情感词典,以此作为基准使用机器进行编码。两者的分歧主要在于人工介入的环节和程度,特别是在汉语情境下,情绪判断常常还需要...
为了读懂你,AI究竟有多努力?
1.一方面是因为语言的规律错综复杂,不是用简单的统计就可以计算出概率的。不同的语言之间语法结构不用,并且同一种语言对于同一个意思有不同的表达方式,同一个表达也可能有不同的理解。我们去建立一个语料库相当于重新为人类语言建立一个百科全书,工作量十分巨大;2.另一个方面的原因是使用语言有特定的语境。
从AlphaGo 到具有人类智慧的 AI 究竟有多远?Fran??ois Chollet...
Chollet:毫无疑问,AI在特定的知名电子游戏中击败人类冠军的成就很大程度上是由报道这些项目的媒体所推动的。如果公众对这些浮躁的,而且很容易被误解为通往超人类通用人工智能的重要进步的「里程碑」不感兴趣,那么研究人员将做些别的事情。我觉得这有点可悲,因为研究应该回答开放的科学问题,而不是产生公关效应。如果我...
英文写作有瓶颈?介绍几个对英文写作有帮助的网站!
2.COCA语料库有时候我们在写作的时候可能不确定某一个搭配或句式是否正确,这种情况下除了查词典外,还可以使用语料库来对表达进行验证,比如COCA语料库。美国当代英语语料库(CorpusofContemporaryAmericanEnglish,简称COCA)是目前最大的免费英语语料库,它由包含5.2亿词的文本构成,这些文本由口语、小说、...
“云南这十年”系列新闻发布会·数字经济专场发布会
全省先后印发“十四五”数字云南、新型基础设施等重点专项规划,出台数字经济、数字政府、新型基础设施等指导意见和实施方案,实施5G、工业互联网、人工智能、区块链以及“智慧+”等产业发展政策,通过不断探索和实践,“数字云南”的建设思路得到进一步明晰,顶层设计进一步完善,政策体系逐步建立健全,为“数字云南”建设奠定了...