大语言模型会推理吗?丨AI那厮
总而言之,我对大语言模型的基本评价还和[3]中一样:很有用,但不能解决人工智能的基本问题,包括推理。参考文献[1]XAIisintrouble,RosinaOWeberetal.,AIMagazine,45:300-316,Fall2024[2]GSM-Symbolic:UnderstandingtheLimitationsofMathematicalReasoninginLargeLanguageModels,Im...
沉浸式学习:通过虚拟现实转变工程教育的系统文献综述
模拟包括练习语言技能、使用谷歌地球VR探索英语世界、参观工程实验室、学习描述和制作360°视频、参观虚拟科学博物馆。一项调查显示,虚拟现实系统有望改善语言教学,激发工科学生的学习热情。虚拟现实是一项可以追溯到20世纪70年代的创新,在过去几年中越来越受欢迎。“虚拟”和“现实”是“虚拟现实”一词的两个独立部分。
波利亚的数学思想:解题是人类的最富有特征的活动
这不仅是指按公理、定理、定义进行严格证明的能力及用图形或语言表述的能力,而且还包括诸如将观察到的情况加以一般化,作归纳的论证,从类比中进行论述,在一个具体的问题中认出一个数学概念,或者从一个具体问题中抽象出一般的原理等进行“非形式”思维的能力。为此,波利亚提出了三条教学原则:1)促使学生主动学习的...
评估长上下文大型语言模型
多语言性能:大多数基准测试都侧重于英语(CLongEval等基准测试除外,它还包括对中文的评估)。与英语相比,其他语言的性能如何随着较长的上下文而变化?潜在的退化:随着模型处理更多的上下文,某些能力(如编码技能或创造力)是否会受到影响?现实世界的影响:由于模型可以处理整本书籍、个人历史或低资源语言的综合数据...
中文互联网内容真的正在衰退吗?
具体来说,现在英文占到互联网内容的20.4%,中文占到18.9%,西班牙语占7%到9%,其他语言如阿拉伯语、印地语、俄语、法语和葡萄牙语分别占3%到4%。相比W3Techs的数据,这项研究中印地语和中文内容的比重都增加了超过10倍。按这项研究的计算标准,中文内容不仅没有减少,反而在全球范围内持续增长。
...新融资“供不应求”;Anthropic 提出 RAG 改进方法“上下文检索...
据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能(www.e993.com)2024年11月19日。整理:李雯靖、学术君...
罗昕等:演进中的数字身份:交往特征与风险治理
个人信息包括出生日期、籍贯、国籍和各项生物特征例如指纹和虹膜,都是较为常见的数字身份。智能手机、智能电器等成为个人信息收集和应用的重要工具,并实现信息流的同步及共享。因此,数字自我的生产、识别与流通不断实现全时空、全场景的覆盖,个体的身份信息被整合到数字系统中,再由政府或被授权的相关机构以程序方式执行...
排序学习(Learning To Rank, LTR)
1.特征:LTR中的特征是用来描述项目(如网页、商品、新闻文章等)及其上下文信息的一系列属性。这些特征可以是内容相关的(如文本关键词频率)、结构相关的(如链接结构)、或者用户行为相关的(如点击率)等。2.模型:LTR模型利用训练数据中的特征和对应的排序关系来预测项目的相对重要性或相关性。常见的模型有...
吴福元院士:希夏邦马六十年
希夏邦马六十年吴福元希夏邦马,一座完全位于中国境内的8000m以上的高峰(8027m)。1964年5月2日,中国登山队10名登山健儿成功登顶希夏邦马峰。这是人类第一次征服该峰的壮举,因而在世界登山史上留下浓重的一笔。与这次登山活动相伴随的科学考察,也取得丰硕成果。特别是5800m营地高山栎化石的发现,开启了我国青藏...
建议收藏,100篇必读论文|大模型月报(2024.03)
大量实验证明了FlashFace在各种应用中的有效性,其中包括人像个性化、语言提示下的人脸互换、将虚拟人物变成真人等。论文链接:httpsarxiv/abs/2403.17008项目地址:httpsjshilong.github.io/flashface-page/Meta新研究:通过自动提示优化提高文本到图像的一致性文本到图像(T2I)生成模型能够生成美...