用“图灵测试”检验AI尤其是大语言模型,真的科学吗?
ConceptARC的理念是测试计算机解决方案的稳健性,方法是让计算机推导出一个概念的规则,然后将该概念应用到新任务中。论文链接:httpsarxiv/pdf/2305.07141例如,她可能会向人工智能展示一个网格,在这个网格中,黄色方格位于蓝色方格之上,而这个蓝色方格又位于黄色方格之上。接着可能是一个红色圆圈在一个绿色圆...
国家为什么会失败?来自2024年诺贝尔经济学奖得主的解释
也就是检验国民经济变量与受教育程度的关系,验证“不同教义对国家经济的长期影响”。至此,这个阿西莫格鲁式的“持久效应研究”基本完成了,剩下的是各种稳健性检验。(二)国家的失败当然,阿西莫格鲁的研究远比上述例子复杂,研究范围也更广,但他的所有学术故事都遵循一个基本的范式:1,国家和地区的兴衰成败,不是...
用「图灵测试」检验AI尤其是大语言模型,真的科学吗?
他说:「这是一场无法练习的游戏。当GPT-4通过律师资格考试时,很可能是因为它见过足够多与考试相似的例子,所以它能给出合理的答案,而不需要对法律有任何内在的理解。」「这不是一个完美的测试。它有很多局限性和缺陷,」Chollet说。例如,任务中存在足够多的冗余,在举出足够多的例子后,测试对象可能会对答案...
资本投入取值:取存量还是流量,用资产还是资本?
罗朝阳和李雪松(2020)主要使用的是2008—2017年发债企业的数据,该文通过稳健性检验计算了所有非金融类上市企业LP方法计算的全要素生产率。为了方便进行计算结果的比较,本文仍然按照罗朝阳和李雪松(2020)的取值范围(使用全部A股非金融类上市企业的数据)和样本的取值时间(2008—2017年)进行全要素生产率的计算(见表1)。...
英伟达两篇最佳论文、浙大周昆获时间检验奖,SIGGRAPH 2024奖出炉
论文简介:该研究开发了一种无网格蒙特卡罗方法,用于求解边值问题,例如具有狄利克雷、诺依曼和罗宾边界条件的泊松方程。与传统的PDE求解器不同,该方法不需要体积网格划分或全局求解。它具有稳健性、并行性、可扩展至复杂的几何形状,并且允许依赖于视图的评估。
地方政府债务置换与企业杠杆率分化:兼论优化地方债务结构
本部分基于模型(1)、(2)分析债务置换对杠杆率分化的影响,并通过控制地区*年份固定效应、倾向得分匹配等方法进行稳健性检验(www.e993.com)2024年10月18日。在此基础上,我们分别从企业层面和地区层面展开异质性分析。(一)主回归结果表1为主回归结果,第(1)、(3)、(5)列的结果显示,NonSOE*Shock对企业总杠杆率、短期杠杆率和长期杠杆率的回归...
【广发金工】2024精选深度报告系列之六:基于多期限残差的因子选股...
本报告测试了不同平均窗口长度下因子的表现。从RankIC来看,表现最好的是窗口长度一周的残差动量改进因子,其RankIC均值为-4.71%。4.2调仓周期本报告测试了不同调仓周期下的因子表现,降频后,因子的单调性和风险收益表现均显著下降。五、稳健性检验...
从分险、赋能到激活竞争:农业政策性担保机构何以降低农贷利率
(三)稳健性检验与内生性问题处理本文通过替换变量、调整样本年份进行稳健性检验,采用工具变量法处理内生性问题。1.替换被解释变量和机制变量。考虑到农业政策性担保机构会向农户收取一定的担保费,本文将农业贷款利率与担保费率加总构成农户融资成本,将其作为稳健性检验的被解释变量。此外,由于城市商业银行、农村商业...
下半年十年期国债走势的分析 ——基于VAR模型的分析
1.1、变量稳健性检验与模型滞后阶数选择如表所示,我们对模型中的被解释变量(10年期国债到期收益率)和解释变量(成长、质量、价格、资金面宏观因子)进行平稳性检验。经过差分处理后,各变量均通过95%显著水平的协整、单整检验,变量可以代入模型进行回归。图表20:VAR模型核心变量平稳性检验...
贾康 郭起瑞 | 数字普惠金融对农业新质生产力的影响研究
表4列(1)汇报了第一阶段工具变量结果,其系数在1%的显著性水平上为正,同时,在不可识别检验和弱工具变量检验中,均拒绝了原假设。列(2)汇报了数字普惠金融对农业新质生产力的影响依然显著,排除由于反向因果和遗漏变量所可能导致的估计误差。2.稳健性检验...