《自然》科学期刊:人工智能的心理洞察,比较LLMs和人类的心理理论
P值由HolmcorrectedWilcoxon双向测试计算,比较LLM得分(n??=??15LLM观察)与人类得分(讽刺,N??=??50名人类参与者;失礼,N??=??51名人类参与者;暗示,N??=??48名人类参与者;奇怪的故事,N??=??50名人类参与者)。测试按人类表现的降序排列。图1a比较了LLMs与人类参与者在测试电池中所有测试的表...
《基因彩票》第九章:用先天来理解后天|科学|表型|心理学|遗传学|...
心理学家约瑟夫·西蒙斯和他的同事在探讨导致大规模生产虚假研究结果的方法论实践(被称为“P值篡改”)时写道:“每个人都知道[P值篡改]是错误的,但他们认为这只是像乱穿马路一样的小错。”但实际上,“这是抢银行一样的重罪”。注JosephP.Simmons,LeifD.Nelson,andUriSimonsohn,“False-PositiveCitation...
心理学“可重复性危机”,该如何破解?
在测试阶段,声音单独出现小鼠依然会表现出恐惧反应,但闪光出现则不会引发恐惧反应,这说明,声音阻碍了闪光与电击建立联结。这一现象可以使用R-W模型解释,第一阶段的学习已经使得条件刺激1的联结强度达到最大值,第二阶段继续学习也无法继续增大联结强度。累积式的实验记录心理学应该致力于发展和检验基于共识的形式化理...
800名科学家联名主张废除p值!斯坦福教授:没有p值,期刊将充斥“无...
菲舍尔建议,为方便起见,可以考虑将p值设为0.05。对于这一点,他专门论述道:“在判断某个偏差是否应该被认为是显著的时候,将这一阈值作为判断标准是很方便的。”他还建议,p值低于该阈值的结论是可靠的,因此不要把时间花在大于该阈值的统计结论上。菲舍尔的这一建议被越来越多的人所接受,p<0.05逐渐与“统计显著性...
新时代船员心理健康与工作绩效关系的实证研究
表2船员心理健康现状表3船员心理健康现状的组间差异由上可知,在所有的分组中,仅有受教育水平呈现出了显著的特点,其对应的F统计量数值为2.87,P值为0.04,小于0.05的显著性水平,说明在不同的受教育水平分组中,各个组间的心理健康总分具有显著的差异。观察不同分组群体的心理健康总分可知,受教育水平为“本科以上...
经典实验现“信任危机”:心理学“倒退”或许是进步
令人振奋的是,研究者已经开始对以往奉为经典的心理学实验进行反思,并且越来越重视心理学实验的科学性,包括对P值、效应量的讨论,公开研究数据,对心理学实验进行可重复性检验,开展更广泛的合作网络等(www.e993.com)2024年11月1日。简言之,心理学正遵守着“否定之否定”的规律蓬勃发展,而真理也需要一个愈辩愈明的过程。从这个角度来说,经典...
2014年心理学考研真题参考答案及解析
A。语文测验成绩B。数学测验成绩C。工作记忆容量D。游戏模式勤思解析D,学前期男童和女童差异最大的是游戏模式上出现了性别差异,比在其他三方面的差异大。21.在家庭生活中,盈盈的父母在某种程度上接纳了她目前对音乐的喜爱,而盈盈也认同了父母关于学业成绩重要性的看法,这个例证所体现的发展现象是...
超越可重复性危机,我们需要更强大的心理学理论
2014年,艾希(Eich)要求作者们报告充足的统计效力(statisticalpower)和效应量(effectivesize)以取代p值,并补充元分析(meta-anlysis)。艾希也引入了开放科学徽章以激励和奖励那些报告了完整详细的实验、数据和分析内容的作者。琳赛(Lindsay)在艾希的基础上进行了拓展,引入了预注册的直接重复(PreregisteredDirect...
《直觉与理由》:实验语言哲学的转向与未来
因此,实验哲学有两个特点,一个是人民性,我们的哲学立场应该来自于大众。第二是科学性,你要通过科学去验证,你要像心理学家一样,你要做抽样,要做样本分析,要有P值检验。这样一个学科,本身就是跨学科,是跨在哲学和心理学,或者哲学和认知科学之间的,实验哲学是一个跨学科产物。它研究人在面对世界的时候...
【神麻人智】心脏术后的炎症反应扰乱大脑执行功能网络
患者有显著改变的区域被进一步定义为感兴趣区域(ROI)。为了探索这些ROI中的FC值、神经心理学评估的表现和炎症水平之间的关系,先进行了相关分析。然后采用多元线性回归来探讨潜在相关因素与认知表现之间的关系。双侧P值<0.05认为有统计学意义。结果人口统计学和手术变量...