海外文献推荐 第264期
此外,多空组合投资收益的样本标准差平均值约为做空超额收益的70%,表明相比做空收益,多空收益提供了更敏锐的预测信号。4.样本外结果在构建样本外预测时,本文使用完整样本区间的前10年(如1970-01至1979-12)作为初始样本内估计期。接下来的五年(如1980-01至1984-12)作为预测的初始样本外保留期,因此1985-01至2017...
方差与标准差
它反映了样本中各个观测值到其均值的平均离散程度;标准差(standarddeviation)是方差的平方根。方差与标准差的计算公式见下表。需要指出的是,从方差看,总体方差的分母为n,而样本方差的分母却为n-1(自由度),这是因为当我们用n-1为自由度的样本方差去估计总体方差时,它恰好是的无偏估计量。为什么样本标准...
参数估计
区间估计就是根据估计可靠程度的要求,利用随机抽取的样本的统计量值确定能够酸辣总体参数的可能敬意的一种估计方法。它是包括样本统计量在内的一个敬意,该区间通常是由样本统计量加减估计标准误差得到的。样本均值在总体均值一个正负标准差的区间内的概率为68.27%,在两个正负标准差的区间内的概率为95.45%,在三个正负...
入门| 贝叶斯线性回归方法的解释和优点
方差是标准差σ的平方(乘以单位矩阵,因为这是模型的多维表示)。贝叶斯线性回归的目的不是找到模型参数的单一「最佳」值,而是确定模型参数的后验分布。不仅响应变量是从概率分布中生成的,而且假设模型参数也来自于概率分布。模型参数的后验分布是以训练的输入和输出作为条件的。其中,P(β|y,X)是给定输入和...
AI时代社会科学研究方法创新与模型“过度拟合”问题探索
OLS方法本质上是通过控制偏差项数值来调整模型总体误差。但随着模型中预测变量的增多,模型的方差项数值会因此而增大,导致过度拟合现象发生,“过拟合现象会导致模型在高估回归系数的同时低估其标准误,容易导致模型中部分无关联的冗余变量被发现存在显著的预测作用,模型得到的结果可能仅适用于当前样本而无法推广到总体”(...
中证金牛丨私募专题研究——量化多因子模型的构建与业内实践
3)残差异方差分析如果回归的残差项具有不同的方差,则称回归模型存在异方差(www.e993.com)2024年8月1日。如果存在异方差,则传统的最小二乘回归得到的参数估计量不是有效估计量,所以在进行多元线性回归之前必须进行残差的异方差分析。根据Barra的文档,可以采用个股流通市值的平方根作为权重进行加权最小二乘法回归,经实践在大部分截面期上可以消除...
100+数据科学面试问题和答案总结 - 基础知识和数据分析
方差:方差是由于复杂的机器学习算法在模型中引入的误差,模型会从训练数据集学习噪声,在测试数据集上表现很差。它会导致高灵敏度和过拟合。通常,当增加模型的复杂性时,会看到由于模型中较低的偏差而导致的误差的减少。然而,这种情况只会在特定的点发生。当模型变得更复杂时,最终会过度拟合型,因此你的模型将开始变...
用树模型提取分析师预期数据中的非线性alpha信息
1.提升树模型可以提取数据中的alpha信息,用模型预测值构建的策略在全时段样本中有效、稳定;2.提升树模型的预测值和线性模型预测值历史相关性均值为50%。两个模型呈现出不同的特点,相比较而言,线性模型更适合大市值股票,提升树模型则更均衡。3.等权使用提升树模型和线性模型,比单独使用线性模型效果更好,对...
三分钟看完计量经济学!
11.最小样本容量:即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。12.异方差性:对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。13.异方差性的后果:(1)参数估计量非有效(2)变量的显著性检验失去意义(3)模型的预测失效...
国内外燃油价格关联度及动态滚动预测模型研究
。诊断统计量为:。式中和分别上述模型最小二乘法回归方程中的残差的平方和,T是时间序列的样本数。在置信概率α下,若,则拒绝假设,认为对有因果关系。由于因果关系检验对滞后阶较为敏感,在实际检验中,根据AIC,SC准则,选取最佳滞后阶数为2。(限于篇幅具体检验结果省略,备索)...