量化大势研判:产业周期变革与资产全局比较 | 民生金工
但仔细观察我们会发现,除了线性拟合得到的趋势线以外,ROE-DP散点图中还隐藏着另一条趋势线,也就是ROE没那么高但DP很高的行业,这些行业的高股息大概率是由于股价低带来的。这两种类型的高股息即我们在第一节图1中所示的“质量红利”和“价值红利”。从相对表现而言质量红利在牛市表现更佳而价值红利在熊市表现更佳...
【视频】多元线性回归模型原理讲解与R语言实例
下图是残差直方图,从图上可以发现,所有点基本上是随机地分散在0周围,密度曲线近似为正态分布。右边是正态pp图,其意义与左边类似;表明随机误差项是服从正态分布的,其原因是正态qq图近似地可以看成一条直线;.拟合效果图形展示以原始数据作为x轴,回归拟合值为轴作图,在xy面上的点用直线连接见图。原始图和...
极坐标与分域和PB-ROE研究
从以下各图中的各时期平均IC结果来看,规律与图表16中的统计类似;但连续的美林时钟极角下,IC的变动规律可以被拟合得更加精细。3.3结合美林时钟极角的ROE因子重构鉴于以上规律,我们希望根据美林时钟所在的具体位置(即美林时钟极角),结合杜邦分析对ROE因子进行重构。具体而言,对于每个时间点,我们根据该时点对应的美林...
探究基差策略在企业套保过程中的量化规则
检验数据和前期样本出现基本一致的表现,残差平方和依然较大,表示因变量对预测值的总偏差较大,意味着拟合的效果还不是最理想状态。表为新的3组样本显著性检验到这里若继续从线性回归的角度去纠正差异,就需要通过残差散点图去寻找异常点,或者通过最小二乘法、梯度下降法等去求解最小均方差,进而剔除或合并异常值,...
数据并非都是正态分布:三种常见的统计分布及其应用
4、处理异常值正态分布的假设有助于识别异常值。在正态分布的假设下,大多数数据点应聚集在均值周围,只有少数数据点会落在分布的尾部。如果观察到的残差远离预期的正态分布,这可能表明模型中存在异常值或模型设定错误。5、置信区间和预测正态分布的假设允许构建围绕回归线的置信区间和预测区间。这些区间为基于模型...
自回归模型的优缺点及改进方向
残差分析作为首要步骤,通过考察模型预测值与实际观测值之间的偏差——即残差,来直接反映模型的拟合精度(www.e993.com)2024年10月23日。一个理想的模型应呈现出随机分布、无明显模式的残差,任何系统性偏差或特定模式的出现都可能是模型欠拟合或存在其他问题的信号。自相关函数(ACF)是揭示模型残差中是否存在剩余自相关的方法之一。它通过测量不同滞后...
基于ARCH类模型的当归价格指数波动影响因素分析及趋势预测
3.1基于当归价格指数静态拟合的趋势预测在建立的GARCH(1,1)模型基础上,对2022年8月—2023年7月的当归价格指数进行拟合预测分析。基于表7中的价格指数结果拟合可以发现,2022年8月—2023年7月,整体平均拟合误差为7.18%,多数月份实际价格指数与拟合值误差在5%左右,拟合效果较好。但2023年的2月、3月以及7月则出现...
“AI”科普丨Transformer架构图解最强教程!
如下图所示:每个编码器的结构都是相同的,但是它们使用不同的权重参数(6个编码器的架构相同,但是参数不同)Encoder编码器组成编码器的输入会先流入Self-Attention层。它可以让编码器在对特定词进行编码时使用输入句子中的其他词的信息(可以理解为:当我们翻译一个词时,不仅只关注当前的词,而且还会关注其他词的信...
AI时代社会科学研究方法创新与模型“过度拟合”问题探索
过度拟合和欠拟合是回归和分类中的常见问题。如图1b所示,根据观测数据集的散点图分布可以有线性拟合、二项式拟合和多项式拟合等多种思路。其中,多项式方案(虚线)在观察数据集中的拟合效果最佳,但模型参数受到极端值噪声的严重影响,存在过度拟合风险。相比之下,线性方案最简单,但对观测样本中的拟合效果较差,存在欠...
excel的曲线拟合原理是什么【详解】
有许多衡量拟合优度的标准,最常用的一种做法是选择参数c使得拟合模型与实际观测值在各点的残差(或离差)ek=yk-f(xk,c)的加权平方和达到最小,此时所求曲线称作在加权最小二乘意义下对数据的拟合曲线。有许多求解拟合曲线的成功方法,对于线性模型一般通过建立和求解方程组来确定参数,从而求得拟合曲线。至于非线性...