高斯混合模型:GMM和期望最大化算法的理论和代码实现
我们可以通过将不同分量数的GMMs拟合到数据集上,然后选择AIC或BIC值最低的模型,从而找到最优的分量数。总结最后我们总结一下gmm与其他聚类算法的优缺点:优点:与假设球形簇的k-means不同,由于协方差分量,gmm可以适应椭球形状。这使得gmm能够捕获更多种类的簇形状。由于使用协方差矩阵和混合系数,可以处理不同大...
广发宏观 | 如何对GDP进行月度估算
这一模型的缺点在于拟合优度有所下降,需要进行误差调整;而优点相当于以此为代价换取提前15天左右的预测,至少可以当作一个环比方向上的参考。沿用方法二中思路建模,将能更高频获得的工增同比扩散指数、社零同步扩散指数、30城商品房销售同比与GDP同比进行ARDL回归,模型解释力92%。这一优点在于利用高频数据,可以在每个...
广发宏观陈礼清:社会消费品零售总额如何预测?
优点是简洁方便地择取了高频数据的有效信息,过滤了高频数据的高波动噪音,缺点是折损了部分有用高频信息。对于预测要求较高的研究者来说,我们推荐使用混频MIDAS模型辅助判断。相比于ARDL模型来说,混频MIDAS模型的拟合优度更高,走势更为贴合;但回测结果更为震荡,上升趋势中有多处反复点,月际之间波动更多。这两点印证了...
Anthropic创始人访谈:Scaling与强化学习,可解释性与AGI安全
损失函数(lossfunction)在机器学习中是指衡量拟合优度的函数,作用是反映模型输出与真实值之间的差异程度,即衡量预测误差;纳入所有样本点的预测误差,提供一个单值代表整体拟合优度;同时训练过程中会根据损失函数值不断地调整模型参数,目的是使损失值最小化,从而得到一个更优的拟合效果。此外还有3个因素:首先是...
AI时代社会科学研究方法创新与模型“过度拟合”问题探索
并且,业已有不少学者发现,除了上述优势外,机器学习方法还是应对量化模型过度拟合问题的有效方法:一方面,相较于传统OLS回归建模缩减偏差引入方差的思路,基于正则化(regularization)方法的机器学习建模技术则通过谋求方差和偏差的平衡来削减模型整体误差,从而解决过度拟合问题,提升模型的预测稳定性和精准度(Atheyetal.,...
国泰君安:未来A股最核心的定价要素是什么?分红
从回归结果来看,线性模型拟合优度为40.8%,调整后R2为37.4%,所有回归系数符号方向与预期符号方向一致,除利率、通胀率和Beta外其余所有解释变量均通过显著性检验(www.e993.com)2024年8月6日。Rf和通胀率低显著性主要是因为仅有三个国家的数据,数据变异度过低。进一步研究发现,大市值公司更符合估值模型。总市值在100亿以上的股票拟合优度提升至45...
未来中国智慧养老服务业发展规模问题的多元线性回归分析
对模型做多重共线性检验以选出最优组合,然后在最优模型上做序列相关性检验和异方差检验以消除问题,最后在修正模型上做统计检验以判断其满足要求与否。通过对模型的研究认为各个解释变量对未来中国智慧养老服务业发展规模的变动关系,归纳整理出最终结论,并依据最终模型给出建议。2文献综述2.1国外研究现状由于...
吴琦来、魏哲远、张瑞楠:公众的转基因认知与信息接触、媒体信任...
在充分考量前文阐述的建模思路的基础上,以这些拟合优度指标为依据,得到了如图2所示的最优拟合。各拟合优度指标的评价标准和本研究所采纳的最优拟合相关指标的数据见表8。除总体卡方检验p值外,其他指标均达标。由于本研究样本量大,总体卡方检验的统计意义不大,国外相关研究认为CFI及RMSEA可作为拟合优度检验的最...
什么才是读懂CPI、PPI的正确姿势?请收好这份物价指标分析手册
第一,数据准确度的问题。统计局公布的CPI环比数据,只保留了一位小数点,与统计局内部的数据肯定会有略微的出入,这种细微的区别在累乘之后被放大了。而且这属于技术上的问题,在实际操作时难以避免。第二,2021年CPI的基期发生了改变。按照统计局的说法,这会对CPI同比产生约0.03个百分点的影响。所以我们会看到1、2月...
【华泰金工林晓明团队】基于量价的人工智能选股体系概览——华泰...
3.机器学习模型进行因子合成:在这个步骤,我们使用机器学习模型(如随机森林、XGBoost、神经网络等)来替代线性模型进行因子合成。相比线性模型,机器学习模型有更大的模型容量,可以综合利用遗传规划挖掘出的线性和非线性因子。针对机器学习模型易过拟合的缺点,我们引入特征选择和时序交叉验证调参的方式来缓解过拟合。