11种经典时间序列预测方法:理论、Python实现与应用
1、自回归(AR)模型自回归(AR)模型是时间序列分析中的基础模型之一。它假设序列中的每个观测值都可以表示为其前p个观测值的线性组合加上一个随机误差项。数学表示AR(p)模型可以表示为:其中,是t时刻的观测值,c是常数项,是自回归系数,是白噪声。优势模型简单,易于理解和实现适用于具有短期依赖性的时间...
基于GBRT模型的海洋平台结构裂纹扩展识别 | 科技导报
GBRT算法是一个回归模型,主要用于拟合数值,是一种集成学习算法。提升树主要采用加法模型,主要思想是不断拟合残差,利用梯度下降法拟合残差。GBRT算法是一种迭代的回归树算法,由多棵回归树组成,所有回归树的结论累加起来为最终结果。GBRT算法使用了前向分布算法,其思想是基于当前模型和拟合函数选择合适的决策树函数,从而最...
【视频】多元线性回归模型原理讲解与R语言实例
在进行回归分析时,我们通常需要关注几个重要的诊断指标,以确保模型的准确性和可靠性。这些指标包括异常值和强影响点、异方差、自相关以及多重共线性。异常值和强影响点:异常值可能是由于测量误差、数据录入错误或真实的极端观测所引起的,它们可以显著影响线性回归模型的拟合结果和假设检验的准确性。强影响点不仅具...
华泰金工 | 持有红利底仓、适度超配成长——2024Q4行业投资建议
1)报告涉及的模型均根据历史规律总结,历史规律可能失效,如当市场不相信景气趋势可持续时,行业景气度对股价就不一定有正向影响;2)报告涉及的模型均有其适用的市场条件,无法保证在任何市场条件下均可取得正超额收益,如AI行业轮动模型在市场主线较弱的条件下表现更佳;3)报告涉及的具体行业不代表任何投资意...
【科技自立自强】西安交大科研团队揭示个体、室外温度与健康的不...
(MLR=多重线性回归模型;RF=随机森林模型)与心率的暴露-反应曲线此研究不仅揭示了个体、室外温度与健康的不同流行病学关联,强调了个体温度暴露评估在环境流行病学研究中的重要性,还展示了如何利用容易获取的预测因素构建个体温度暴露模型,为未来精准环境流行病学研究提供了新的思路,并为今后更大规模的人群健康...
NC|进化信息机器学习增强了预测基因与表型关系的能力
研究者使用基因表达值(N-DEGs)作为特征,通过XGBoost回归模型预测NUE性状,最终构建了18个拟南芥模型和16个玉米模型,对应于分析的每个基因型(www.e993.com)2024年10月24日。结果表明,使用进化上保守的N响应差异表达基因显著改善了机器学习模型预测NUE的性能,并且这种改善不是由于基因特征的简单数值减少。此外,基于XGBoost的特征重要性排名和基于edgeR的P值...
检测新环境,上下文领域泛化:理解边际迁移学习的益处和局限
事实上,分层贝叶斯模型已在科学领域的许多方面成功应用,但通常局限于线性模型或广义线性模型(GeneralizedLinearModels,GLMs),优先考虑可解释性而非预测性能。机器学习文献中富含从集合结构数据学习不变摘要统计量的变分方法[Edwards和Storkey,2016;Garnelo等,2018;Kim等,2019,2021;Zeng等,2022]。然而,...
共同推进计量经济学科前沿理论研究及应用
与传统回归分析不同,面板回归模型方法不依赖工具变量的存在性。面板数据的因子模型中,将观测值看作时间序列数据和截面数据,分别对其建立因子模型,并在N>T和T>N的情形下讨论模型的参数估计方法。在非因果方法中,萧政介绍了线性投影(LP)法。基于上述估计方法可得到处理效应的预测值,在N和T的不同情形下,萧政从理论...
深度学习揭秘系列之一:基于量价与基本面结合的深度学习选股策略
??本文是深度学习揭秘系列报告第一篇,因此本文从基础的神经网络理论部分入手,介绍了神经元结构、Relu、Sigmoid等常用激活函数、反向传播算法,以及后文中用到的Adam优化器与Dropout层。??非线性模型更能挖掘量价因子的潜力。本文以开源Alpha158作为量价因子集,以及常见的估值、成长、质量、分析师一致预期等因子作为基...
中金:扩张性再分配政策的识别技术探讨
本文基于中国家庭追踪调查的2018年数据进行了模拟分析,结果表明:①即便是基于传统回归分析的代理家计调查,识别效果也可能优于入户调查、社区评议等传统识别方法;②机器学习算法的表现优于传统回归分析方法,意味着代理变量与目标人群的收入之间很可能存在比较复杂的非线性关系;③基于机器学习的代理家计调查法,不但可以显著...