为什么回归问题用 MSE?
如果是几年前学生问我这个问题,我会回答:“因为做回归的时候的我们的残差有正有负,取个平方求和以后可以很简单的衡量模型的好坏。同时因为平方后容易求导数,比取绝对值还要分情况讨论好用。”但是经过了几年的科研以后,我觉得这样的回答太过于经验性了,一定会有什么更有道理的解释,于是在知乎上搜了搜。《CC思...
跨端时代、冬眠用户与市场复苏——有关2024上半年的随想杂谈
在《逆水寒》中,角色强度的差异主要体现在装备、打造、内功三大方面:装备数值的绝对值高,但属性固定、零方差;而打造特效是功能性的,只有有和没有的区别,其数值差距较为极化,但在长线养成中差距并不明显;而最大的随机性基本都投放在内功层面,却又是占角色整体数值比重相对较小的一部分。在第一赛年中,玩家已经经...
“双碳”目标下中国省域绿色物流发展时空演变分析 | 科技导报
一方面,物流业碳排放强度往往是由空间多个不同因素共同作用决定的,且同一种影响因素在不同区域会有不同的作用强度;另一方面,影响因素的作用强度会发生时空转移,只有精确把握各因素作用重心的演化规律,才能识别出绿色物流的减碳空间和发展路径。因此,立足区域(省域或市域)发展差异提出相应的减排政策,对于中国物流行业整体...
Python中进行特征重要性分析的9个常用方法
而PCA着眼于方差解释。2、不同模型有不同模型的方法:线性模型倾向于线性关系、树模型倾向于接近根的特征。??3、交互作用:有的方法可以获取特征之间的相互左右,而有一些则不行,这就会导致结果的差异。4、不稳定:使用不同的数据子集,重要性值可能在同一方法的不同运行中有所不同,这是因为数据差异决定的...
浅谈指标——标准差
对于衡量离散度这个目标而言,方差已经可以用了。但方差的含义是面积,而对我们而言,最直观的离散程度是用收益点位到收益均值的距离来描述的。面积和距离,二者处在不同维度,也就导致了方差的结果无法和收益率等指标组合起来使用。所以最终,我们选择把方差再做一次降维,开平方根,还原成距离(即正方形的边长)。
中证金牛丨私募专题研究——量化多因子模型的构建与业内实践
如果因子之间存在明显的多重共线性,那么进行多元线性回归时,会使得模型的估计失真或者难以估计准确,所以在进行多元线性回归之前需要进行因子共线性分析,剔除相对不重要但是会对模型造成共线性干扰的因子(www.e993.com)2024年9月10日。3)残差异方差分析如果回归的残差项具有不同的方差,则称回归模型存在异方差。如果存在异方差,则传统的最小二乘回归...
100+数据科学面试问题和答案总结 - 基础知识和数据分析
偏差:偏差是由于机器学习算法过于简化而在模型中引入的错误。它会导致不适应。当你在那个时候训练你的模型时,模型会简化假设,使目标函数更容易理解。低偏差机器学习算法有:决策树,k-NN和SVM,高偏差机器学习算法有:线性回归,逻辑回归方差:方差是由于复杂的机器学习算法在模型中引入的误差,模型会从训练数据集学习噪...
200 道经典机器学习面试题总结|权值|算法|范数|贝叶斯_手机网易网
Lp范数:为x向量各个元素绝对值p次方和的1/p次方.在支持向量机学习过程中,L1范数实际是一种对于成本函数求解最优的过程,因此,L1范数正则化通过向成本函数中添加L1范数,使得学习得到的结果满足稀疏化,从而方便人类提取特征。L1范数可以使权值稀疏,方便特征提取。
【华泰金工林晓明团队】cGAN应用于资产配置——华泰人工智能系列...
传统方法基于历史收益率序列计算资产协方差矩阵。其基本思想是适应性预期。然而,历史通常不等于未来。其次,传统方法估计的资产协方差矩阵通常只包含历史序列中的线性成分,而丢弃了其中蕴含的非线性信息,导致评估结果与真实情况发生偏差。针对传统方法的不足,本文使用cGAN从贝叶斯学派视角重新定义风险。cGAN基于市场未来隐状态...
【海通金工】准另类数据与因子投资(刘洋溢博士)
下表展示的是有关方差不对称性指标的实证结果,是一个典型的学术中常用的FM回归。由第一列可见,方差不对称性指标对下一天的股票收益存在显著为负的效应。而且,t统计量的绝对值也非常大。3.2Semibetas第二个例子是Semibetas,中文叫半beta,它和方差不对称性有很多相似之处。因为从资产定价的角度来说,影响最大...