了解一下皮尔逊相关系数(Correlation Coefficient)是什么?
相关系数(Pearsonproductmomentcorrelationcoefficient)是用-1到1之间的数值来表示两个变量相关程度的指标。当正相关越强时,相关系数趋近于1;而负相关越强时,相关系数则趋近于-1。通过观察两个变量的离差乘积,我们可以发现:当两个变量都比各自的平均数大或小时,相关系数为正数。这是因为在正相关较强...
机器学习面试的 12 个基础问题
方差(variance)可以简单理解为是模型输出在一个数据点上的分布(或聚类)。方差越大,模型越有可能更密切关注训练数据,而无法提供在从未见过的数据上的泛化能力。由此造成的结果是,模型可在训练数据集上取得非常好的结果,但在测试数据集上的表现却非常差。这个现象被称为过拟合。这两个概念的关系可通过下图说明:上...
不能在黎明前牺牲!保住本钱是根本,也是交易的先决条件
如果只有1-36这36个数字,那么玩家每次押1元,平均每36把赢一次,赢的35元正好抵消另外35把输的钱。但赌场在轮盘左边加了个“0”,玩家的赢面变成了1/37,赢的35元不足以抵消另外36把输的钱,赌场占据了1/37=2.70%的概率优势,也就是说玩家每押100元,平均要输2.7元。这还是“仁慈”的欧洲式轮盘赌,美国人...
高频交易,足矣!
tick指的其实就是一个update的datafeed,这个update可以是最新变动的quotes或者trade的价格,订单大小和成交量信息,然后高频频数据就是一系列连续“ticks”的集合。Tick数据通常具有以下属性:时间戳股票代码买价卖价可用买单数量可用卖单数量最后交易价格最后交易数量时间戳记录了报价产生的日期和时间。它可能...
8000字详解“降维算法”,从理论实现到案例说明
优势一:去除冗余特征在数据中,一些特征可能是其他特征的线性组合,或者与某些特征高度相关。冗余特征不仅会增加模型的复杂性,还可能导致过拟合,降低模型的泛化能力。通过降维,我们可以去除这些冗余特征,从而简化模型。假设我们有一个关于房价的数据集,其中包含了房屋的大小(FeatureA)、房屋的年龄(FeatureB)、房...
(万字干货)如何训练优化“AI神经网络”模型?
以均方误差(MSE)为例,均方误差是预测值与真实值之间差值的平方和的平均值(www.e993.com)2024年8月5日。具体来说,如果我们有n个预测值和对应的实际值,MSE的计算公式就是:MSE=(1/n)*Σ(yi–??i)^2其中,y_i表示实际值,??_i表示预测值,n表示样本数量,Σ表示求和。
量化策略:技术指标在商品期货市场里的应用
1.RVI计算公式:STD=STD(CLOSE,N)USTD=SUM(IF(CLOSE>REF(CLOSE,1),STD,0),N2)DSTD=SUM(IF(CLOSERVI=100*USTD/(USTD+DSTD)RVI的计算方式与RSI一样,不同的是将RSI计算中的收盘价变化值替换为收盘价在过去一段时间的标准差,用来反映一段时间内上升的波动率和下降的波动率的对比。RVI的...
「万字干货」深度对话Quentin Anthony:GPU不足,如何优雅地训练大...
该公式的原理如下:C=Cforward+Cbackward:表示训练过程中的前后向传播;Cforward≈2PD:前向传播计算成本约等于两倍的参数量乘以数据规模;Cbackrward≈4PD:反向传播计算成本约等于四倍的参数量乘以数据规模;C是一个量化计算成本的单位,通常用FLOP表示,亦可用一些新的单位来表示,如FLOP/s-s:表示每秒浮点运...
统计学入门:时间序列分析基础知识详解|方差|残差|协方|自相关|...
其中??是常数,且??不依赖于。这些公式表明,随着时间的推移,均值和方差是稳定的,协方差取决于时滞。例如,上一段中的第一个例子具有弱平稳性。严格平稳性(强平稳性)令Fx(??)表示联合密度函数时,严格平稳性描述为:如果所有时间序列数据的联合分布不随时间的变化而变化,则该时间序列具有严格的平稳性。严...
详解:7大经典回归模型
在一个线性方程中,预测误差可以分解为2个子分量。一个是偏差,一个是方差。预测错误可能会由这两个分量或者这两个中的任何一个造成。在这里,我们将讨论由方差所造成的有关误差。岭回归通过收缩参数λ(lambda)解决多重共线性问题。看下面的公式:在这个公式中,有两个组成部分。第一个是最小二乘项,另一个是β...