8种数值变量的特征工程技术:将数值转化为预测模型的有效特征
print(f"\n{n_components}个组件的累积解释方差:{cumulative_variance_ratio[-1]:.4f}")#显示前几个组件n_components_show=min(10,n_components)components=svdponents_[:n_components_show].reshape((n_components_show,h,w))fig,axes=plt.subplots(2,5,figsize=(15,6))...
金融计量学第1节课:股指收益率序列统计特征
Ct=(100/80)0.5-1到期收益率表示债券的投资收益。简言之,到期收益率就是未来所有现金流的现值除以债券的价格,假设在购买日和到期日之间,投资者收到n期利息支付,y为债券的到期收益率,p为债券价格,f为债券的面值,为第i期的利息支付。则折现(或者叫贴现)公式为:四、统计分布统计学中有很多的统计分布,正态...
参数估计|置信|样本|均值_新浪新闻
若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n≥30),样本均值仍会接近正态分布,其分布的期望值为总体均值,方差为总体方差的1/n。这就是统计上著名的中心极限定理,这一定理可以表述为:从均值为、方差为的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的分布近似服从均值...
扩散模型DDPM:先前向加噪后反向去噪从而建立噪声估计模型
更具体而言,正向扩散和逆扩散过程都是马尔可夫,唯一的区别就是正向扩散里每一个条件概率的高斯分布的均值和方差都是已经确定的(依赖于和),而逆扩散过程里面的均值和方差需要通过网络学出来,怎么个学法呢?1.有人可能要说,直接把上一节得到的移个项不就行了(先把带的项移到等式左边,然后所有项各自除以,最后...
时间序列因子择时与横截面因子配权的新方法
考虑到因子择时策略的高周转率,交易成本对性能的拖累是巨大的;这些成本侵蚀了大多数因素选择阿尔法,每年超过1/N基准的净数字仅为4个基点(2.25%–2.21%)。尽管这些结果最初看起来很令人震惊,但我们将在“平滑均值-方差因子分配”部分中重新讨论针对均值-方差分配结果的潜在补救措施。
用树模型提取分析师预期数据中的非线性alpha信息
1.提升树模型可以提取数据中的alpha信息,用模型预测值构建的策略在全时段样本中有效、稳定;2.提升树模型的预测值和线性模型预测值历史相关性均值为50%(www.e993.com)2024年10月24日。两个模型呈现出不同的特点,相比较而言,线性模型更适合大市值股票,提升树模型则更均衡。3.等权使用提升树模型和线性模型,比单独使用线性模型效果更好,对...
神经正切核,深度学习理论研究的最新热点?
现在,我们不用改变数据集的大小N,它在损失函数公式中是一个不必要的常量。因此,我们可以在不影响任何结果的前提下删除它,这样上述公式会看起来更加简洁(为方便求导,公式保留了1/2)。该图可以帮助读者厘清向量符号表示。我们对整个数据集高效执行向量化,在这个简单示例中数据集的大小为2(即图中的两个蓝色点)...
矩阵特征值分解与主成分分析
方差这个概念大家也不陌生,方差的定义是V[X]=E[(Xμ)2]V[X]=E[(Xμ)2],其中,μ=E[X]μ=E[X],他反映的是一组数据的离散程度。通俗的说就是:对于一组数据,其方差越大,数据的分布就越发散,方差越小,数据的分布就越集中。在一组样本集的方差计算中,我们采用1n1∑n1(xiμ)21n1∑1n(xiμ)2...
教程| 从特征分解到协方差矩阵:详细剖析和实现PCA算法
样本标准差即样本方差的平方根。即每一样本点到样本均值之间的平均距离。n个样本的方差却只除以n-1是因为样本只是真实分布的估计量,样本方差也只是真实方差的估计量。在大学课本概率论和数理统计中有证明,如果除以n(2阶中心矩),那么样本方差是真实方差的一致性估计,但并不是无偏估计,也就是样本方差存在系统...
专题研究:波动率的涵义及应用意义
1、移动平均法是以过去M天的收益率(一般是上述历史波动率中的对数收益率形式,也可以是其他形式的收益率)的样本方差作为当前时刻或者说当日波动率的估计值,分为简单移动平均和加权移动平均两种方法,前者将每天的收益率看成是等权重的,后者则对不同的时点赋予不同的权重。该方法需要确定的重要参数即天数M,根据经验...