第n 次 保卫3000 点,聊聊今年的上证指数和红利投资 | 播客
包括这只产品,上证综指ETF它其实采用的是抽样复制的方法去跟踪指数,抽样复制和相比于完全复制法来讲,它的一个好处就是说,它这里面往往是包含了一些增强策略在里面。比如说像我们的上证综指ETF,如果说是截至今年的基金二季报,它过去三年相比于上证综指的一个超额收益就有18%。这个超额收益,一方面是来自于整个上市公...
数学建模必备五大模型之一 | 预测模型详解(下)
其中yi是节点N下第i个样本的目标变量值。再选择最佳划分属性:对每个特征A和其所有可能的划分点a,计算将数据集DN划分为两个子集DN1(A,a)和DN2(A,a)后的均方误差(MSE)之和:其中yN1和yN2分别是子集DN1和DN2内样本目标变量的均值。选择使得MSE(A,a)最小的特征A??和划分点a??。接着划分数据集。根...
泊松自助法 Poisson Bootstrap Sampling 大型数据集上的自助抽样
在经典自助抽样中,当我们重新抽样时,每个观测值都遵循二项分布,其中n=n,k={0,...,n}且p=1/n。这也表示为Binomial(n,1/n)。而二项分布的一个非常有趣的性质是,当n变得越来越大,p变得越来越小时,二项分布收敛到参数为Poisson(n/p)的泊松分布。这适用于任何n和p,只要n/p是...
万字经验 | 使用大模型(LLMs)构建产品一年后,我们有些经验想告诉你
n-shot提示与上下文学习利用n-shot提示进行上下文中学习的思路是提供给LLM一些示例,这些示例展示了任务要求,并使输出符合我们的期望。一些建议:如果n过低,模型可能会过度依赖这些特定示例,影响其泛化能力。一般来说,n应该不小于5,甚至可以达到几十个。示例应能代表预期输入的分布。如果您正在构建一个电影摘要...
量化专题 | 利率曲线的政策定价与久期择时策略
模拟过程:基于t分布进行ε的抽样,在三因子模型的参数估计基础上可计算下一月的利率,同理递推可得未来12个月的利率;重复模拟:对于第二步的过程,随机从t分布中抽样12次即可得一条模型对未来12个月的利率走势的预测,重复这个过程n次,即可得n条利率走势的模拟;...
过程能力研究的标准样本数量为多少?你知道吗?
场景1:我们对该总体进行了100次抽样,n=30现在,如果使用30件样本对数据进行100次抽样,在下图中可以看到,存在巨大的变异性(www.e993.com)2024年11月23日。总体而言,我们的平均Pp为1.69,接近“实际”值,但样本范围介于1.19和2.44之间。实际上,我们在30件样本的结果中得到的变异性很大,存在样本Pp显著低于和高于实际总...
视频生成经典模型资源(一):TGAN、VGAN、MoCoGAN、SVG、vid2vid...
TGANTGAN(TemporalGenerativeAdversarialNet)是一种可以学习无标签视频数据集中的语义表示并产生新的视频的生成对抗网络。TGAN由两个生成器构成:temporalgeneratorG0和imagegeneratorG1。G0用z0(从分布P_G0(z0)中随机抽样得到)作为输入,生成一系列潜在变量z1。G1使用z0和z1作为输入,输出为视频。为了解...
机长“自白书”:波音777征服我的N个理由
机长“自白书”:波音777征服我的N个理由文章较长:请看提纲:在2014Skytrax全球最佳航空公司中,波音777占其客机/宽体客机机队比例非常高。一、从777飞机设计历史来看,它是划时代设计的一款飞机。1、波音777的所有设计都是针对市场需求和客户要求而进行的。
【专题报告】期权聚焦系列(一): 期权市场概览与期权定价模型
二叉树期权定价模型的基本假设是在每一时期股价的变动方向只有上升或下降;定价依据是期权在第n次买进时,能建立起一个零风险套头交易(或者说可以使用一个证券组合来模拟期权的价值,该证券组合在没有套利机会时应等于买权的价格);反之,如果存在套利机会,投资者则可以买两种产品中价格较为便宜的一种,卖出价格较高者...
GPT-2没什么神奇的,PyTorch 就可以复现代码
我们在64个随机抽样的小批量、512个令牌的连续序列上训练了100个阶段。由于layernorm在整个模型中广泛使用,简单的N(0,0.02)权重初始化就足够了。我们使用了一个bytepair编码(BPE)词汇表。我们还采用了在中提出的L2正则化的改进版本,在所有非偏倚或增益权重上的w=0.01。对于激活函数,我们使用...