不能在黎明前牺牲!保住本钱是根本,也是交易的先决条件
1956年,科学家凯利(JohnKelly)就此发表了论文,提出了著名的凯利公式。f*=(bp-q)/b其中,f*=投注金额占总资金的比例p=获胜的概率q=失败的概率,q=1-pb=赔率,例如在轮盘赌中押单个数字,b=35,押红黑,b=1。上篇中讲到的21点下注问题,假设总赌本10,000美元,玩家取...
通过底层逻辑,拼命寻找世界的真相|数学|方差|除法|博弈论_网易订阅
把这两行的石头加在一起数一数。看看有多少个?没错,117个。天啊,这也太神奇了吧?就这么不断的左边翻倍,右边翻倍,最后把其中几行一加,就是正确答案?为什么啊?其实不只是农夫乘法,古埃及乘法,这个世界上,还有印度乘法,划线乘法,等等用来计算乘法的方式。所有这些乘法,都是对的。因为他们都是准确而有用的...
如何用数学思维,理解商业世界的底层逻辑
把这两行的石头加在一起数一数。看看有多少个?没错,117个。天啊,这也太神奇了吧?就这么不断的左边翻倍,右边翻倍,最后把其中几行一加,就是正确答案?为什么啊?其实不只是农夫乘法、古埃及乘法,这个世界上,还有印度乘法、划线乘法等等用来计算乘法的方式。所有这些乘法,都是对的。因为他们都是准确而有用的...
在RTX 4090被限制的时代下,让大模型使用RLHF更高效的方法来了
这一点可以从DeepSpeed-Chat的报告里看到,第三阶段的训练时间是前两个阶段时间总和的4倍以上。而且,根据我们的经验,第三阶段的GPU消耗是前两阶段的2倍以上。目前RLHF第3阶段的主要计算瓶颈是什么?我们发现该阶段的计算瓶颈主要来源用来目前使用的RL算法:PPO算法。PPO算法是用来解决普适RL...
机器学习面试的 12 个基础问题|算法|导数|神经网络_网易订阅
结合高方差问题,数据会变得非常大或非常小。在训练层数很多的神经网络时,这个问题很常见。如果特征不是分布在稳定的区间(从小到大的值)里,那么就会对网络的优化过程产生影响。我们都知道,优化神经网络将需要用到导数计算。假设一个简单的层计算公式y=(Wx+b),y在W上的导数就是这样:dy=dWx。因此,x...
《底层逻辑2》:拼命寻找世界的真相
第一行和第四行?好的(www.e993.com)2024年8月6日。把这两行的石头加在一起数一数。看看有多少个?没错,117个。天啊,这也太神奇了吧?就这么不断的左边翻倍,右边翻倍,最后把其中几行一加,就是正确答案?为什么啊?其实不只是农夫乘法,古埃及乘法,这个世界上,还有印度乘法,划线乘法,等等用来计算乘法的方式。
数学建模七种回归分析方法归纳总结!
在这个公式中,有两个组成部分。第一个是最小二乘项,另一个是β2(β-平方)的λ倍,其中β是相关系数。为了收缩参数把它添加到最小二乘项中以得到一个非常低的方差。要点:1.除常数项以外,这种回归的假设与最小二乘回归类似;2.它收缩了相关系数的值,但没有达到零,这表明它没有特征选择功能...
一批北大硕士给出的Excel技巧,让你的工作效率提升好几倍
操作:数据-数据有效性-序列-自定义-写入公式-设置完成数据验证+counta:完整输入信息利器2:分列,不止拆分应用1:分列人员信息,规范输入(按分隔符号拆分)记录人员信息时,没经验的员工总是把所有信息记录在同一个单元格中。试想下,不同的字段信息放在了同一单元格中,还如何进行数据分析呢。此时,我们就可以使用分...
如何通过合适的 batch 大小收获 4 倍加速 & 更好的泛化效果
一旦我们有了这两个近似值,我们就可以用公式计算简单的噪声标度:简单噪声尺度的近似为了确保该估计量具有很小的方差,作者在整个训练过程中计算了几个简单的噪声尺度估计量,并对其进行了平均。如文中所述,一种自然的方法是利用多个GPU计算每个GPU的局部梯度,即小梯度,然后将其与不同GPU的平均梯度(即大...
深度:未来几年赚钱的逻辑
用简单的数学公式可以来解释稀缺程度:圆的面积=πr??,假如半径(距离)增加一倍,从10km变为20km,则面积扩大至四倍,从100π变为400π。所以,离核心地段或区越近的地方,稀缺性越高;越远则供给成倍增加。综上所述,如果我们投资房地产,就一定要关注人口流量和货币流向,还要注重稀缺性。做资产配置的时候...