北京大学:利用好不确定性,8B小模型也能超越GPT-4
MixEval和MMLU在稳定性上表现尤为突出,这体现在无论是使用贪心解码还是采样方法,其性能差异很小,且不同采样间的结果波动也很低。这种高度稳定性主要得益于它们答案空间的严格限制:MMLU采用多项选择题形式,而MixEval则通过真实数据基准测试要求LLM给出简短答案,从而进一步压缩了输出范围。相比之下,GSM8K和HumanEval在...
通过底层逻辑,拼命寻找世界的真相|数学|方差|除法|博弈论_网易订阅
标准差更小的产品,质量更高。因为标准差越小,性能越稳定;性能越稳定,质量越高。这就是方差和标准差的意义。其实差异性,我们很多时候是能感受到的。那为什么还一定要用数学来量化呢?因为只有量化了的差异性,才是可以比较的差异性,才是可以改进的差异性,才是可以作为健康指标的差异性。概率与统计什么是“...
RV的统计性质初探(上):实证成果回顾
但是考虑到收益本身自相关性很低,很难说有足够证据违背了Independent的假设,所以大概率是产生收益的分布随着时间有变化,异方差就是其中的一种可能性。第二,高波动偏离均值的幅度比低波动要大得多。注意到平方根和取log都是凸函数,其作用就是使大值和小值之间的差距缩小。日标准差还要经过一次log变换才呈现出正态...
【华泰金工林晓明团队】不确定性与缓冲机制——华泰周期起源系列...
不确定性是金融经济活动的常态,小到一个消费者的购买行为、大到一项科学技术的进步无不充满着随机性。因为随机性的存在才使得这个系统足够复杂与生动。不确定性的存在意味着企业的经营存在风险,你永远无法预知消费者的真实需求,事实上,可能消费者自己也无法准确了解自身的需求,很多消费者的需求是由生产者创造出来的。...
【华泰金工林晓明团队】行业配置策略:拥挤度视角——华泰基本面...
2)流动性:流动性指标处于历史高位意味着大额资金进场,市场交易过热。为保证不同时间数据口径一致,只采用换手率进行流动性指标计算。3)量价相关性:量价相关系数可以用于判断是否存在量价背离,价格趋势是否反转。4)波动性:一般情况下波动越大的指数拥挤程度越高,可以采用波动率和峰度指标来刻画指数的波动水平。
数据并非都是正态分布:三种常见的统计分布及其应用
正态分布假设支持最小二乘法(OLS)估计的有效性(www.e993.com)2024年8月6日。当残差正态分布时,OLS估计器是“最佳”的线性无偏估计器(BLUE),这意味着在所有线性无偏估计中,它具有最小的方差。4、处理异常值正态分布的假设有助于识别异常值。在正态分布的假设下,大多数数据点应聚集在均值周围,只有少数数据点会落在分布的尾部。如果观察...
如何用数学思维,理解商业世界的底层逻辑
这意味着A加1分,B减1分。但是如果B预判了A的石头,出了“布”,那收益就变为了(-1,1),情况完全逆转,变为了A减1分,B加1分。但是如果A预判了B的预判,知道B预判自己出石头,所以出布,于是就出了剪刀(有点拗口啊),情况就再次逆转,收益变为(1,-1),A加1分,B减1分。
《底层逻辑2》:拼命寻找世界的真相
这意味着A加1分,B减1分。但是如果B预判了A的石头,出了“布”,那收益就变为了(-1,1),情况完全逆转,变为了A减1分,B加1分。但是如果A预判了B的预判,知道B预判自己出石头,所以出布,于是就出了剪刀(有点拗口啊),情况就再次逆转,收益变为(1,-1),A加1分,B减1分。
主动推理、形态发生和计算精神病学
在主动推理框架中,这意味着未分化的细胞通过最小化自由能来迁移和分化。形态发生的动力学是由化学趋化、生物物理和电化学信号介导的。为了简化起见,在我们的模型中不考虑细胞分裂。在模拟开始时,所有细胞都是相同的,并且它们不知道它们是什么类型的细胞或者它们在哪里,尽管它们都有相同的模型,它们是多能干的,最终可以...
如何让自己在“输”的时候仍然获益?
所以,好的游戏是,当对你不利的小概率事件发生时,也可以赚钱。当然,这种好事儿的前提,是对方觉得你是势均力敌值得尊重的好敌手。作为世界最强玩家之一,赫尔穆特说:扑克高手关键是耐心和控制。“扑克玩得好意味着只打手牌轮次的12%。如果超过30%,你就没法赢钱;如果你每把都玩,你100%每天都会破产。”...