数据科学在腾讯内容生态中的应用
两个相减后,再做一些统计上的test,观察差异是否显著。如果是,说明这个intervention是有影响的,并且知道影响的大小。②第二种应用方式是把它放到一个线性回归里面。T代表时间,intervention会产生一个时间点。i表示两组分别属于被干预组,还是没有受到干预的组。重点是变量x,我们可以把一些用户的属性数据...
【华泰金工林晓明团队】不同协方差估计方法对比分析(二)——华泰...
主要内容包括:1、综述条件协方差估计方法中两类协方差估计模型的原理;2、给出统一的评价体系,保证条件协方差估计方法实证结果的可比性;3、基于国内外七类资产组合的真实交易数据验证条件协方差估计方法相比于样本协方差的改善程度;4、总结分析各算法的优劣,并针对不同配置场景提供实操建议。指数移动平均反映近期变化趋...
数据不满足正态分布,能用t检验吗?
就拿wilcoxonrank-sum检验来说,虽然其不要求数据来自于哪个具体的分布,但是要求两个样本的分布形状要大体相同,在这样的情况下,检验两组样本均值存在差异还是中位数存在差异,其实是等价的,都可以说明两组数据分布位置存在差异,因此不存在检验均数不正确的问题。对于非对称数据用中位数进行描述,只是因为中位数能更好...
数据分析必备——统计学入门基础知识
极差:为一组数据的最大值和最小值之差,但极差不能反映所有数据的变异大小,且极易受样本含量的影响。常用以描述偏态分布。四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布。方差与标准差:反映一组数据的平均离散水平,消除了样本含量的影响,常和均数一起用来描...
集微咨询:从日本海关数据看中美半导体设备价值链高低
二、日本半导体设备出口区域中,韩国的离散型和方差最大,显示日韩半导体贸易的波动性绝对大过中国大陆和中国台湾地区;东南亚和欧盟离散度最小,说明日本对这两个地区的半导体贸易相对很稳定。三、出于各种考虑,日本并未把中国台湾地区列为单独的出口目的地,对该区域的半导体进出口设备的分析需要对整个东亚和东南亚整体综合...
为什么说集成学习模型是金融风控新的杀手锏?
比如我们使用两棵树来预测一个人是否喜欢电脑游戏,如上图所示,在预测新样本时,每棵树都会有一个输出值,将这些输出值相加,就可得到样本最终的预测值,故小男孩和老人的预测值分别为两棵树预测值的加和(www.e993.com)2024年8月6日。XGBoostXGBoost全称为ExtremeGradientBoosting,由于上述GBDT在数据集较大较复杂的时候,可能需要上千次迭代运算...
数据不满足正态分布,到底能不能用t检验?
第三,总体服从正态分布时可以证明样本均数与样本方差独立,当总体不服从正态分布时独立性无法保证,因此条件C也可能不满足。这样看来,原始数据不符合正态分布时样本均值比较好像不应该使用T检验,为什么本文说可以使用呢?其实本文在一开始就提到过,这个证明不完全取决于中心极限定理,因为还需要用到另外两个统计学中非常...
放大的艺术 | 基于深度学习的单图超分辨
SSIM通过计算两个图像在亮度、对比度和结构三个方面的相似度综合得出整体的相似度。其中,图像的亮度和对比度分别由像素点亮度的均值和方差表示,它们的相似度计算方式相同。图像的结构由归一化的像素点的集合表示,图像间的结构相似度则通过内积计算。SSIM中各项指标的计算公式如下:...
简述多种降维算法
的方差尽可能大。假如D维空间中的数据每一维均值为0,即,那么两边乘上得到的降维后的数据每一维均值也是0,考虑一个矩阵,这个矩阵是这组D维数据的协方差矩阵,可以看出对角线上的值是D维中的某一维内的方差,非对角线元素是D维中两维之间的协方差。