数学悖论系列之八(统计学悖论)
如果能够掌握总体的全部数据,那么只需要做一些简单的统计描述,就可以得到所关的总体数量特征(即总体参数),比如总体均值μ,总体方差σ^2,总体比例p等。但现实往往比较复杂,有时就需要从总体中抽取出一部分个体进行调查(抽样调查),进而利用样本提供的信息来推断总体的特征。(图84)图84参数估计的方法分为点估计和...
根据P值构建预测模型,合理吗?
我在审稿一些预测模型开发类文章的时候,经常看到很多文章都是采用大概这种思路:首先进行单因素分析,筛选出p值小于0.05的变量(当然,有的文章会设置为小于0.1、0.15等),然后将这些变量纳入多因素分析,再以其中有统计学意义的变量构成一个预测模型。可能不少临床大夫喜欢这种方式,因为简单。但是否合理,这就很难说了。...
多少科研人饱受失眠之苦,就为了等“p值”小于5%这一结果?
统计学家奥布里·克莱顿做了一件有趣的事,他追溯统计学的历史,告诉了读者统计学上的谬误、危机和争议,包括让无数人“辗转反侧”的p值。“对显著性检验——特别是零假设显著性检验——的批评有着特别悠久和丰富的历史。我将只讲述有关其中一些批评的故事,主要是试图理解为什么它从未成功地推翻现有规则。可悲的是...
无数人误解的P值:统计上显著不代表一定正确
如果该结果的p值小于0.05,那我们就说我们达到了统计显著水平,可以推翻原假设(“读这本书什么用都没有”)而支持对立假设(“这本书让你的统计学能力变得更好”)。p值告诉我们的是,如果原假设成立,则我们如果要进行100次检验,就该预期读过这本书的人和没读过的人相比,获得和这次测验差不多的成绩的次数不超过...
不讲术语!带你快速厘清互联网AB实验里的弯弯绕绕
我们常见的“P值”可以姑且被看作是犯“弃真”错误的实际概率(衡量具体有多靠谱),而“显著水平α”就是犯“弃真”错误的概率上限(我们自行设定的靠谱标准),P值像我们考试的得分,α像我们考试的合格线。所以按照这个思路,我们的设想会有一个“成绩”P值,然后和α比较下,看这个设想有没有“合格”。
“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验
案例1中Fisher计算出的p值是0.014,小于预先设定的0.05的显著性水平,说明统计显著的结论,即根据样本得出的结论可以拒绝零假设,进而认为Bristol真的能够分辨出先倒奶还是先倒茶在味道上的区别(www.e993.com)2024年12月19日。知识点4统计显著对比实际显著“统计显著”是很多学术报告和商业报告中都会给出的结论,代表了从统计学的角度对事物的观...
医学统计学必备知识点分享,常笑医学为医学生答疑解惑
5.统计结果得到P大于0.05,怎么办?通常情况下,临床研究的结果主要是根据P值的大小来判断该研究因素是否有意义。当得知P>0.05时,不用慌张,因为有可能研究对象之间是真实存在差异,只不过是您的样本量不够导致检验效能不足才没有发现它们间真实差异。此时可根据结果反推,计算本次研究的检验效能(1-β),如果它们间确...
九成以上研究者或无法正确理解p值
但是,如此常用的p值在统计学界和科学界其实褒贬不一。原因不外乎两点:1)从统计原理的角度上,p值能够反映的信息与数据所代表的实际信息存在较大差别;2)从研究者使用的角度上,p值的构造理念和解读方式本身不容易理解,具有认知上的误导性。如何正确地使用与解读p值,遂成为一个“一直在讨论、从未被解决”的问题。
【統計學】终于有人把p值讲明白了
科学的标准是使用小于0.05的p值,也就是说,如果事实上是没有效应的,那么100次里我们有95次能正确地推断出没有效应。另一种检验样本差异是否统计显著的方法是看置信区间有没有包含零值。95%置信区间是一个可以在95%的时间里覆盖真实差异值的区间。对于较大的样本量,这个区间通常以观测到的实验组和对照组差值为中...
项目复盘:如何避开从0~1构建AB Test过程中的坑(上)
P值指的是比较的两者的差别是由机遇所导致的可能性大小。P值越小,越有理由认为对比事物间存在差异。一般统计学认为,P>0.05称“不显著”;P<=0.05称“显著”,P<=0.01称“非常显著”。P<0.05,就是说结果显示的差别是由机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的研究,得出相反结论的可能性...