查看原文
其他

Points of Significance: 非参数检验

Points of Significance: 非参数检验

简介


Nature methods从2013年9月开始发表月刊Points of Significance系列,该系列主要介绍统计在生物学中的应用,让读者可以更正确的理解及使用统计。有研究发现,在医学类期刊上发表的文章中,有接近半数的统计方法的使用都是不正确的,所以Nature methods推出该系列统计文章,以实用易懂的方式来介绍统计中的一些基本概念。

知识点

1.符号检验

2.Wilcoxon秩和检验


主要内容

        前面我们介绍了多种t检验的形式,虽然形式不同,但是我们在使用t检验的假设都是一样的:总体分布为正态分布及齐方差。但是如果当我们的数据来源于有偏的分布或者说是离散的数据又或者是顺序数据的时候呢?再粗暴的用t检验是不是就不这么合适了?非参数检验不对分布进行假设,所以就更加适合。本文将介绍两种非参数检验:符号检验和Wilcoxon秩和检验。


非参数检验

        有一点需要注意,之前我们提到的t检验都是检验样本的均值是否有差异,而本文中的非参数检验都是在检验样本间的中值是否有差异。


1.符号检验

        符号检验可以检验某一组数据的中位数是否与指定值相同。符号检验不对数据分布进行假设。

        符号检验的原假设是:这组数据的中位数与指定值相同。操作时,只需要计算该组数据中有多少个值大于指定的要进行比较的值即可。然后认为若数据的中位数与指定值相同,那么该数据中的值大于或者小于该指定值的概率应该相同,都为0.5。此时数据中大于指定值的数量应该服从二项分布。


        如上图a所示,从某个总体中抽取6个样本值,图中两个error bar分别表示6个样本的均值加减sem和均值加减标准差,mx表示样本中值(均值),M为总体中值,也就是说,我们要比较抽取的6个样本的中值是否与M有显著差异。如上图b中,利用t检验可以计算出该检验的t值为2.84,对应到上图c左边的t分布中可以求得p值为0.04,显著。同样,如图b下面是符号检验,计算样本中大于中值的数据值有5个,但是对应到图c中右边的图中的二项分布p值为0.22,不显著。

        从上面可以看出,我们的符号检验不是怎么敏感,要想使符号检验得出比较好的结果,可以加大样本量。


2.wilcoxon秩和检验

        Wilcoxon秩和检验是如下进行操作的,所以将两个样本中的所有数据混合,然后对混合数据进行排序,排号。然后将其中一组的排号进行加和,然后再计算预期该组合中最小加和是多少,求差,利用该差来计算p值。我们看个例子就明白了。


        如上图a所示,有三组数据,X,Y,Z,其中X是原假设,Y是其中一次抽样,Z是另外一次。我们就是要检验Y和Z是否显著比X小。那么首先将Y和X混合,排序,排号,上图a中有标号。然后计算Y的各个数值的排号之和,如上图b中,加和为R=13。然后我们知道Y中共有4个样本,所以当Y的值都比X值小时,此时他们的排序加和应该为1+2+3+4=10,然后计算差W=3。在X数量为6时,Y数量为4时,我们可以知道,W最小取0 (Y中四个数据刚好就是最小的四个),W最大取24 (Y中四个数据刚好取最大的四个)。所以W的取值时有限的,只有25个,通过排列组合我们知道,所以X,Y的排序情况总共只有210种情况。且总共有14种情况可以得到W小于等于3,所以p值为14/210为0.067,上图c。

        同样的对Z来说,W计算出来为2,而210个组合中,只有8个组合W小于等于2,所以此时p值为8/210为0.038,上图c。

 

        通过上面的讨论我们知道,wilcoxon秩和检验得出的p值都比较大,为什么?因为我们的样本量小,当X数量为6,Y数量为4时,总共只有210种组合,此时如果只有1组合满足条件,此时的p值为1/210为0.005,也就是这个就是该检验中能出现的最小p值。若是再进行多重检验校正,假如检验次数为10,那么0.005乘以10为0.05,那么就没有显著的了。解决这个问题的办法显然就是增大样本量。


非参数检验与t检验

        非参数检验与t检验哪个好呢?分别从FPR, FDR, 和统计效应的角度来看。


        如上图所示,从三个不同的分布抽样,右边分别为样本数量为5和25。随机抽样结果分为连续和离散,离散的数据就是将连续的数据变成离它最近的整数。上图中带颜色的柱状图展示的是t检验的结果,带颜色的柱状图上黑色的竖线代表的是Wilcoxon秩和检验的结果。

从上图可以看出,当样本量N=5时,对于离散的数据(第二列),统计效应t检验和Wilcoxon秩和检验差不多,但是秩和检验的FDR更小。同样对于N=25,且在中间的指数分布的情况下,Wilcoxon秩和检验的统计效应要高于t检验。

        综上,基本可以得出,在离散数据和有偏分布中,秩和检验的检验性能高于t检验。


应用

最后,我们说下什么时候用非参数检验。

当然第一就是不知道分布或者分布很有可能是是有偏分布的时候。

第二是若是数据为离散数据或者为顺序数据的时候。


系列文章

1. Points of Significance: Importance of being uncertain

2. Points of Significance: Error bars

3. Points of Significance: Significance, P values and t-tests

4. Points of Significance: Power and sample size

5. Points of Significance: Visualizing samples with box plots

6. Points of Significance: Comparing samples part I

7. Points of Significance: Comparing samples part II


参考文献

Krzywinski M, Altman N. Points of significance: Nonparametric tests. Nature methods. 2014;11(5):467-8.


声明:上述内容为NGSHotpot读文献整理写出,若有遗漏或错误,感谢您指出。

若有任何意见、建议、或对上述内容有疑问请发送邮件到:ngshotpot@126.com


扫描或识别下方二维码关注NGSHotpot

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存