一、概述
前面已经学习了参数估计与假设检验,其内容是在已知总体分布的条件下对一些主要参数(如均值、方差)进行估计和检验。在进行参数估计和假设检验时一般要求总体服从正态分布,方差相等等假设条件,但在统计分析中许多实际问题并不一定满足这些假定,或者有些资料不是数值型(定距尺度),而是定类数据或定序数据,再用传统的参数方法进行分析就为力。
一般把不是参数的估计和检验问题已经不是建立在总体分布服从一定假设的基础上的有关统计方法,都称为非参数统计。与参数统计方法相比较,非参数统计方法具有以下优点:
1.要求假设条件少,适用范围广;
2.许多非参数方法运算简单,可以较快取得结果,节省时间; 3.直观上容易理解,不需要太多的数学和统计理论;
4.适用一些计量水准比较低的资料,如定类尺度、定序尺度。
但是,由于非参数统计方法简单,计量水准低,损失了资料中的部分信息,因此当能与参数统计方法同时使用时,其敏感程度较低,检验的功效也较差。
二、二项检验
二项分布是一种不连续分布,对一个由指定数目的试验组成的不确定过程进行描述。每次试验只能有两种可能结果,成功或失败(是或否,1或0等),每次试验成功的概率是一个常数且于其他试验结果。二项分布描述在指定数目的试验中成功的总次数,需要两个参数,一个是试验次数(n),一个是每次试验成功的概率(P)。
二项检验主要用来检验一个样本序列是否服从给定概率p的二项分布。将容量为n的样本数据转换为0,1数据,然后计算出1(成功)的个数n(1),n(1)应服从二项分布b(n,p)。建立检验假设如下:
(一)双侧检验 H0:p=p0(样本服从二项分布b(n,p0))
H1:p≠p0(样本不服从二项分布b(n,p0))
(二)左侧检验 H0:p=p0(样本的成功概率大于等于给定概率p0)
H1:p<p0(样本的成功概率小于给定概率p0)
(三)右侧检验 H0:p=p0(样本的成功概率小于等于给定概率p0)
H1:p>p0(样本的成功概率大于给定概率p0)
根据一定的显著水平,计算出临界值上限和下限。如统计量n(1)超出临界值范围,则拒绝H0;否则就接受H0。
例:某种超常记忆训练法声称可以让80%的普通学生在1个小时内掌握60个单词,现随机抽取20个学生进行训练,其单词记忆个数如图2.1中列B所示,试检验该训练法的成功(1小时掌握60个单词)概率是否能达到0.8(α=0.05)?
双侧检验 H0:p=0.8(样本服从二项分布b(20,0.8))
H1:p≠0.8(样本不服从二项分布b(20,0.8))
左侧检验 H0:p=0.8(样本的成功概率大于等于给定概率0.8)
H1:p<0.8(样本的成功概率小于给定概率0.8)
右侧检验 H0:p=0.8(样本的成功概率小于等于给定概率0.8)
H1:p>0.8(样本的成功概率大于给定概率0.8)
1
图2.1 二项检验
其操作步骤为:(为节约笔墨,在操作说明中省略标题等说明文字的输入过程。) 1.在AB列输入原始数据;
2.将原始数据转换为二项数据,在C2输入=IF(B2>=60,1,0),拖拉填充句柄往下一直复制到C21处; 3.计算成功的学生数,在F2输入=COUNTIF(C2:C21,\"=1\"); 4.计算未成功的学生数,在F3输入=COUNTIF(C2:C21,\"=0\"); 5.计算试验次数n,在F4输入=F2+F3。 进一步对成功次数进行检验。 (一)双侧检验。
6.在F8单元输入=BINOMDIST(F2,F4,F5,1),得单侧概率,为计算双侧概率,在单元F9输入=F8*2。 由于双侧概率为0.173,大于给定的显著水平0.05,不是小概率事件,因此接受H0,可以认为该训练法的成功概率达到0.8。
也可以计算成功次数的临界值,然后根据n(1)是否超出临界值域,从而做出判定。
7.计算临界值上下限,在F11输入上限公式=CRITBINOM(F4,F5,1-F6/2),在F12输入下限公式=CRITBINOM(F4,F5,F6/2)。
用b1代表下限,b2代表上限,因显著水平α=0.05,所以两侧各占0.025,在二项累计概率公式中应分别指定为0.025和0.975。计算得下限b1=12,上限b2=19,由成功次数n(1)=13,在临界值范围内,因此接受H0,认为其成功概率可以达到0.8。
(二)左侧检验
如果选择左侧检验,则只需计算下限b1,显著水平应指定0.05。 8.在F15输入下限公式=CRITBINOM(F4,F5,F6)。
得下限b1=13,由于n(1)≤b1,因此拒绝H0,即不能认为成功概率达到0.8。 (三)右侧检验
如果选择右侧检验,显著水平应指定1-0.05=0.95。 9.在F18输入下限公式=CRITBINOM(F4,F5,1-F6)。
得下限b2=19,由于n(1)<b1,因此接受H0,即可以认为成功概率为0.8。 三、两个相关样本检验
(一)、 配对样本符号检验
符号检验是一种非常简单的非参数检验方法,适用于两个有联系的配对样本的检验。它检验两个有联系的配对样本之间是否存在显著差异,是通过两个配对样本间差值的符号数进行的。
假定XiYi0用正号(+)表示,XiYi0用负号(-)表示,如果两个样本无显著差异,则样本观
2
察值正、负符号的个数应大体相等。建立检验假设如下:
1、双侧检验 H0:Mx=My(样本来自同一总体)
H1:Mx≠My(样本不是来自同一总体)
2、左侧检验 H0:Mx=My(样本来自同一总体)
H1:Mx<My(样本X所属总体小于样本Y所属总体)
3、右侧检验 H0:Mx=My(样本来自同一总体)
H1:Mx>My(样本X所属总体大于样本Y所属总体)
根据备择假设H1的方向确定统计量K,如为双侧检验(H1:M≠M0),则K为n+和n-中的小者,即K=min(n+,n-);如为左侧检验(H1:M<M0),则K=n-;如为右侧检验(H1:M>M0),则K=n+。
统计量K服从二项分布b(n,1/2),可根据一定的显著水平,计算出临界值上限和下限。如统计量K超出临界值范围,则拒绝H0;否则就接受H0。
例:某心理学家为弄清凶杀、暴力等节目是否对孩子有影响这一问题进行了实验。他选了16对孩子,每一对孩子的家庭环境、性格、智力等因素尽可能一致。其中一组孩子经常观看凶杀暴力类节目,另一组孩子则经常观看儿童卡通片等。经过一段时间后,确定一些指标进行测试,指标分值高反映粗暴、敢为的倾向大。测试结果如图16.6中BC两列所示。试检验观看暴力录像是否对孩子有影响(α=0.05)?
采用双侧检验,建立假设:H0:Mx=My(无显著影响)
H1:Mx≠My(有显著影响)
用符号检验法对此进行检验:
1.在表中A1:D1单元输入标题,如图3.1所示; 2.在A2:C17中输入样本数据;
图 3.1 两个相关样本符号检验
3.在D2输入公式计算样本的符号=IF(B2>C2,\"+\,将此公式往下一直复制到D17处;
4.为计算正负号个数n(+)和n(-),在G2输入=COUNTIF($D$3:$D$17,\"+\"),在G3输入=COUNTIF($D$3:$D$17,\"-\");
5.由于本例为双侧检验,故统计量K=min(n+,n-),在G4输入=MIN(G2:G3); 5.计算样本量,在G5输入=G2+G3;
6.由于K服从二项分布,因此可计算累计概率P(k≤K)。
在G9单元输入=BINOMDIST(G4,G5,0.5,1),得单侧概率,为计算双侧概率,在单元G10输入=G9*2。由于双侧概率为0.035,小于给定的显著水平0.05,因此拒绝H0,认为观看暴力录像对孩子有影响。
也可以计算正负号个数分布的临界值上下限,然后根据n(+)或n(-)是否超出临界值域,从而做出判定。 7.计算临界值上下限,在G13输入上限公式=CRITBINOM(G5,0.5,1-G6/2),在G14输入下限公式=CRITBINOM(G5,0.5,G5/2)。
3
由于n(+)和n(-)均超出临界值范围,其结论也是拒绝H0。
本例为双侧检验,计算时两端概率各占α/2=0.025,在二项累计分布公式中概率分别指定为0.025(α/2)和0.975(1-α/2);如选择单侧检验,则二项累计分布公式中概率应指定为0.05(左侧检验)或0.95(右侧检验)。
符号检验也适用于单样本检验,检验时将样本中每个数据X减去总体中位数M0,大于M0记正号(+),小于M0记负号(-),等于M0则忽略。计算出正号个数n+和负号个数n-后,即可对检验假设进行判断。
符号检验法使用虽然简单,但有其局限性。首先,该方法只能在样本容量n不太小时方可使用;其次,一般说来,符号检验法比t检验法的效能低,特别是正、负符号所代表的差额的绝对值相差较大时,表现得更为明显;其三,当结点(差值为零)数过多时,对检验结论有较大影响。
(二)、威尔科克森秩和检验
由于符号检验只考虑了成对样本间差的方向,未考虑差的大小,威尔科克森(Wilcoxon)在此基础上提出了带符号的秩和检验法。
秩和检验是一种不考虑总体分布具体形式,通过求样本间差的秩次和来检验总体分布是否相一致。由于它既考虑了差的方向,又考虑了差的大小,因此秩和检验法比符号检验法更加敏感,在正常情况下,应优先选用威尔科克森秩秩和检验法。
威尔科克森秩和检验与符号检验的基本思路差不多,先计算样本中每对数据的差值dixiyi,将差值di按绝对值大小排序,求出秩次,差值为0的样本忽略掉,当差值相同时,则用相应秩次的平均数代替。分别计算出正差值的秩和T+与负差值的秩和T-,当H0为真时,正的秩和与负的秩和应大致相等。
根据备择假设H1的方向确定统计量T,如为双侧检验(H1:Mx≠My),则T为T+和T-中的小者,即T=min(T+,T-);如为左侧检验(H1:Mx<My),则T=T-;如为右侧检验(H1:Mx>My),则T=T+。
当n不太小时,统计量T渐近于如下的正态分布:
均值n(n1)4,标准差因此可以通过正态统计量Zn(n1)(2n1)24
进行近似检验。
T例:对前节使用的例子,试采用威尔科克森秩和检验法,检验观看暴力录像是否会使孩子更具有粗暴敢为的倾向(α=0.05)?
采用单侧检验,建立假设:
H0:两组总体相同(无显著影响)
H1:观看暴力录像组的指标大于未观看组(观看暴力录像对孩子有显著影响) 1.在列ABC中输入原始数据;
2.计算离差di,在D2单元输入=B2-C2,往下复制到D17处; 3.计算离差绝对值,离差为0的样本忽略掉。
在E2输入=IF(D2<>0,ABS(D2),\"\"),往下复制到E17处;
4.计算离差绝对值的秩次,在F2输入=IF(D2<>0,RANK(E2,$E$2:$E$17,1),\" \");
由于Excel用Rank函数计算秩次时,对于相同数据是取最小秩次,而不是取平均秩次,不符合秩和检验的要求,因此需进行调整。
5.在G2输入=IF(D2<>0,F2+0.5*(COUNTIF($F$2:$F$17,F2)-1),\"\"),往下复制到G17处;
4
图 3.2 威尔科克森秩和检验
6.计算负的秩和,在J3输入公式=SUMIF(D2:D17,\"<0\; 7.计算正的秩和,在J3输入公式=SUMIF(D2:D17,\">0\; 8.在J4输入样本量n=n1+n2的公式=J3+J4;
9.本例为右侧检验,故统计量T=T+,在J8输入=J4; 10.计算正态分布的均值,在J9输入=J5*(J5+1)/4;
11.在J10输入标准差公式=SQRT(J5*(J5+1)*(2*J5+1)/24); 12.计算统计量Z,在J11输入=(J8-J9)/J10; 13.在J12输入显著水平0.05;
14.计算左侧临界值Z0.95,在J13输入=NORMSINV(1-J12); 15.在J14输入判决公式=IF(J11>J13,\"拒绝H0\接受H0\")。
因此当n=15,α=0.05时,由统计量Z>Z0.05,因此拒绝H0,认为观看暴力节目对孩子有显著影响。 注:小样本的检验
在样本量较小的情况下,再使用近似正态分布的方法进行检验就不太精确了。此时,可以根据一定的显著水平,查《威尔科克森秩和临界值表》可得临界值Ta,将统计量T与临界值比较,若T小于临界值,则拒绝H0。
四、两个样本检验――曼-怀特尼U检验 曼-怀特尼检验法是在威尔科克森秩和检验的基础上发展起来的,它适用于两个样本的检验,其方法是将一个样本的观察值大于另一个样本观察值的个数和作为检验统计量。
将样本X和Y混合后顺序排列,居于xi之前的y的个数,成为xi的逆转数,所有x的逆转数的总和记作Ux;所有y的逆转数的总和记作Uy。如果样本X和Y来自同一总体,那X和Y混合后应分布比较均匀,则逆转数总和Ux和Uy既不会太大,也不会太小;如果X分布在Y分布的左侧,那X的观察值就集中在左侧多一些,就会有Ux明显小于Uy;反之则Ux应明显大于Uy。
如果直接计算逆转数,当数据中存在相同值时,将可能使逆转数总和减少,一般采用间接法计算逆转数,其原理是因为混合样本中各数据值的逆转数与其秩次具有如下关系: Uxirii( i1,2,,n1);
Uyjrjj (j1,2,,n2)
所以逆转数总和Ux和Uy与秩和Rx和Ry之间也有:
n(n1)n(n1) UxRx11; UyRy22
22通过查表求得临界值上下限,将Ux和Uy与上下限比较,即可对检验做出判断。
例:某工厂欲测定在生产线上男女工人的生产效率有无明显差异,随机选择了9个男工和5个女工,每人的评分如图4所示,试以0.05的显著水平检验男女工人的生产效率是否相同。
5
作如下假设:H0:男女工人的生产效率无显著差异;
H1:男女工人的生产效率有显著差异。
1.在AB列中输入原始数据,如图4.1所示; 2.计算男工数据在混合样本中的秩次,
在C3输入=IF(ISNUMBER(A3),RANK(A3,$A$3:$B$11,1),\"\"),往下复制到C11处; 3.计算女工数据在混合样本中的秩次,
在D3输入=IF(ISNUMBER(B3),RANK(B3,$A$3:$B$11,1),\"\"),往下复制到D11处。
由于Excel计算秩时,对于相同数据取最小秩,不符合相同秩取平均秩的要求,因此需要进行调整。
图 4.1 曼-怀特尼检验法
4.在E3输入=IF(ISNUMBER(A3),C3+0.5*(COUNTIF($C$3:$D$11,C3)-1),\"\"),在F3输入=IF(ISNUMBER(B3),D3+0.5*(COUNTIF($C$3:$D$11,D3)-1),\"\")。选择区域E3:F3,往下复制公式到E11:F11处。
5.在I2和I3单元输入或计算n1和n2; 6.分别计算两组样本的秩和,
在I4输入=SUM(E3:E11),在I5输入=SUM(F3:F11); 7.根据秩和计算逆转数总和,
在I6输入=I4-I2*(I2+1)/2,在I7输入=I5-I3*(I3+1)/2。
计算得逆转数总和分别为43与11,本例采用双侧检验,由α=0.05,n1=9,n2=6,查表得临界值下限U/2U(0.025,9,6)10。
8.在I11输入上限公式=I2*I3-I10,得上限为44。
由10Ux4344,10Uy1144,因此接受H0,认为男女工人的操作效率不存在明显差异。 注:大样本检验
当样本容量较大(n1>20,n2>20)时,统计量U渐近于均值n1n2,标准差2n1n2(n1n21)12的正态分布,可以用正态分布作近似检验。
五、游程检验
在统计分析中常常要求随机抽取样本,但在一般研究中却常会遇到一组数据,要求检验其是否是随机的。游程检验就是检验一组数据是否随机的方法。首先需要说明什么是游程。假如我们从医院的记录中找出出生婴儿的性别,按照出生的先后顺序排列为
男,男,女,女,女,男,女,女,男,男,男,男
这里首先是2个男的连在一起,接着是3个女的连在一起,这种同种性质的单位连在一起就叫一个游程。序列中游程的总个数称为游程数r。如在上面的序列中,共有5个游程。
(一)、游程检验的原理
游程检验一般用来检验“样本是否是随机样本”的假设。它是通过检验随机抽取的样本按某种顺序排列的序列是否随机来实现。
将样本中两种性质的单位(符号)依次排列成一序列后,如果样本是随机抽取的,那么在序列中两种
6
符号出现的几率相等,出现的顺序也应该是交错的,而不会出现某种规则。若游程个数太少,意味着较多的同种符号连在一起,序列存在成群倾向;若游程个数太多,意味着两种符号频繁交替,序列存在混合倾向。因此,无论游程个数太少或太多,都表明序列不是随机的,序列的游程数应在一定范围内。可作如下假设:
1、双侧检验 H0:样本是随机样本
H1:样本不是随机样本
2、左侧检验 H0:样本是随机样本
H1:样本具有成群倾向
3、右侧检验 H0:样本是随机样本
H1:样本具有混合倾向
对于双侧检验,用r1代表下限,r2代表上限,因显著水平为α,所以两侧各占α/2,当r1 k1k2k2k1CnCCCr2kn21n11n2111 n1Cn1n2k1k2k1k1k2k2k1r2k1,1kn1Cn11Cn21Cn11Cn21P(Rr) n1 kk,kk1C21n1n2k2k1r2k1,kn1Cn11Cn21 n1kk,kk1Cn211n2(二)、单样本游程检验 例1:有一批容器,其重量有些差异。连续抽查了15个容器,其重量分别为3.6,3.9,4.1,3.6,3.8,3.7,3.4,4,3.9,4.1,3.9,4,3.8,4.2,4.1,能否认为其重量的变动是随机的(α=0.05)? 这是一个单样本游程检验问题,其操作方法为: 1.按图5.1所示输入标题,并在A2:A16中输入原始数据;然后在G1中输入中位数公式=MEDIAN(A2:A16),得中位数为3.9; 2.将数据在3.9以下的用B表示,在3.9以上的用A表示,正好为3.9的忽略掉。在B2单元格输入公式=IF(A2>$G$1,\"A\,并往下复制到B16处,则形成了一个由符号A和B混合成的序列; 3.在序列中有空白单元格,为便于游程数的计算,将空白单元调整为与序列中前一单元相一致,在C2输入=B2,在C3输入=IF(B3=\"\,复制公式到C16处; 4.在D2输入游程数初始值1,在D3输入=IF(C3=C2,D2,D2+1),并往下复制到D16处,得游程数为6。该方法的原理是每逢序列改变符号,则游程数加1。 5.接着计算符号A和B的个数n1和n2(n1≤n2); 在G2和G3分别输入公式=COUNTIF(B2:B16,\"A\")和=COUNTIF(B2:B16,\"B\"),其中小者应为n1,大者应为n2,在G4输入n1公式=MIN(G2:G3),在G5输入n2公式=MAX(G2:G3); 然后在G6,G7和G8中分别输入n1-1,n2-1和n1+n2的计算公式=G4-1,=G5-1和=G4+G5; 6.由于n1=n2=6,因此最大游程数为2n1=12,在I3:I13中输入该序列游程数的变动范围2到12; 7.接着计算k1和k2,在J3输入=INT((I3-1)/2),在K3输入=INT(I3/2)-1,选择区域J3:K3,复制公式到J13:K13处; 7 8.计算游程数为R的概率,在L3输入=(COMBIN($G$6,J3)*COMBIN($G$7,K3)+ COMBIN($G$6,K3)*COMBIN($G$7,J3))/COMBIN($G$8,$G$4),并往下复制到L13处; 9.计算求下限r1的左侧累计概率和求上限r2的右侧累计概率 先计算左侧累计概率,在M2输入0,M3输入=L3+M2,往下复制到M13处; 再计算右侧累计概率,在M14输入0,M13输入=L13+M14,往上复制到M3处。 图 5.1 单样本游程检验 10.在G10单元输入游程数6,在G11单元输入显著水平0.05; 11.在G12输入下限公式=INDEX(I3:I13,MATCH(G11/2,M3:M13,1),0); 12.在G13输入上限公式=INDEX(I3:I13,MATCH(G11/2,N3:N13,-1)+1,0)。 本例选择双侧检验,因显著水平α=0.05,所以两侧各占0.025。得下限r1=3,上限r2=11。本例中r1 ★注意:如果n1 否则系统将报告公式错误,具体情况请参阅(四)两个样本的游程检验。 (三)、大样本的游程检验 当n1,n2较大时,再使用计算累计概率的方式求上下限就比较麻烦了,可以考虑使用游程数r的近似分布进行检验。 当n1,n2不太小时,游程数r渐近于如下的正态分布: 均值2n1n21,标准差n1n22n1n2(2n1n2n1n2) 2(n1n2)(n1n21)因此可以通过正态分布进行近似检验。 (四)两个样本的游程检验 除适用于单样本随机性检验外,游程检验也适用于两个样本,用来检验“两总体是否服从同一分布”或“两个样本是否来自同一总体”的假设。其方法是将两个样本中的数据分别赋予符号A或B,再按将两个样本数据混合起来,按数据大小排序,就形成了一个由符号A或B混合形成的序列,再按照单样本游程检验的方法进行检验。 例:某工厂欲测定在生产线上男女工人的生产效率有无明显差异,随机选择了9个男工和5个女工,每人的评分如图5.2所示,试以0.05的显著水平检验男女工人的生产效率是否相同。 这是一个单侧检验,如果男女工人的生产效率影响无显著差异,则男女工人的评分混合后应具有较大的游程数。如果游程数过少,则表明数据存在成群倾向,即男女工人的生产效率具有较大差异。作如下假设: 8 H0:男女工人的生产效率无显著差异; H1:男女工人的生产效率有显著差异。 图 5.2 两个样本的游程检验 1.按图6所示在ABCD列中输入原始数据,分别赋予符号A和符号B; 2.将两组数据混合。在F1:G1单元输入标题“混合”和“符号”,选择第一组区域A2:A10,从“编辑”菜单中选“复制”,单击F2单元格,从“编辑”菜单中选“粘贴”;再选择第二组区域C2:D7,从“编辑”菜单中选“复制”,单击F11单元格,从“编辑”菜单中选“粘贴”,这样两组数据就混合在了一起; 3.混合后的数据排序。单击F2,从“数据”菜单中选择“排序”,单击“有标题行”按钮,“主要关键字”为“混合”,方式为“递增”,单击“确定”按钮。 4.在H2输入游程数初始值1,在D3输入=IF(G3=G2,H2,H2+1),并往下复制到H16处,得游程数为8。该方法的原理是每逢序列改变符号,则游程数加1。 5.接着计算符号A和B的个数n1和n2(n1≤n2),在K2和K3分别输入公式=COUNTIF(G2:G16,\"A\")和=COUNTIF(G2:G16,\"B\"),其中小者应为n1,大者应为n2,在K4输入n1公式=MIN(K2:K3),在K5输入n2公式=MAX(K2:K3);然后在K6,K7和K8中分别输入n1-1,n2-1和n1+n2的计算公式=K4-1,=K5-1和=K4+K5; 6.由于n1 COMBIN($K$6,O3)*COMBIN($K$7,N3))/COMBIN($K$8,$K$4),并往下复制到P13处;然后在P14中输入=COMBIN($K$6,O3)*COMBIN($K$7,N3)/COMBIN($K$8,$K$4); 9.计算累计概率,在Q2输入0,在Q3输入=P3+Q2,复制Q3公式到Q14处; 10.在K10单元输入游程数8,在K11单元输入显著水平0.05; 11.在K12输入下限公式=INDEX(M3:M14,MATCH(K11/2,Q3:Q14,1),0)。 本例为左侧检验,即检验数据变动是否有成群倾向,显著水平α=0.05。由累计概率得知,有0.024172≤0.05,因此下限r1=4。本例中r=于下限,因此接受H0,即男女工人的生产效率无显著差异。 也可以用报告法进行检验,由于本例游程数r=8,其对应的累计概率为P=0.566>0.05,不是小概率事件,因此接受H0。 六、卡方检验 七、柯—斯检验 (一)单样本柯—斯检验 柯尔莫哥洛夫-斯米诺夫(Kolmogorov-Smirnov)检验,简称柯-斯检验,也是一种拟合优度检验法。单样本的柯-斯检验主要用来检验一组数据的实际分布是否与指定的理论分布相一致,即检验样本数据是否来自符号某一理论分布的总体。 9 单样本柯-斯检验的原理主要是将实际累计频数与期望累计频数相比较,找出最大值,再判断该差异是否显著。 例1:为测定某化工厂产品的某种成分含量是否服从正态分布,随机抽取了200个样本,其数据经分组整理后如图7.1所示。试检验成分含量是否服从正态分布(α=0.05)? 图 7.1 单样本柯-斯检验 由于检验的正态分布参数均值、标准差都未知,故只能根据样本数据进行估计。 1.在列ABCD中输入原始数据,其中最后一组(75以上)为开放式组距,为便于计算,将上限设为一个足够大的数字以替代无穷大,本例选1000; 2.计算数据个数,在H2单元输入=SUM(D3:D10); 3.在H3单元输入平均数(加权)公式=SUMPRODUCT(C3:C10,D3:D10)/H2; 4.为便于计算标准差,先计算离差平方,在E3输入=(C3-$H$3)^2,往下复制到E10处;在H4输入标准差公式=SQRT(SUMPRODUCT(E3:E10,D3:D10)/H2); 将计算出的样本均值44、样本标准差15.66分别作为要检验的正态总体的估计值,建立如下假设: H0:样本数据服从均值为4.85,标准差为15.66的正态分布; H1:样本数据不服从均值为4.85,标准差为15.66的正态分布。 接着计算累计概率的最大差异值,并进行检验。 5.计算实际累计概率,在J3输入=D3/$H$2,在J4输入=D4/$H$2+J3,把J4的公式往下一直复制到J10处; 6.计算正态累计概率,在K3输入=NORMDIST(B3,$H$3,$H$4,1),往下一直复制到K10处; 7.计算正态理论概率与实际概率之间的绝对差值,在L3输入=ABS(J3-K3),也往下复制到L10处; 8.求出最大差值,在L12输入=MAX(L3:L9),得最大差值为0.009; 9.因n>50,α=0.05,临界值为1.358n,在L14输入=1.358/SQRT(H2),得临界值为0.096。 由于最大差值0.009小于临界值0.096,因此不能拒绝H0,故接受产品中该成分含量符合正态分布的假设。 (二)常见分布的柯-斯检验 除了前例中的正态分布外,柯-斯检验也可以对其他各种标准分布或特殊分布进行检验,只要能给出该分布的期望累计频率即可。同时,检验既可对分组数据进行,也可对未分组数据进行。 例2:一组数据如图7.2中B列所示,试判断该数据是否符合正态、均匀和指数分布(α=0.05)? 10 图 7.2 常见分布柯-斯检验 由于检验的各种分布的参数都未知,故只能根据样本数据进行估计。 1.在列AB中输入原始数据(本例中各数据已按大小递增排序,否则还需从“数据”菜单中选择“排序”命令,将数据递增排序); 2.在D3单元输入数据个数公式=COUNT(B3:B18);在D4单元输入平均数公式=AVERAGE(B3:B18);在D5输入标准差公式=STDEV(B3:B18);在D6输入最小值公式=MIN(B3:B18);在D7输入最大值公式=MAX(B3:B18)。 要检验的各种分布的参数估计值为: 正态分布均值μ=5.53、标准差σ=2.37; 均匀分布的范围为2.1~10.3; 指数分布1ex中参数115.53; 接着计算累计概率的最大差异值,并进行检验。 3.计算实际累计概率,在G3输入=A3/$E$3; 4.计算正态累计概率,在H3输入=NORMDIST(B3,$E$4,$E$5,1); 5.计算均匀累计概率,在I3输入=(B3-2.1)/(10.3-2.1); 6.计算指数累计概率,在J3输入=EXPONDIST(B3,1/$E$4,1); 7.选择区域G3:J3,往下一直复制公式到G18:J18处,得各种累计概率值。 9.计算累计理论概率与实际累计概率之间的绝对差值,在K3输入=ABS($G3-H3),往右复制到M3处;选择区域K3:M3,往下复制公式到K18:M18处; 8.求出最大差值,在K20输入=MAX(K3:K18),往右复制公式到M20处。 得最大差值分别为0.1、0.236、0.344。由n=16,α=0.05,查表得临界值为0.33。检验结论为: 由于0.1<0.33,因此不能拒绝该组数据服从正态分布的虚假设; 由于0.236<0.33,因此不能拒绝该组数据服从均匀分布的虚假设; 由于0.344≥0.33,因此拒绝该组数据服从指数分布的虚假设。 柯-斯检验与卡方检验都属于拟合优度检验,但卡方检验一般都要求一个大样本,对于样本量很小的资料,卡方检验不能适用,而柯-斯检验则有临界值表可供使用;其次卡方检验原则上要求期望频数小于5的单元格数目不能多于20%,而柯-斯检验则无此;第三在样本量相同的情况下,柯-斯检验对H0假设能提供更高的拒绝率,比卡方检验更敏感。 八、相关性度量 以前研究两组变量之间相互关系的密切程度问题时曾介绍过皮尔逊简单相关系数r,但简单相关系数 11 是反映两组变量之间的线性相关的程度,若两组变量之间存在非线性的联系,相关系数就受到;此外,简单相关系数要求变量必须是数值型(定距尺度),而现实资料往往缺乏数值计量,因而也需要用非参数的方法。 (一)、斯皮尔曼秩相关系数 斯皮尔曼(Spearman)秩相关系数是反映两组变量之间联系的密切程度,它和皮尔逊简单相关系数一样,取值在-1到1之间,不同之处在于它是建立在秩(等级)的基础上计算的。现结合一例说明,有X和Y两个变量的样本数据如下表所示,现研究两个变量之间是否存在联系。 数据X Y Rx 等级Ry 50 500 6 6 60 510 5 5 70 530 4 4 80 580 3 3 90 560 2 2 95 1000 1 1 由数据分析,X变量越大,Y也越大,二者联系程度很高,但是简单相关系数为r=0.676,并不是太大,这主要由于二者的关系不是线性的。如果分别转换为等级,则可以计算出他们的秩相关系数高达1。 1、 斯皮尔曼秩相关系数的计算 斯皮尔曼秩相关系数的计算方法可以是将两组变量数据X和Y分别转换为秩(等级)Rx和Ry后,用简单相关系数的计算公式对两组秩进行计算求得。 也可以算出每一对样本的秩之差diRxRy,然后用下列公式计算 16di2n3n 例:为研究学生的考试成绩与学习时间的关系,随机抽取了20名学生的调查数据,试对此进行研究。 图 8.1 斯皮尔曼秩相关系数 (1)在列ABC中输入学生的原始数据; (2)分别计算X和Y的秩次。 在D2输入=RANK(B2,$B$2:$B$21,0)+0.5*(COUNTIF($B$2:$B$21,B2)-1), 在E2输入=RANK(C2,$C$2:$C$21,0)+0.5*(COUNTIF($C$2:$C$21,C2)-1), 选择区域D2:E2,往下一直复制公式到D21:E21处; (3)在F2输入秩次离差公式=E2-D2,并往下复制到F21处。 12 (4)在I1输入样本单位数n的数值20; (5)先计算简单相关系数,在I4输入=PEARSON(C2:C21,B2:B21)。 得简单相关系数为0.686,并不算太高,继续计算斯皮尔曼秩相关系数。 (6)对计算出的秩Rx和Ry使用皮尔逊公式计算秩相关系数, 在I6输入=PEARSON(E2:E21,D2:D21),得秩相关系数为0.872。 (7)按斯皮尔曼公式计算秩相关系数,在I8输入=1-6*SUMSQ(F2:F21)/(I2^3-I2)。 计算得斯皮尔曼秩相关系数为0.8726,比简单相关系数0.6大得多,可见学生成绩与复习时间之间存在很强的联系,但这种联系的线性关系不强。 2、相同秩次的处理 由图中可以看出,两种方法计算出的秩相关系数有些小区别,主要是样本数据中存在相同值,其秩也相应取平均值的缘故。当资料中存在相同秩次时,按斯皮尔曼公式计算出的秩相关系数会偏大,但在相同秩次比例不大的情况下,一般可以忽略,不必进行调整。如果相同秩次的比例较大,则应用下式对秩相关系数进行修正。 2NTxTydi2(NTx)(NTy)3 式中N(nn)12, Tx (t3iti)12, Ty(t3jtj)12,ti为X变量中同一个秩的样本 单位数,tj为Y变量中同一个秩的样本单位数。 继续对斯皮尔曼秩相关系数进行修正: 图 8.2 高级筛选对话框 (8)选择区域D1:E1,将内容复制到K1:L1处; (9)单击单元D2,从“数据”菜单中选择“筛选”下的“高级筛选”命令; (10)如图8.2“方式”选“将筛选结果复制到其他位置”,“数据区域”中输入D1:D21,“条件区域”为K1,“复制到”为K1,并选中“选择不重复的记录”复选框,单击“确定”按钮; (11)单击单元E2,从“数据”菜单中选择“筛选”下的“高级筛选”命令; (12)在“方式”中选“将筛选结果复制到其他位置”,“数据区域”中输入E1:E21,“条件区域”为L1,“复制到”为L1,并选中“选择不重复的记录”复选框,单击“确定”按钮; (13)在M2输入=COUNTIF($D$2:$D$21,K2),往下复制公式到M18处; (14)在N2输入=COUNTIF($E$2:$E$21,L2),往下复制公式到N17处; (15)计算临时变量N,Tx和Ty,在I10输入=(I1^3-I1)/12, 在I11输入=SUM(M2:M18^3-M2:M18)/12, 在I12输入=SUM(N2:N17^3-N2:N17)/12; ★注意:I11和I12单元为数组公式,一定要按Ctrl+Shift+Enter组合键确认。 (16)计算修正的斯皮尔曼秩相关系数,在I13输入公式 =(2*I10-I11-I12-SUMSQ(F2:F21))/(2*SQRT((I10-I11)*(I10-I12)))。 13 得修正的斯皮尔曼秩相关系数为0.872,与按皮尔逊公式计算出的秩相关系数完全一致。 3、斯皮尔曼秩相关系数的显著性检验 斯皮尔曼秩相关系数与简单相关系数一样,与样本容量有关,尤其在样本容量较小时,其变异程度很大,因此有必要对其进行显著性检验。其检验方法与简单相关系数的检验相同,可以建立如下假设: 双侧检验 H0:X和Y相互 H1:X和Y相互不(相关) 左侧检验 H0:X和Y相互 H1:X和Y负相关 右侧检验 H0:X和Y相互 H1:X和Y正相关 秩相关系数的显著性可用统计量t来检验, t(n2)(1rs2) t统计量服从自由度为n-2的t分布。 对本例中的斯皮尔曼秩相关系数的显著性进行检验。 (1)在I16输入t统计量计算公式=I13*SQRT((I1-2)/(1-I13^2)); (2)在I17输入显著水平0.05; (3) 在I18输入自由度公式=I2-2; (4)计算临界值t(a/2,n-2),在I19输入临界值公式=TINV(I17,I18); (5)在I20输入判决公式=IF(ABS(I16)>I19,\"拒绝H0\接受H0\")。 由于统计量t的绝对值7.26大于临界值2.10,因此拒绝H0,复习时间X与考试成绩Y之间存在相关关系。 (6)进一步计算实际的显著水平,在I21输入=TDIST(ABS(I16),I18,2)。 得实际显著水平约等于0,远远小于0.05,因此结论也是拒绝H0。 4、小样本的检验 在样本量较小(n<10)的情况下,再使用t分布的方法进行检验就不太精确了。此时,可以根据一定的显著水平,查《斯皮尔曼秩相关系数临界值表》可得临界值,将斯皮尔曼秩相关系数ρ与临界值比较,若ρ大于或等于临界值,则拒绝H0。 (二)、肯达尔秩相关系数 肯达尔(Kendall)秩相关系数τ也是用来评定两组秩之间的相关程度。在计算肯达尔秩相关系数前,先来了解一致对与非一致对的概念。 在由变量X和Y组成的随机样本中,如果某一样本单位的两个变量值都分别比另一样本单位的两个变量值大,则称这两个样本单位为一致对;如果某一样本单位的两个变量值与另一样本单位的两个变量值相比为反方向变化(一个变大,一个变小),则称这两个样本单位为非一致对;如果两个样本单位中的某一个变量取值相同,则这两个样本单位既不是一致对,也不是非一致对。 1、肯达尔秩相关系数的计算 用Nc表示一致对的数目,用Nd表示非一致对的数目,则n个样本中可能的对数为Cnn(n1)/2。肯达尔秩相关系数的计算公式为: 2NcNdNcNd 2n(n1)2Cn若所有样本单位都是一致对,则τ=1,X和Y完全正相关;若所有样本单位都是非一致对,则τ=-1, X和Y完全负相关。 例:对前节使用的复习时间X和考试成绩Y资料,试计算其肯达尔秩相关系数。 (1)在第一行输入标题,在列ABC中输入学生的原始数据,如图8.3; (2)分别计算X和Y的秩次。 在D2输入=RANK(B2,$B$2:$B$21,0)+0.5*(COUNTIF($B$2:$B$21,B2)-1), 14 在E2输入=RANK(C2,$C$2:$C$21,0)+0.5*(COUNTIF($C$2:$C$21,C2)-1), 选择区域D2:E2,往下一直复制公式到D21:E21处; (3)将X的秩次Rx按升序排列。 单击D2单元,选择“数据”菜单中的“排序”命令,选择“有标题行”按钮,“主要关键字”指定为Rx,方式为“递增”,再单击“确定”按钮。 (4)在G2、G3分别输入1、2,选择G2:G3,向下拖拉填充句柄至G21处; (5)计算一致对,在H2输入 =COUNTIF(OFFSET($E$2:$E$21,G2,0),\">\"&TEXT(E2,\"0.0\")); (6)计算非一致对,在I2输入 =COUNTIF(OFFSET($E$2:$E$21,G2,0),\"<\"&TEXT(E2,\"0.0\")); (7)选择区域H2:I2,往下复制公式到H21:I21处。 (8)在L2输入样本量n的数值20; (9)计算一致对总数Nc,在L3输入公式=SUM(H2:H21); (10)计算非一致对总数Nd,在L4输入公式=SUM(I2:I21); (11)计算肯达尔秩相关系数,在L7输入=(L3-L4)/(L2*(L2-1)/2)。 图 8.3 肯达尔秩相关系数 计算得肯达尔秩相关系数为0.65,小于前面计算出的斯皮尔曼秩相关系数0.8633。这是由于两者采用了不同的方法进行计算,因此即使用同样的资料,也会得出不同的结论。一般情况下,肯达尔秩相关系数的绝对值会小于斯皮尔曼秩相关系数的绝对值,但决不能据此得出肯达尔秩相关系数不如斯皮尔曼秩相关系数显著的错误结论。 2、相同秩次的处理 当资料中存在相同秩次时,计算出的肯达尔秩相关系数会偏大,但在相同秩次比例不大的情况下,一般可以忽略,不必进行调整。如果相同秩次的比例较大,则应用下式对肯达尔秩相关系数进行修正。 NcNd(NTx)(NTy)2 式中N(n1)2, Tx(t2i1)2 , Ty(t2)2,ti为X变量中同一个秩的样本单位j1数,tj为Y变量中同一个秩的样本单位数。 3、肯达尔秩相关系数的显著性检验 对于肯达尔秩相关系数是否显著,也可以通过显著性检验进行判断。在n不太小时(n>10),可认为 15 τ服从均值0,标准差2(2n5)的正态分布, 9n(n1)因此可以用正态分布进行近似检验。 对本例中的肯达尔秩相关系数的显著性进行检验,选择右侧检验,判断复习时间X与考试成绩Y之间是否为正相关关系。 (12)在L10输入标准差公式=SQRT(2*(2*L2+5)/(9*L2*(L2-1))); (13)在L13输入Z统计量计算公式=L7/L10; (14)在L14输入显著水平0.05; (15)计算右侧临界值Z(1-a),在L19输入临界值公式=NORMSINV(1-L14); (16)在L20输入判决公式=IF(L13>L19,\"拒绝H0\接受H0\")。 由于统计量Z的值4.25大于右侧检验临界值1.,因此拒绝H0,复习时间X与考试成绩Y之间存在正相关关系。 4、小样本的检验 在样本量较小(n≤10)的情况下,再使用正态统计量进行检验就不太精确了。此时,使用检验统计量为TNcNd,根据一定的显著水平,查《肯达尔秩相关系数临界值表》可得临界值T1,而TT1。将统计量T与临界值比较,若TT1,则接受正相关的备择假设,若TT,则接受负相关的备择假设。 九、多个相关样本检验 (一)、科库兰检验 科库兰(Cochran)检验同样适用于k个相关样本整体差异的检验,要求资料必须是二分数据(如“合格”与“不合格”,“成功”与“失败”等),一般用“1”(成功,合格等)和“0”(失败,不合格等)表示。 科库兰检验只能进行双侧检验,检验假设为: H0:k个样本间无显著差异 H1:k个样本间有显著差异(不完全相同) 其基本思路是将样本数据(二分型0,1数据)排成n行k列的表格,如果H0为真,那么“0”和“1”应随机地分布在表格的各行各列中。科库兰检验用Q统计量来评价表格中各行各列的偏差大小。 (xi)2k(k1)2Q(xi) 2kkyjyj其中xi表示第i中处理方法或措施中包含“1”的个数(该方法或措施的成功样本单位数)(i=1,2,3„,k),yj表示第j个样本单位中包含的“1”的个数(该样本单位认可的处理方法或措施数)(j=1,2,3„,n)。 总偏差Q近似服从自由度为k-1的卡方(2)分布,可用2分布进行检验。 例:假设一个训练方案分成4个单元,每个单元采用一种不同的方法,参加此训练的有14随机抽取 的学生,在每个单元结束时对这14人进行考核,其成绩如图9.1所示。试检验这四种方法总的效果之间有无显著差异(α=0.05)? 由于资料数据为定距尺度,所以先将数据转换为定类尺度后,用科库兰法再进行检验。 定义成绩满分为30分,大于等于18分为及格,用“1”表示,小于18分为不及格,用“0”表示。 16 图 9.1 科库兰检验 1.在ABCDE列输入原始数据; 2.转换成绩为0,1数据,在G2输入=IF(B2>=18,1,0),将公式往右复制到J2处; 3.选择区域G2:J2,拖拉填充句柄往下复制公式到G15:J15处; 4.计算行列中包含的“1”的个数。 选择区域G16:J16,单击工具栏上的“自动求和”按钮Σ,得出各种训练方法的xi;选择区域K2:K15,单击工具栏上的“自动求和”按钮Σ,得出各学生对应的yj;选择单元K16,单击工具栏上的“自动求和”按钮Σ,计算 x和yij。 接着进行检验,建立假设:H0:4种方法整体效果无显著差异 H1:4种方法整体效果间存在显著差异 5.在N2,N3中输入或计算出处理方法数k和样本容量n; 6.为计算统计量r,先计算中间数据=SUMSQ(K2:K15); 7.计算统计量r,在N8输入 =N2*(N2-1)*(N5-K16^2/N2)/(N2*K16-N6) 8.计算临界值,k1,在N10输入=CHIINV(M6,M2-1); 9.在N11输入判断公式=IF(N8 再计算实际显著水平(概率),用报告法进行判断。 10.在N13输入=CHIDIST(N8,N2-1)。 得实际显著水平为0.62,大于0.05,不是小概率事件,因此接受H0。 (二)、弗利得曼检验 弗利得曼(Friedman)检验用来检验K个相关样本的结果在整体上是否存在显著差异,因此也只能进行双侧检验,检验假设为:H0:k个样本间无显著差异 H1:k个样本间有显著差异(不完全相同) 弗利得曼检验要求的数据至少是定序尺度。其检验的基本方法是将样本数据排成n行k列的表格,对每一行数据分别求秩。如果k个样本无显著差异,那么每一列中的秩应该是随机分布的,若不是随机分布,则表明k个样本间存在显著差异。 按列求秩和Tj,对于每一样本而言,其平均秩和应为n(k1)2,定义实际秩和Tj与平均秩和的离 17 22222x2i和 y2j,在N5输入=SUMSQ(G16:J16),在N6输入 n(k1)差平方和为S,即STj。当k个样本完全一致时,得到最大离差平方和nk(k1)12,2j1由实际离差平方和S与最大离差平方和相比,得出检验统计量 k1212n(k1)2 r STjnk(k1)nk(k1)j12当H0成立时,r2服从自由度为k-1的卡方分布,可用此进行检验。 2n2例:假设一个训练方案分成4个单元,每个单元采用一种不同的方法,参加此训练的有14随机抽取的学生,在每个单元结束时对这14人进行考核,其成绩如图9.2所示。试检验这四种方法总的效果之间有无显著差异(α=0.05)? 1.在ABCDE列输入原始数据; 2.对每一行分别求秩,在G2输入 =RANK(B2,$B2:$E2,1)+0.5*(COUNTIF($B2:$E2,B2)-1)(注意地址引用), 再将公式往右一直复制到J2处; 3.选择区域G2:J2,拖拉填充句柄往下复制公式到G15:J15处; 4.计算秩和,选择区域G16:J16,单击工具栏上的“自动求和”按钮Σ,得出各种训练方法的秩和。 接着进行检验,建立假设:H0:4种方法整体效果无显著差异 H1:4种方法整体效果间存在显著差异 5.在M2,M3中输入或计算出处理方法数k和样本容量n; 6.计算统计量r2,在M5输入=12*DEVSQ(G16:J16)/(M3*M2*(M2+1)); 27.计算临界值,k1,在M7输入=CHIINV(M6,M2-1); 8.在M8输入判断公式=IF(M5 法整体效果不存在明显差异。 此外,也通过计算实际显著水平(概率),用报告法进行判断。 9.在M10输入=CHIDIST(M5,M2-1)。 得实际显著水平为0.,大于0.05,不是小概率事件,因此接受H0。 图 9.2 弗利得曼检验 从科库兰检验与弗利得曼检验的结果分析,二者得出了相同的结论,但弗利得曼检验的灵敏度高于科库兰检验。 由于弗利得曼至少要求定序尺度,而科库兰检验必须要求定类尺度(二分型),由此可看出,科库兰检验的层次和效率低于弗利得曼检验。如果数据至少为定序尺度,应优先选择弗利得曼检验,如选择科库 18 兰检验,则必须将定序尺度数据转换为定类尺度,可能会浪费数据中包含的许多信息。另外,在样本容量很小时,科库兰检验不再适用,而弗利得曼检验则不受样本容量的。 (三)、肯达尔检验 肯达尔(Kendall)检验用于检验多个相关样本间的一致性程度,要求资料至少为定序尺度。其最基本的表现为对同一个样本(同一批学生),按k个不同的方法对样本数据进行评秩(让k个不同的教师对学生打分),然后检验这k种方法(k个教师)的评秩结果是否彼此无关。 肯达尔法只能进行双侧检验,检验假设为:H0:k个样本间秩评定彼此无关; H1:k个样本间秩评定彼此相关。 其基本思路是令样本单位数为n,评秩的方法数为k,将数据组织成一个n行k列的表格。对每一列数据分别求秩,然后对每一样本单位(每一行),求出k种评秩方法给于的秩和Rj (j1,2,n)。 对于每一样本单位而言,其平均秩和应为k(n1)2,定义实际秩和Rj与平均秩和的离差平方和为S, n2k(n1)22即SRj。当k种评秩方法完全一致时,得到最大离差平方和kn(n1)12。由实际2j1离差平方和S与最大离差平方和相比,得出反映k种评秩方法的一致程度,即一致性系数W n12S123(n1)2 W2Rj222n1kn(n1)kn(n1)j1W的取值在0至1之间,若W=0,表明k种评秩方法彼此不相关;若W=1,表明k组评秩方法之间完 全相关,即完全一致。 当样本容量n不太小(n>7)时,检验统计量2k(n1)W近似服从自由度为n-1的卡方分布,因此可以用卡方检验来判断检验假设。 例:继续采用前节的实例,试判断四种训练方法的效果是否彼此无关。 建立检验假设:H0:四种训练方法的效果彼此无关; H1:四种训练方法的效果彼此相关。 图 9.3 肯达尔检验 1.在ABCDE列输入原始数据; 2.对每一列分别求秩,在G2输入 =RANK(B2,B$2:B$15,1)+0.5*(COUNTIF(B$2:B$15,B2)-1)(注意地址引用), 再将公式往右一直复制到J2处; 3.选择区域G2:J2,拖拉填充句柄往下复制公式到G15:J15处; 4.计算秩和,选择区域K2:K15,单击工具栏上的“自动求和”按钮Σ,得出各样本单位的秩和。 5.在N2,N3中输入或计算出处理方法数k和样本容量n; 6.计算秩和的实际离差平方和,在N5输入=DEVSQ(K2:K15); 19 7.计算一致性系数W,在N6输入=12*N5/(N2^2*N3*(N3^2-1))。 得一致性系数为0.485,不是太小,说明四种训练方法的效果间彼此有一定关系,继续检验。 8.计算统计量2,在N7输入==N2*(N3-1)*N6; 29.计算临界值,n1,在N9输入=CHIINV(N8,N3-1); 10.在M8输入判断公式=IF(N7 训练方法的效果彼此相关。 此外,也通过计算实际显著水平(概率),用报告法进行判断。 11.在N12输入=CHIDIST(N7,N3-1)。 得实际显著水平为0.0215,小于0.05,属于小概率事件,因此拒绝H0。 1、相同秩次的处理 从图16.14可以看出,若一列中有两个或两个以上的数据相同时,应采用平均秩次,但这种处理方法将使一致性系数W偏小。如果相同数据的比例很小,可以忽略这种影响;如果比例较大,则应进行修正,修正公式为: W1W,其中t为在某一秩次上相同的样本观察值个数。 3(titi)k(n3n)修正后的一致性系数W将比原系数值更加显著,因此,如果原W系数已经很显著(拒绝H0)的情况下,也可以考虑不进行修正。 ★关于相同秩次的样本观察值个数和 3(titi)的计算,请参阅节16.9.1.2 相同秩次的处理。 2、小样本的检验 对于小样本(3≤k≤20,3≤n≤7),则以离差平方和S作为检验统计量。 根据一定的显著水平,查《肯达尔检验临界值表》,若离差平方和S大于等于查出的临界值,则应在此显著水平上拒绝H0。 十、 多个样本检验 (一) 克罗斯考尔—瓦里斯检验 在前面方差分析的学习中曾介绍过利用单因子方差分析,检验多个样本所属的总体是否具有相同的平均值。但方差分析要求总体为正态分布,且假设各总体的方差相等,若这些条件不满足结论就会受到影响。 克罗斯考尔-瓦里斯(Kruskal-Wallis)单因子方差分析不依赖于以上严格的假设,可用来检验k个样本是否来自同一总体。它建立在等级的基础上,要求资料至少为定序尺度,且k个样本来自k个连续分布的总体。 设有k个随机样本,抽自k个总体,样本容量分别为n1,n2,„,nk,建立双侧假设: H0:k个总体的中位数是相同的; H1:k个总体的中位数不完全相同。 将所有样本数据混合后(n=n1+n2+„+nk)对每一样本值分别求秩,再将k个样本的秩分别求和。第j个样本的秩和期望值为nj(n1)/2,当H0为真时,各样本的秩和(用样本容量调整)应比较接近期望秩和,若秩和差别较大,则应拒绝H0。 克罗斯考尔—瓦里斯检验的统计量H为各样本的秩和与期望秩和之间离差的加权平方和,以样本容量的倒数为权数。 kRnj(n1)12112jH3(n1) Rjn(n1)j1nj2n(n1)j1nj当样本容量不太小时(nj5),H近似于自由度为k-1的卡方分布,可以利用卡方分布进行检验。 k2例:由20位专家对A、B、C三种牌号的自行车进行评价(每位专家只评价一种自行车),方法为对 20 自行车性能分解评分再加总,评分情况如图10.1所示,要求检验专家对这三种自行车的评价是否一致(α=0.05)? 建立假设:H0:三种自行车的总评价一致; H1:三种自行车的总评价不完全一致。 图 10.1 克罗斯考尔—瓦里斯检验 1.在ABC列输入原始数据; 2.对每一样本数据分别求秩,在E2输入=IF(ISNUMBER(A2), RANK(A2,$A$2:$C$8,1)+0.5*(COUNTIF($A$2:$C$8,A2)-1),\"\"), 将公式往右一直复制到G2处,再选择区域E2:G2,往下复制公式到E8:G8处; 4.计算秩和,选择区域E9:G9,单击工具栏上的“自动求和”按钮Σ,得出各样本的秩和。 5.计算各样本的样本容量,在E10输入=COUNT(E2:E8),往右复制到G10处; 6.在J2输入样本容量n的公式=SUM(E10:G10); 7.在J3中输入样本个数k的数值3; 8.计算中间数据 nj1kRjj,在J5输入=SUM(E9:G9^2/E10:G10); ★此为数组公式,一定要按Ctrl+Shift+Enter组合键确认。 9.计算统计量H,在J6输入=12*J5/(J2*(J2+1))-3*(J2+1); 10.计算临界值,k1,在J8输入=CHIINV(J7,J3-1); 11.在J9输入判断公式=IF(J6 此外,也通过计算实际显著水平(概率),用报告法进行判断。 12.在J10输入=CHIDIST(J6,J3-1)。 得实际显著水平为0.036,小于0.05,因此拒绝H0。 注意:相同秩次的处理 如果在混合样本中有两个或两个以上的数据相同时,一般采用平均秩次,但这种处理方法将使统计量H偏小。如果相同数据的比例很小,可以忽略这种影响;如果比例较大,则应进行修正,修正公式为: 22H1H,其中t为在某一秩次上相同的样本观察值个数。 3(titi)(n3n)修正后的统计量H将比修正前的数值大,因此,如果原H值已经很显著(拒绝H0)的情况下,实际上就不用再修正了。 (二)、中位数检验 中位数检验实质上可以认为是多个样本的符号检验,可以检验多个样本的中位数是否相同。 它要求多个样本的数据至少是定序尺度,设有k个随机样本,抽自k个总体,建立双侧假设: 21 H0:k个总体的中位数是相同的; H1:k个总体的中位数不完全相同。 将所有样本数据混合后,求出混合样本的中位数,然后将每个样本的观察值与中位数比较,对于中位数用正号表示,小于中位数用负号表示,等于则忽略掉。分布求出各样本的正负号个数,然后排成一个2行k列的表格,第一行列出各样本中包含的正号个数,第二行列出各样本中包含的负号个数,就组成了一个列联表。对该列联表可以通过卡方检验对H0进行检验和判断。 例:使用前节各自行车的评分数据,采用中位数检验法判断专家们对各自行车的评价有无明显差异(α=0.05)? 1.如图10.2,在ABC列输入原始数据; 2.计算中位数,在F1单元输入=MEDIAN(A2:C8),得中位数为76; 3.在H1:L1中输入标题(如图16.13),在H2:H3中输入正负号; 4.计算实际频数。 在I2输入=COUNTIF(A$2:A$8,\">76\"),复制公式到I3中;选择区域I2:I3,往右复制到K2:K3处; 5.对列联表进行汇总。 选择区域I4:K4,单击工具栏上的“自动求和”按钮Σ,得出列小计数;选择区域L2:L4,单击工具栏上的“自动求和”按钮Σ,得出行小计数和总计数。 图 10.2 中位数检验 6.在H6:L6中输入期望频数标题(如图10.2),在H7:H8中输入正负号; 7.计算期望频数,期望频数=行小计×列小计/总计。 在I7输入=I$4*$L2/$L$4(注意单元格地址引用),复制公式到I8中;选择区域I7:I8,往右复制到K7:K8处; 8.进行卡方检验,在F3输入公式=CHITEST(I2:K3,I7:K8)。 得到实际的显著水平(概率)为0.063,大于给定的显著水平0.05,因此应接受H0,即专家们对三种自行车的整体评价无显著差别。 也可以继续计算卡方值,进一步进行判断。 9.首先计算自由度df=(行数-1)×(列数-1)。 在F4和F5中输入行数2和列数3,在F6输入自由度公式=(F4-1)*(F5-1); 10.由卡方值=(实际频数-期望频数)^2/期望频数,在F7输入卡方值公式 =SUM((I2:K3-I7:K8)^2/I7:K8); ★此为数组公式,一定要按Ctrl+Shift+Enter组合键确认。 11.在F8输入临界值公式=CHIINV(F2,F6)。 在α=0.05时,得临界值为5.99。由于卡方值小于临界值,因此应接受H0,认为三种自行车的总评价是一致的。 前面克罗斯考尔—瓦里斯检验结论为拒绝H0,其实际显著水平为0.036。由此可见,中位数检验(多个样本的符号检验)浪费了数据中的较多信息,其敏感度不如克罗斯考尔—瓦里斯检验。 22
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务