您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页非参数统计实验(全)新

非参数统计实验(全)新

来源:化拓教育网
第四章 非参数统计实验

参数统计学中的许多统计分析方法的应用对总体都有严格的假定,例如,t检验要求总体服从正态分布,F检验要求误差呈正态分布且各组方差为齐性的等等,然而在现实生活中,有许多总体的分布我们却是一无所知或知之甚少,所以在参数模型中所建立的统计推断就会失效,于是,人们希望在不假定总体分布的情况下,尽量从数据本身来获得所需要的信息。这就是非参数统计的宗旨。非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。

实验一 卡方检验(Chi-square test)

实验目的:

掌握卡方检验方法。 实验内容:

一、2拟合优度检验 二、2性检验 三、2齐性检验 实验工具:

SPSS非参数统计分析菜单项和Crosstabs菜单项。 知识准备:

一、卡方拟合优度检验

检验(Chi—Square Test) 适用于拟合优度检验,适用于定类变量的检验问

2题,用来检验实际观察数目与理论期望数目是否有显著差异。当检验问题是实际分布是否与理论分布相符合时,在大样本时也可以用分类数据的卡方检验来解决,这时的卡方检验也称为分布拟合的卡方检验。

若样本分为k类,每类实际观察频数为f1,f2,,fk,与其相对应的期望频数为

e1,e2,,ek,则检验统计量2可以测度观察频数与期望频数之间的差

异。其计算公式为:

k2i1(fiei)ei2(实际频数期望频数)2期望频数

很显然,实际频数与望频数越接近,2值就越小,若2=0,则上式中分子的每—项都必须是0,这意味着k类中每一类观察频数与期望频数完全一样,即完全拟合。2统计量可以用来测度实际观察频数与期望频数之间的拟合程度。

在H0成立的条件下,样本容量n充分大时,2统计量近似地服从自由度df=k-1的

2分布,因而,可以根据给定的显著性水平,在临界值表中查到

2相应的临界值(k1)。若2(k1),则拒绝H0,否则不能拒绝H0。

2所有的统计软件都可以输出检验统计量的显著性p值,也可以根据显著性p值和显著性水平作比较,若p,则拒绝H0,否则不能拒绝H0。

另外卡方拟合优度检验也可以用来检验某总体是否服从某一特定分布的假设。拟合优度检验中几种常用分布的参数如表4-1:

表4-1 拟合优度检验中几种分布的参数 分布 参数 估计值 参数个数 df 二项分布 泊松分布 正态分布 指数分布 二、2性检验

 2xffx x,s2 1 1 k-2 k-2 k-3 k-2 , 1/ 2 1 1/x 假设有n个随机试验的结果按照两个变量A和B分类,A取值为A1,A2,…,Ar,B取值为B1,B2,…,Bs,则形成了一张rs的列联表,称为rs二维列联

rs表。其中nij表示A取Ai及B取Bj的频数,nijn,其中:

i1sj1ni.nj1rij,i1,2,...,r表示各行的频数之和

n.jni1ij,i1,2,...,s表示各列的频数之和

令pijP(AAi,BBj)(i1,2,...,r;j1,2,...,s),pi.和p.j分别表示各行和各列的边缘概率,对于rs二维列联表,如果变量A和变量B是的,则A和B的联合概率应该等于A和B边缘概率的乘积。因而有如下检验:

H0:pijpi.p.j

在H0成立的条件下,rs二维列联表中的期望频数为:

eijni.n.jnr

s则2i1j1(nijeij)eij2

如果期望频数eij5,则2统计量近似服从自由度为(r1)(s1)的卡方分布。如果Pearson2值过大,或p值过小,则拒绝H0,认为变量A和变量B存在某种关联,即不是的;否则不能拒绝H0,认为是的。

如果期望eij5,则需要将其合并使得期望频数eij5,否则容易夸大卡方统计量值,导致拒绝原假设的结论。

三、 2齐性检验

与2性检验类似的是2齐性检验。

实际问题中,假设有n组从不同来源得到的数据,要判定这些数据的来源是否相同(相同的分布),统计上我们可以将这些问题表述为:

假定有k组样本,分别取自k个总体,要检验这k个总体的分布是否相同。这样的假设检验问题称为“齐次性检验”。

对一般的rs二维列联表,可以提出假设:

H0:pi1pi2...pis(i1,2,...,r)

在H0成立的条件下,这些概率pij与j无关,因此nij的期望值(理论频数)为n.jpij,pi.rsni.n,因此期望值eijn.jpi.2ni.n.jn,则

2检验统计量为:

2i1j1(nijeij)eij

与2性检验一样,如果eij5,则2统计量近似服从自由度为

(r1)(s1)的卡方分布。如果Pearson2值过大,或p值过小,则拒绝H0,;否

则不能拒绝H0。

实验背景:

一、据以往经验,机床发生故障的频数服从均匀分布,某车间在一周内统计所有机床发生故障频数的资料如下:

表4-2 故障频数

星 期 故障次数 一 7 二 8 三 3 0.05四 9 五 16 六 17 检验故障频数是否服从均匀分布()?

二、在丧偶问题上的性别因素和地区因素是否

按照1996年一个抽样,我国华北五省市区的丧偶人数按性别分为:

表4-3 1996年华北地区丧偶情况统计 北 京 天 津 河 北 山 西 内蒙古 合 计 男 112 130 846 359 291 1748 女 356 305 1787 782 558 3788 合 计 478 435 2633 1141 849 5536 检验在丧偶数量上性别因素和地区因素是否。

三、在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表:

表4-4 调查结果 年龄段 ≤30 31—50 >50 商场1 83 91 41 商场2 70 86 38 商场3 45 15 10 总和 198 192 总和 215 194 70 479 检验人们去这三个商场的概率是否一样。(数据来源:《非参数统计》,王星,中国人民大学出版社,P161)

实验过程:

一、用Chi-Square过程进行2拟合优度检验

激活数据管理窗口,定义变量名:每天为day,故障次数为count。按顺序输入数据, 结果见图4.1。

图4.1

点击Data菜单选Weight Cases...命令项,弹出Weight Cases对话框(如图

4.2),选Weight cases by,再选count点击钮使之进入Frequency Variable框,定义count变量为权数,再点击OK钮即可。

图4.2

选择Analyze/ Nonparametric Tests/Chi-Square,打开卡方检验对话框,如图4.3所示:

图4.3

图4.3左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,可以选入一个或多个,如果选入多个,系统会对其依次进行分析。本例中选中变量count,使之进入Test Variable List框。

(2)Expected Range单选框:设定需检验的变量的取值范围,在此范围之外的取值将不进入分析。

Get from data选项:数据文件的最大值和最小值所确定的范围,系统默认该项。

Use specified range选项:自行制定检验的取值范围,在Lower和Upper框中键入检验范围的下限和上限。本例采用系统默认项。

(3)Expected Values单选框:指定已知总体的各分类构成比。

All categories equal选项:系统默认项,各类别构成比例相等,即意味着检验的总体是服从均匀分布的。本例中使用此选项。

Values选项:自行定义给类别构成比例,每输入一个值后按Add按钮,于是在它右边的框中便增加了刚键入的数值。要求输入数值必须大于0,一直到输完为止,如果在输入过程出现了错误,并已按Add按钮使录入的值进入了右

下框中,则可用鼠标来进行修改,即用鼠标将光标移到错误处,但一鼠标左上键使错误值置于光带中,若是刚录入的值,则可以点击Remove按钮将其删除,然后重新录入;如果错误值在录入值中间,则先将它置于光带中,然后在Add右边的观众键入修改的值后按Change按钮进行替换。

(4)Exact子对话框:用于设定是否进行确切概率的计算,以及具体的计算方法。如图4.4

Asymptotic only:渐近分布的显著性检验,只近似计算概率,不计算确

切概率,适合于渐近性分布和较大样本,系统默认选项。

Monte Carlo:采用蒙特卡罗模拟方法计算确切概率,适合于数据满足渐

近性分布,而且数据过大以至不能计算精确显著性。

Confidence:指定置信度,默认为99%。

Number of sample:指定计算的样本数目,样本数越大显著性水平越可靠,默认为10000。

Exact:准确计算观测结果的统计概率

Time limit per test:限定进行每个检验所使用的最长时间,如果超过30分钟,则用Monte Carlo法比较合适,默认计算时间在5分钟内,超过此时限则自动停止。

图4.4

(5)Option子对话框:选择输出结果形式及缺失值处理方式。如图4.5

图4.5

Statistics复选框:选择可供输出的统计量。

Descriptive:输出常用的描述统计量,包括变量的均值、标准差、最大

值、最小值等等。

Quartiles:输出变量的四分位数。

Missing Values单选框:选择缺失值的处理方式。

Exclude cases test-by-test:分析用到的变量有缺失值时去除该记录。系统默认该项,以便充分利用数据。本例中选择默认项,不做修改。

Exclude cases listwise:只要相关变量有缺失值,则在所有分析中均去除该记录。

在本例中,点击Data菜单选Weight Cases...命令项,弹出Weight Cases对

话框(如图4.2),选Weight cases by,再选count点击钮使之进入Frequency Variable框,定义count变量为权数,再点击OK钮即可。

选择Analyze/ Nonparametric Tests/Chi-Square,打开Chi-Square检验对话框,选择变量count进入Test Variable List框,其他选择不做任何修改,在主对话框点击ok按钮,提交运行命令,得到结果如图4.6、图4.7:

图4.6

图4.6中,最上方Npar Tests表示进行的是非参数统计检验,Chi-Square Test表示进行的是卡方检验,Frequency为表格名称,表示输出的是频数表,count是检验变量名,表格内显示的是6个类别的观测频数、期望频数和残差。在本例中,观测频数合计为60,期望频数各类别相等,均为10。

图4.7

图4.7中,最上方Test Statistics为表格名称,即检验统计量表,为最终的检验结果,给出了卡方值、自由度和近似的显著性p值。结果显示卡方检验统计量微14.800,近似的p值为0.011 ,因此,在0.05的显著性水平下,结论为拒绝原假设,认为一周内机床发生故障的频数不是服从均匀分布的。

二、用Crosstabs过程进行2性检验

激活数据管理窗口,定义变量名:sex(性别)为列变量,region(地区)为

行变量,count为频数变量(行列对应的频数值)。切换到Variable View中,定义变量值标签,在sex变量中,1表示男性,2表示女性,在region变量中,1表示北京,2表示天津,3表示河北,4表示山西,5表示内蒙古,再切换到Data View中,按顺序输入相应的变量,结果见图4.8。

图4.8

点击Data菜单选Weight Cases...命令项,弹出Weight Cases对话框(如图

4.9),选Weight cases by,再选count点击钮使之进入Frequency Variable框,定义count变量为权数,再点击OK钮即可。

图4.9

选择Analyze/ Descriptive Statistics/Crosstabs,打开crosstabs对话框,如图4.10所示:

图4.10

图4.10左侧为候选变量框,在候选变量框中选择一个或多个变量。 (1)Row(s)框:用于选入一个或多个行变量。本例选则变量region为行变量,使之进入Row(s)框。

(2)Column(s)框:用于选入一个或多个列变量。本例选择sex为列变量,使之进入Column(s)框。

(3)Layer 1 of 1:层变量栏,用于选择分组变量及控制分组变量的分层。本例不选择分组变量。

Previous:前一层分组变量按钮,在建立后一层分组变量时变黑,表示单击该按钮可返回前一层。

Next:后一层分组变量按钮,该层变量是前一层变量的分组变量,在建立前一层分组变量时变黑,表示单击该按钮可建立或显示后一层的分组变量。

(4)Display clustered bar charts选项:用于显示聚类条形图,选择此项,SPSS会为每一个行变量产生一个聚类条形图。本例不输出此项。

(5)Suppress table选项:不输出表格,只输出统计量。选择此项,SPSS将不显示列联表,且Cell按钮和Format按钮将无效。本例不选择此项。

(6)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方

法。同前面的图4.4一样。

(7)Statistics子对话框:可选择输出一些统计量。如图4.11。

图4.11

Chi-Square选项:输出卡方值,它是用于进行行、列变量是否的卡方

检验(Chi-Square Test)、用于对数线型模型检验的似然比卡方检验(Likehood ration Chi-square test)、Fisher精确检验(Fisher’s exactly test)、耶茨校正卡方检验(Yete‘s corrected Chi-square test)。本例选择此项。

Correlations选项:可计算相关系数。只有在数值型变量时,此项选择才有效。

Nominal:包含了一组用于反映分类变量相关性的指标。

Contingency coefficient:计算列联系数。根据卡方公式修改而得,其

值为

22n,列联系数是描述两个属性之间关联性高低的统计量,其数值

在0到1之间,但不可能达到1,越大表明两变量间相关性越强。

Phi and Cramer’s V:计算Phi系数和Cramer系数,它们都是校正列联

系数,也是由卡方公式修改而来, ψ系数为

n2,Cramer’s V为

2n(k-1),

其值可以达到1,同列联系数一样,描述两个属性之间的相关性高低。

Lambda:反映自变量对因变量的预测效果,在0到1之间取值,Lambda

系数为1,表明自变量可以完全预测因变量,Lambda系数为0,表明自变量不能预测因变量,即两变量。

Uncertainty coefficient:不确定系数,其值越接近于1,表明从第一个观察量获得的有关第二个变量的信息越多,其值越接近于0,表明表明从第一个观察量获得的有关第二个变量的信息越少。,

Ordinal:包含一组用于反映分类变量一致性的指标,适用于有序变量,均

是有Gamma统计量衍生过来的,所谓一致性高是指行变量秩高的列变量秩也高,行变量秩低的列变量秩也低,如果行变量秩高而列变量秩低,则称为不一致。

Gamma:检验两个有序变量之间的对称关联,其值在-1到1之间,

绝对值接近1时,表明两个变量之间有很强的关联性。

Somer’s d:两个有序变量之间关联性的检验,其值在-1到1之间,

绝对值接近1时,表明两个变量之间有很强的关联性,Somer’d 检验是Gamma检验的非对称检验扩展

Kendall’s tau-b:对相关的有序变量进行的非参数检验,适合行数和

列数相同表格的检验,其值在-1到1之间。

Kendall’s tau-c:对RC列联表相关系数的非参数相关检验,其值

在-1到1之间,如果表格的边缘包含近似相等的频数,Kendall’s tau-b与Kendall’s tau-c所得的值基本一致。

Nominal by interval:计算一个变量为数值变量,另一个为分类变量时的关

联度。

Eta值:eta的平方表示由组间差异所解释的应变量的方差的比例,即

SS组间/SS总,一共给出两个eta值,分别对应了行变量为应变量和列变量为应变量的情况。

Kappa:计算Kappa值,即内部一致性系数,是评价判断一致性程度的指

标,一般,Kappa>=0.75,表明两者一致性好;0.4<=Kappa>=0.75,表明一致性一般;Kappa<0.4表明一致性差。

Risk:计算相对危险度(Relative Risk)和比数比(Odd ratio),用于22列联表,可以检验事件的发生和某因素暴露之间的关联性,例如检验吸烟是否与心脏病有关,若相对危险度为1,则表示因素与事件不存在关联。SPSS用比数

比作相对危险度的近似 估计值。

McNemanr:配对卡方检验

Cochran’s and Mantel-Haenszel statistics:对两个二分类变量进行

性检验和同质性(齐性)检验,同时可进行分层因素的调整。

(7)Cells子对话框:用于定义列联表中需要显示的指标,包括观测量数、百分比、残差。如图4.12。

图4.12

Counts计数栏:

Observed:观测值的数量,系统默认选项。 Expected:期望值的数量

Percentage百分比栏:

Rows:行百分比 Columns:列百分比 Tatal:总的百分比 Residuals残差栏:

Unstandardized:有非标准化残差 Standardized:标准化残差

Adj. Standardized:调整的标准化残差

(9)Format子对话框:用于选择变量是升序还是降序排列,如图4.13 。

图4.13

Row Order:选择行顺序。

Ascending:升序,行变量由左至右升序显示,系统默认值。 Descending:降序,行变量由左至右降序显示。

在本例中,点击Data菜单选Weight Cases...命令项,弹出Weight Cases对

话框(如图4.2),选Weight cases by,再选count点击钮使之进入Frequency Variable框,定义count变量为权数,再点击OK钮即可。

选择Analyze/Descriptive Statistics/Crosstabs,打开Crosstabs对话框,选择变量region进入Row( s)框,选择变量sex进入Column(s)框;

单击Statistics子对话框,选择Chi-square选项,单击continue按钮,返回Crosstabs主对话框;

单击Cells子对话框,在count选项中选择Expected,单击continue按钮,返回Crosstabs主对话框;

在Crosstabs主对话框中,点击ok按钮,提交运行Crosstabs命令,得到结果如图4.14、图4.15和图4.16:

图4.14

图4.14中,最上方Crosstabs表示进行的是列联表分析,表格内显示有效频数位5526例,占总的100%, 缺失值个数为0,总的例数为5526。

图4.15

图4.15为二维52列联表,列联表中给出了各个地区不同性别的观测频数和期望频数以及总的频数和总的期望频数。

图4.16

图4.16为卡方检验表,表中显示pearson Chi-Square值为16.474,自由度为4,近似的显著性p值为0.002,故可以拒绝原假设H0,认为在丧偶数量上性别和地区两个变量不是的。

三、用Crosstabs过程进行2齐性检验 与2性检验一样,操作如下:

激活数据管理窗口,定义变量名: age(年龄)为行变量,Business(商场)为列变量,count为频数变量(行列对应的频数值)。切换到Variable View中,定义变量值标签,在age变量中,1表示年龄30,2表示31-50,3表示>50,在business变量中,1表示商场1,2表示商场2,3表示商场3,再切换到Data View中,按顺序输入相应的变量,结果见图4.17。

图4.17

点击Data菜单选Weight Cases...命令项,弹出Weight Cases对话框(如图

4.18),选Weight cases by,再选count点击钮使之进入Frequency Variable框,定义count变量为权数,再点击OK钮即可。

图4.18

本例中,选择Analyze/Descriptive Statistics/Crosstabs,打开Crosstabs对话框,选择变量age进入Row( s)框,选择变量不siness进入Column(s)框;

单击Statistics子对话框,选择Chi-square选项,单击continue按钮,返回Crosstabs主对话框;

单击Cells子对话框,在count选项中选择Expected,单击continue按钮,返回Crosstabs主对话框;

在Crosstabs主对话框中,点击ok按钮,提交运行Crosstabs命令,得到结果如图4.19、图4.20和图4.21:

图4.19

图4.20

图4.21

图4.21为卡方检验表,表中显示pearson Chi-Square值为18.651,自由度为4,近似的显著性p值为0.001,故可以拒绝原假设H0,认为不同年龄的人去三个商场的概率是显著不同的,即是非齐性的。

实验二 二项分布检验(Binomial test)

实验目的:

掌握二项分布检验方法。 实验工具:

SPSS非参数统计分析菜单项

知识准备:

现实生活中,有些总体只能划分为两类,例如,正面与反面,成功与失败、合格与不合格、命中与不命中,同意与不同意,医学中的生与死等等,在数理统计中,把只有两个结果出现的试验称为贝努里试验(Bernoulli trial),若重复n次,则为n重贝努里试验,在n重贝努里试验中,设成功的概率为p,若X表示成功出现的次数,则称X服从二项分布,记为X~B(n,p)。X的分布概率可用下面的公式来描述:

nxnxP(Xx)xpp

式中,n表示贝努里试验的次数,p表示成功的概率,X表示n次贝努里试验中成功出现的次数。

二项分布检验(Bionomial Test)就是根据样本数据检验总体是否服从二项分布的一种检验方法。属于拟合优度检验,适用于数据只能划分为两类的总体,检验二项分类变量是否来自概率为p的二项分布。

实验背景:

某地某一时期内出生40名婴儿,其中女性12名(定义Sex=2),男性28名(定义Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性别比例(总体概率约为0.5)是否不同(0.05)

实验过程:

激活数据管理窗口,定义变量名:sex为性别。切换到Variable View中,定义变量值标签,在sex变量中,1表示男性,2表示女性,再切换到Data View中,按顺序输入数据, 结果见图4.22。

图4.22

选择Analyze/ Nonparametric Tests/Binomial… ,打开binomial Test对话框,如图4.23所示:

图4.23

图4.23左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,可以选入一个或多个,如果选入多个,系统会对其依次进行分析。本例中选中变量sex,使之进入Test Variable List框。

(2)Define Dichotomy栏:定义二分类变量的获取方法。

Get from Data选项:系统默认项,适用于指定的变量只有两个值,即二分

类变量。

Cut point:用来指定一个分界点,如果给定的变量超过两个值,则可给定一个值,比这个值小的将形成第一项,大的将形成第二项。

(3)Test Proportion:指定检验概率值,系统默认的检验概率为0.5,这意味着要检验的二项分布是服从均匀分布的,如果检验的概率不是0.5,在参数框中键入要检验的概率即可。

(4)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(5)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图4.5 一样。

需要注意的是:若数据以频数的形式给出,则需要加权,若不是以频数的

形式给出,则不需要加权处理。本例中,不是以频数的形式出现,不需要作加权处理

在本例中,选择选择Analyze/ Nonparametric Tests/Binomial…,打开

Binomial test对话框,选择变量sex进入Test Variable List框;在Tset Proption框中键入0.5,点击ok按钮,提交运行不Binomial命令,得到结果如图4.24:

图4.24

二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检验概率为0.5,二项分布检验的结果是双侧概率为0.017,即拒绝原假设H0,可认为该地区出生的男女比例有显著的不同,即与通常0.5的性别比例相比,该地男婴比女婴明显为多。

实验三 随机游程检验(Run Test)

实验目的:

掌握游程检验的基本方法。 实验工具:

SPSS非参数统计分析菜单项。 知识准备:

游程检验亦称为串检验,是一种随机性检验方法,应用范围很广。例如掷一枚硬币正面和反面的出现是否是随机的;奖券的购买是否随机;期货价格的变化是否随机,一个机械流程中产品误差的出现是否随机等等。若事物的发生并非随机发生,而是具有某种规律,例如有上升或下降的趋势,或者呈现周期性的变化规律时,均表示数据不是随即出现的,则往往可通过统计方法从中寻找规律,建立相应模型并进行分析,作出适宜的决策。

关于样本观测值是否随机出现的问题可以转化成一个二元0-1序列出现顺序的随机性问题。假设一个可以总体可以分为两类,随机从中抽取一个样本,样本也可以分为两类:类型I和类型Ⅱ。凡属类型I的给以符号0,类型Ⅱ的给以符号1,反之也可以。则在这个二元序列中,一个有0或1连续出现的串称为一个游程,也就是说,游程是在一个二元序列的有序排列中,相同符号连续出现的串。一个游程中数据的个数称为游程的长度,一个序列里游程个数用R表示,R实际上表示了0和1交替轮换的频繁程度。容易看出R是序列中0和1交替轮换的总次数加1。一个游程里0出现的总次数用n0表示,1出现的总次数用n1,

nn0n1。

例如,抛掷一枚硬币,可以得到一系列的符号如下,1表示出现正面,0表示出现反面。

1 1 1

0

0 2

0

1 3

0

0 4 0

0

1 5 1

0 6

1 7 1

例中:共有14个数,0的总数为8,1的总数为6,共有3个0游程,4个1游程,一共有7个游程,即游程数目R=7。

在一定的样本容量n之下,可以用游程的总数作为检验变量来检验样本数据是否是随机的。若游程的数目过少,说明0和1相对比较集中,意味着样本由于

缺乏性而形成了一致的趋势;若游程的数目过多,说明0和1相对比较分散,则序列存在着某种周期性的影响。这都不符合序列随机性的要求。例如:抛币20次,1表示出现正面,0表示出现反面,结果如下:

1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0

因此可以通过游数目的多与少来判断二元序列是否存在随机性。

在H0为真的情况下,根据两种类型符号的变化,选择的检验统计量为R,

R=游程的总数目 实验背景:

一个监听装置收到如下的信号:

0 1 0 1 1 1 0 0 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 0 1 0 0 1 1 1 0 10 1 0 1 0 0 0 0 能否说该信号是纯随机干扰的。(0.05) 实验过程:

用Runs过程进行游程检验

激活数据管理窗口,建立数据文件,定义信号变量为signal。按顺序输入数据, 结果见图4.25。

图4.25

选择Analyze/ Nonparametric Tests/Runs… ,打开Runs Test对话框,如图4.26所示:

图4.26

图4.26左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,可以选入一个或多个,如果选入多个,系统会对其依次进行分析。本例中选中变量sex,使之进入Test Variable List框。

(2)Cut Point栏:给出了四种划分样本类别的方法,可以是中位数、均值、众数和用户指定值,系统会按照指定方法将样本一分为二,变量值小于试算点的个体形成一类,其他的形成一类。

Median:以中位数作临界分割点,其值在中位数之下的为一类,大于或等于中位数的为另一类。

Mode:以众数作临界分割点,其值在众数之下的为一类,大于或等于众数的为另一类。

Mean:以均值作临界分割点,其值在均值之下的为一类,大于或等于均值的为另一类。

Custom:以用户指定值作临界分割点,其值在指定值之下的为一类,大于或等于指定值的为另一类。

以上划分方法可以同时指定,此时系统会分别给出每种划分方法的检验结果。 (4)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方

法。同前面的图4.4一样。

(5)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图4.5 一样。

在本例中,选择Analyse/Nonparametric Tests/Runs…,打开Runs Test对话框。选择变量signal进入Test Variable List框;

在Cut Point选项中选Custom项,在其方框中键入1(根据需要选项,本例是0、1二分变量,故临界分割点值用1),再点击OK按钮,提交运行Runs命令,得到结果如图4.27:

图4.27

图4.27游程检验结果表明,本例游程个数为19,检验临界分割点值(Test value) = 1,小于1的有18个案例,而大于或等于1者有22个案例。Z = -0.421,双侧显著性p值 = 0.674,故不能拒绝H0,认为该监听装置收到的信息的分布是呈随机分布的。

实验四 单样本Kolmogorov-Smirnov检验

实验目的:

掌握单样本Kolmogorov-Smirnov检验的基本方法。 实验工具:

SPSS非参数统计分析菜单项。 知识准备:

每有一列数据之后,人们总希望知道它的总体分布是不是一个已知的分布。特别是它是不是一个正态分布,这往往是一个统计推断过程的一个中间步骤,

为下一个统计决策作准备。这实际上是一个拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或P-P图,Q-Q图来直接判断,但这种直观的方式很不精确。本节介绍单样本Kolmogorov-Smirnov检验,实际上,K-S检验是在针对2检验的缺点上提出的,是建立在经验分布函数基础上的检验结果。

柯尔莫哥诺夫—斯米尔诺夫检验(Kolmogorov-Smirnov Test,简称K-S检验)是一种拟合优度检验,用于检验某一连续型变量是否服从某一指定的分布,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。

一般来说,要检验样本是否来自某个已知的分布F0(x),假定其真实的分布为F(x),对应的检验类型有:

A H0:F(x)F0(x)

对所有的x

H1:F(x)F0(x) 至少有一个x

B H0:F(x)F0(x)

对所有的x

H1:F(x)F0(x) 至少有一个x

C H0:F(x)F0(x)

对所有的x

H1:F(x)F0(x) 至少有一个x

设S(x)为该组数据的经验分布函数,定义为阶梯函数:

S(x)Xix的个数nI(Xnix)

它是小于等于x的值的比例,是总体分布F(x)的一个估计。

Kolmogorov于三十年代提出了一种基于经验分布的检验方法,基本思想是:

ˆ(x)以概率1一致收敛由格里文科定理(Glivenko),当n时,样本经验分布Fn到总体分布F(x),为此可以定义S(x)到F0(x)的距离为:

D(S(x),F0(x))supS(x)-F0(x)

当H0成立时,由格氏定理,D以概率1收敛到0,因此D的大小可以度量F0(x)对总体分布拟合的好坏。

对于上面的三种检验,可供选择的检验统计量分别为;

A DSupS(x)F0(x)

xB DSup(F0(x)S(x))

xC DSup(S(x)F0(x))

xD的分布实际上在原假设下对于一切连续分布F0(x)是一样的,所以是与分布无关的。由于S(x)是阶梯函数,只取离散值,考虑到跳跃的问题,在实际操作时,如果有n个观察值,可用下面的统计量代替上面的D:

Dnmaxmax(S(xi)F0(xi),S(xi-1)F0(xi-1)

1in这些统计量程为Kormogorov统计量或Kormogorov-Smirnov统计量(Kolmogorov,1933)。

单样本K-S检验适用于检验正态分布、均匀分布、泊松分布、指数分布

四种连续型分布的问题。

单样本K-S检验的步骤:

第一步:建立原假设H0:经验分布和理论分布没有显著差异。 第二步:把样本观察值从小到大排列,计算经验累积分布和理论累积分

布,记DmaxS(xi)F0(xi),构造检验统计量ZDn并计算p值。 第三步:作出判断,若Z值过大,或显著性p值太小,则拒绝原假设H0,反之,不能拒绝H0。

实验背景:

轴承的内径检验:

检验某车间生产的20个轴承外座圈的内径,测得数据如下(单位:mm)

表4-5 轴承内径数据

14.66 14.52 15.41 15.04 15.36 14.57 14.53 15.57 14.69 15.37 15.34 14.28 15.01 14.76 14.38 15.87 13.66 14.97 15.29 14.95

按照设计要求,这个内径应在15±0.2mm,检验是否符合标准,即检验该数据是否来自均值15,方差20.220.04的正态分布。(数据来源:吴喜之,《非参数统计》,中国统计出版社,1999,P120)

实验过程:

用单样本K-S检验进行检验

激活数据管理窗口,建立数据文件,定义内径变量为nj 。按顺序输入数据, 结果见图4.28:

图4.28

首先根据该数据作Q-Q图,如图4.29:

图4.29

从Q-Q图上可以看出,这些散点并不明显成一直线,需要进一步的检验,下面利用单样本Kolmogorov-Smirnov检验进行进一步的检验。

选择Analyze/ Nonparametric Tests/1-Sample K-S… ,打开One-Sample Kolmogorov-Smirnov Test对话框,如图4.30所示:

图4.30

图4.30左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,可以选入一个或多个,如果选入多个,系统会对其依次进行分析。本例中选中变量nj,使之进入Test Variable List框。

(2)Test Distribution:指定检验的分布类型。有四种类型: Normal:正态分布,系统默认选项。 Poisson:泊松分布,本例选择此项。 Uniform:均匀分布 Exponential:指数分布。

(3)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(4)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图4.5 一样。

在本例中,选择Analyse/Nonparametric Tests/1-Sample K-S…,打开

One-SampleKolmogorov-Smirnov Test对话框。选择变量nj进入Test Variable List框;

在Test Distribution选项中选则Normal,表明与正态分布形式相比较,再点击OK按钮,提交运行One-Sample Kolmogorov-Smirnov命令,得到结果如图4.31:

图4.31

由图4.31One-Sample Kolmogorov-Smirnov Test,本例使用的案例数为20例,两个正态分布参数分别为:Mean=14.9115,Std.Deviation=0.52165,最大绝对离差=0.116, K-S正态检验的结果显示,Kolmogorov-Smirnov Z值=0.519,双侧P值=0.951远远大于0.05,不能拒绝原假设H0,认为轴承的内径是服从正态分布的。

实验五 两样本模型的非参数检验

某种统计检验方法应用时,不仅与数据的测量层次有关,与抽样的特点有关。在抽取样本时有两种形式:相关的和的。若第—次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是的,则形成的样本为样本,例如,研究两种训练方法中哪一种更出成绩,两种汽油中哪一个污染更少,两种市场营销策略中那种更有效等等;若一次抽样的测量结果影响另一次抽样测量结果,则这种抽样是相关的,则形成的样本为相关样本,例如,比如比较两种处理,如药物,饮食,材料,管理方法等等。

实验目的:

掌握两个样本模型的非参数检验方法。 实验内容:

一、两个相关样本的非参数检验 1.符号检验

2. Wilcoxon符号秩检验 二、两个样本的非参数检验 1. Brown-Mood中位数检验 2. Mann-Whitney-Wilcoxon秩检验 3.两样本K-S检验

4. Wald-Wolfowitz游程检验 实验工具:

SPSS非参数统计分析菜单项。 知识准备:

一、两个相关样本的非参数检验 1.符号检验

设有两个连续总体X、Y,累积的分布函数分别为F(x),F(y)。随机地分别从两个总体中抽取数目为n的样本数据x1,x2,...,xn和y1,y2,...,yn,将它们配对得到(x1,y1),(x2,y2),„,(xn,yn)。若研究的问题是两个总体是否具有相同的分布,即F(x)F(y)是否成立,则可以转化为研究两个样本的总体的中位数应相同,所以检验的假设可以建立为:

H0:mxmy;H1:mxmy

H0:mxmy;H1:mxmyH0:mxmy;H1:mxmy

两个相关样本的符号检验检验统计量为定义S、S。S为xi与yi差值符号是正的数目,S为差值符号是负的数目,SSn。若H0为真,xi大于yi的配对数目与xi小于yi的配对数目相等,也就是S与S的数值相等。由于S、S的抽样分布是二项分布B(n,1/2),n是配对数目,1/2是各自出现的概率,因而合适的p值能够在二项分布表中查找到。如果S大小适中,则支持原假设,否则S太大,S太小,则支持H1:mxmy;则支持H1:mxmy。 S太小,S太大,令kmin(S,S),则检验的准则如下:

H0:mxmy;H1:mxmy;

p2Cin(0.5)n

i0kkH0:mxmy;H1:mxmy;

pCin(0.5)n

i0kH0:mxmy;H1:mxmy;

pCin(0.5)n

i0当样本的观察数据n小于等于20时,可以利用上面方法找到p值作出判定。若样本的观察数据n>20,可以用正态近似办法,根据下列式子计算Z值,查正态分布表得到相应的p值,再作判定。

ZS0.50.5n0.5n

ZS0.50.5n0.5n

2.Wilcoxon符号秩检验

符号检验只用到两个样本差异的符号,而对数字大小所包含的信息未能考虑,把这二者结合起来,自然比仅仅利用符号要更有效,这也是下面要引进的Wilcoxon符号秩检验的宗旨,它把差的绝对值的秩分别按照不同的符号相加作为其检验统计量。 因此,Wilcoxon符号检验既考虑了正、负号,又考虑了两者差值的大小。因此,它比符号检验有更精确的判断。

设X、Y是两个连续总体,且均具有对称的分布,随机地分别从两个总体

(x2,y2)中抽取n个观察值,组成n个数对(x1,y1),,„,(xn,yn)。记Dixiyi,

若X与Y具有相同的分布,则等式:

0)P(iD0) P(iD

成立,即xi大于yi的概率与xi小于yi的概率应该相等。这也意味着全部差值Di的

中位数等于零。因此,原假设也可以是:

H0:Di的中位数0

当研究的问题关心两个总体的分布是否相同,或说两个总体中位数是否相同时采用双侧备择;若研究两个总体X、Y的分布存在某种趋势,则应建立单侧备择假设。如果认为xi的大多数值大于相应的值yi,那么单侧备择假设为:

H1:P(Di0)P(Di0) 或 H1:Di的中位数0

反之,如果认为yi的大多数值大于相应的值xi,那么单侧备择假设为:

H1:P(Di0)P(Di0) 或 H1:Di的中位数0

同样若用两个总体的中位数来表示,与上面对应的检验假设也可以写为:

H0:mxmy;H1:mxmy

H0:mxmy;H1:mxmyH0:mxmy;H1:mxmy

如果H0为真,对于Di来说,正的差值和负的差值应近似地相等。为了借助秩大小作判定,先忽略符号,取绝对值|Di|,对|Di|按大小顺序分秩。再按Di本身符号的正、负分别加总它们的秩即秩次,得到正秩的总和W与负秩的总和

W。虽然秩本身都是正的,但这里是按Di的符号计算的秩和。

H0为真时,正秩的总和与负秩的总和应该近似相等。如果正秩的总和远远

大于负秩的总和,表明大部分大的秩是正的差值,即Di为正的秩大。这时,数据支持备择假设H1:Di的中位数0或H1:mxmy;类似的,如果负秩的总和远远大于正秩的总和,表明大部分大的秩是负的差值,即Di为负的秩大。这时,数据支持备择假设H1:Di的中位数0或H1:mxmy。因为正秩和负秩的总和是个恒定的值,即 l十2十„十n=2(n十1)/2,因此对于双侧备择H1:mxmy来说,两个总和中无论哪一个太大,都可以被支持。

因此可以构造Wilcoxon符号秩检验的检验统计量为:

正秩的总和W 负秩的总和W

二者的选用依据备择假设的方向而定。 Wilcoxon符号秩检验的步骤:

第一步:计算各对观察值的偏差Dixiyi,取偏差的绝对值Dixiyi; 第二步:把上面的n项偏差绝对值按升序进行排序,并找出它们的n个秩,如果有相同的秩,则应取平均秩;

第三步:考虑各偏差的符号,分别计算正、负符号秩的和W和W; 第四步:计算Wilcoxon统计量Wmin(W,W),并作出判断。

如果是小样本,可以查Wilcoxon符号秩检验分布表即可

如果是大样本,我们可以使用正态近似,得到一个与W有关的正态随机变量Z的值,查正态分布表求得P-值。

E(W)n(n1)/4 D(W)n(n1)(2n1)/24

于是Z统计量为: ZWn(n1)/4n(n1)(2n1)/24~N(0,1)

二、两个样本的非参数检验 1. Brown-Mood中位数检验

假设X1,X2,...,Xm和Y1,Y2,...,Yn是两组相互的样本,分别来自两个分布有相应的中位数MX和MYF(x)和F(y),

,问题归结为检验它们总体的均值(或中

位数)的差是否相等,即假设检验问题为:

H0:MXMYH0:MXMYH0:MXMY;H1:MXMY ;H1:MXMY ;H1:MXMY

在原假设下,如果两组数据有相同的中位数,则将两组数据混合后,两组数

MXY据的混合中位数MXY应该对于每一列数据来说都处于中间位置,也就是说,

与MX和MY相等,两组数据应该比较均匀地分布在MXY的两边。因此,检验的第一步是要找出混合数据的样本中位数MXY,将MX、MY和MXY比较后得到各个样本中大于MXY和小于MXY的数目,形成22的二维列联表,见表4-6所示:

表4-6 列联表分析

MXY MXY X样本 a ma m Y样本 b总和 tab nb(mn)(ab) Nmn总和 n 注:如果有和MXY相同的观测值,可以去掉它。

令A表示二维列联表中左上角取值a的X样本中大于MXY的变量,t表示混合样本中大于MXY的样本点的个数。在m,n及t固定时,A的分布在原假设下为超几何分布:

P(Ak)CmCnCktktmn 0km

于是选取A在样本X中大于MXY的样本点数作为检验的统计量,则A应该不大不小,如果A太大或太小,则应该怀疑原假设。可以作出如下的假设检验指导表:

表4-7 Brown-Mood中位数检验指导表

原假设H0 H0:MH0:MH0:Mx备择假设H1 y检验统计量 A A A P-值 MMM H1:MH1:MxMMyP(Aa) xyxyP(Aa)xyH1:MxMy2min(P(Aa),P(Aa))注:(1)在mn时,因A不对称,双边检验的结果不理想; (2)在大样本时,可以用正态分布近似;ZA0.5mt/Nmny(Nt)/N3~N(0,1)

2. Mann-Whitney-Wilcoxon秩检验

Brown-Mood中位数检验在比较两个总体的中位数的检验时,只利用了样本大于或小于共同中位数的数目,如同前面的符号检验一样,只有方向的信息,没有差异大小的信息,失去了两样本具体观察值的相互关系的信息,为了利用更多的信息,下面我们讨论两个样本的Wlicoxon秩和检验。

Mann—Whitney—Wilcoxon检验,译为曼—惠特尼—维尔科克逊检验,简写为M—W—W检验,亦称Mann—Whitney U检验。

假设有两个连续总体X、Y,其累积分布函数分为F(x)和F(y),这里假定两个总体的分布有类似形状,但不需要对称,若研究的问题是两个总体是否具有相同的分布,即F(x)F(y)是否成立,则可以转化为研究两个样本的总体的中位数是否相同。

在实际问题中,应用U检验常是考察两个总体的中心是否相同。若MX、MY分别是X、Y总体的中位数,则原假设可以建立为:

H0:MXMY

当研究只关心两个总体中位数是否有差异时,采用双侧备择假设:

H1:MXMY

若认为X的值可能大于Y的值时,应建立单侧备择假设:

H1:MXMY

反之,X的值可能小于Y的值时,则建立单侧备择假设:

H1:MXMY

设有两个分别来自连续总体X、Y的相互的随机样本x1,x2,...,xm和

y1,y2,...,yn,如果H0为真,那么将m个x,n个y的数据混合起来,按数值从

小到大排序,x、y的值应该期望被很好地混合在一起,这m十n=N个观察值可以看作是来自于同一总体的单一随机样本。若大部分的y大于x,或大部分的x大于y,将不能说明这个序列是一个随机的混合,将拒绝x、y来自一个相同总体的原假设。

在x、y的混合排列中,秩1是最小的观察值,秩N是最大的。若x的秩大部分大于y的秩,那么数据将支持H1:MXMY;而x的秩大部分小于y的秩,则数据将支持H1:MXMY。无论上面哪一种情况生,双侧的备择假设H1都将

被支持。

根据上面的基本原理,M—W—W检验的统计量可以定义为:

WXx的秩和。 WYy的秩和。

由于x、y的混合序列的秩和为:

12...NN(N1)22

所以 WXWY注:等价的统计量:

N(N1)

如有分别来自两个总体的两个样本: Nmn。 x1,x2,...,xm和y1,y2,...,yn,令WYX为把所有的y观测值与x观测值做比较后,x大于y的个数。令WXY使把所有的x观测值与y观测值做比较后,y大于x的个数。

有 WYWXY WXWYXn(n1)22

m(m1)我们来说明两个公式的成立。如仅仅将x1,x2,...,xm排序后,其秩和为:m(m+1)/2。假如某个Xi是最小的,即Rx1。将两个样本混合在一起排序,不

i妨假设:

ykyixi

故X大于y的个数为2,所以Xi的混合秩为Rx21。考虑所有的i,则可得

i上面两式。

由上面两式可以得出:WXYWYXmn,WY是Wilcoxon(1945)提出的,而WXY是由Mann and Whitney(1947)提出的。因为这些统计量互相等价,统称为Mann-Whitney-Wilcoxon 统计量。

另外可以证明:

E(WY)n(N1)2 Var(WY)nm(N1)12

E(WX)m(N1)2 Var(WX)n(N1)2mn2nm(N1)2

E(WYX)E(WY)

Var(WYX)Var(WY)nm(N1)2Var(Wyx)Var(Wy)mn(N1)12

需要注意的是:一般情况下,当两组样本数据数目不等时,较少数目的组通常记为X,即mn。

(1)小样本时可以通过查表判断。在M—W—W检验中的统计量WX,当

mn时,取值为整数,范围为

m(N1)2m(m1)2到

2Nm12。这时,WX的抽样分布关

于其均值

是对称的。在mn10的情况下,可以根据m,n以及WX的

值可查附表,得到相应的p值。表4—7是检验的判定指导表。

(2)大样本时可用正态分布近似判断。当m,n均大于10时,WX近似于均值为

m(N1)2,标准差为

mn(N1)2的正态分布。可以构造正态Z统计量,

查标准正态分布表得到相应的P值。

当n足够大时,

ZWXYmn/2mn(N1)/12~N(0,1)

ZWYn(N1)/2mn(N1)/12~N(0,1)

ZWXm(N1)/2mn(N1)/12~N(0,1)

表4-7 检验判定指导表

备择假设 H1:MXMY H1:MXMY H1:MXMY 检验的统计量(k) WXY或WY WYX或WX min(WXYP值 P(Kk)P(Kk) ,WYX)或min(WX,WY) 2P(Kk) 注:这里看上去是按照备择假设的方向来选择WX或WY作检验统计量的,实际上往往是按照实际观测的WX和WY的大小来确定备择假设的。

3.两样本Kolmogorov-Smirnov检验

两样本Kolmogorov-Smirnov检验是单样本Kolmogorov-Smirnov检验在两样中的推广,主要用来检验两个样本是否同时来自于某一总体,属于拟合优度检验的范畴。

假定样本x1,x2,...,xm来自分布为F(x)的总体,样本y1,y2,...,ym来自分布为

F(y)的总体。这里的检验和单样本是类似的,基本假设为:

A H0:F(x)F(y) 对所有x H1:F(x)F(y) 至少有一个x B H0:F(x)F(y) 对所有x H1:F(x)F(y) 至少有一个x C H0:F(x)F(y) 对所有x H1:F(x)F(y) 至少有一个x

设Fm(x)和Fn(y)分别为这两个样本的经验分布函数。 则检验A的统计量可以取:

DNmaxmax(Fm(xi)-Gn(yi)),max(Fm(xj)-Gn(yj))

ij 式中Nmn

其余的对B和C的统计量的表达式也类似。关于统计量DN的分布有表可查,也有原假设下的大样本近似公式:

P(mnmnDNd)K(d)

两样本K-S检验的步骤:

第一步:建立原假设H0:两总体分布没有显著差异。

第二步:把两个样本观察值混合后从小到大排列,计算出它们经验分布

的差,记DmaxFm(xi)Fn(yi),构造检验统计量ZDnmmn并计算p值。

第三步:作出判断,若Z值过大,或显著性p值太小,则拒绝原假设H0,反之,不能拒绝H0。

4. Wald-Wolfowitz游程检验

Mann—Whitney—Wilcoxon检验主要应用于检验两个样本否来自具有相同位置的总体,是对两个总体在集中趋势方面有差异的一种考察,而不研究其它类型方面的差异。Wald—Wolfowitz游程检验则可以考察任何一种差异。Wald—Wolfowitz Runs Test常译为沃尔德一沃尔福威茨游程检验,简写为W-W游程检验。

设有X、Y的两个总体具有连续分布,其累积分布函数分别为F(x)、F(y)。若考虑两个总体是否存在某种差异,即检验两个总体分布相同的原假设是否成立。建立的假设组为:

H0:Fx(u)Fy(u) H0:Fx(u)Fy(u)

对所有的u 对某个u

设有两个相互的随机样本x1,x2,...,xm和y1,y2,...,yn,分别来自两个总体X和Y,将两个样本的m十n=N个数据混合以后按从小到大的顺序排列,即将所有N个数据排成一个有序的序列,确定这个序列的游程数。

例如:观察两组学生的考试成绩如下:

X Y

74 67

80 81

65 83

87

将7个分数排列成一个从小到大的序列为:

成 绩 组 别

65 67 X

Y

74 X

80 X

81 Y

83 Y

87 Y

观察X、Y出现的次序以确定游程数。序列中有4个游程:一个由来自X的65分构成的游程,随后是一个由来自Y的67分构成的游程,然后是由来自X的两个分数74和80构成的游程,最后是三个来自Y的分数构成的游程。

如果H0为真,则两个样本的数据能相互混合地排列,游程数会相对较大。若x的游程或y的游程过长,也就是来自同一总体的数据在混合序列中过多的相互连接,则游程数将会相当小,则数据将不支持H0。所以,可以用序列的游程

数作为检验统计量。定义R为Wald—Wolfowitz检验的统计量。

R=游程的总数目

当m十n=N<20时,与单样本游程检验相同,依据m、n及R可查表查找相应的P值。由于Wald—Wolfowitz检验通常是双侧检验,所以应选择双侧备择。若m十n=N>20,则R的抽样分布近似正态分布,计算Z,查标准正态分布表找到相应的P值。

近似正态Z统计量为:

ZR2mn/(mn)12mn(2mn(mn))(mn)(mn1)2~N(0,1)

实验背景:

一、两相关样本的的非参数检验

为研究长跑运动对增强普通高校学生的心功能效果,对某学院20名男生进行实验,经过5 个月的长跑锻炼后看其晨脉是否减少。锻炼前后的晨脉数据如下:

锻炼前 70 76 56 63 63 56 58 60 65 65 75 66 56 59 70

69 72 58 56 74

锻炼后 48 54 60 48 55 54 45 51 48 56 48 50 54

50 52 55 54 58

试问锻炼前后的晨脉间有无显著差异。(α=0.05)

二、我国2005年沿海和非沿海省市区的人均国内生产总值(GDP)的数据如下(单位为元): 沿海省市为:

45444 35783 14782 183 51474 24560 27703 186 20096 24435 8788 10871 非沿海省市为:

12495 16331 13348 14434 8675 9440 11346 11431 10426

10982 9060 5052 7835 9114 99 7477 10045 10239 13108 想要检验沿海和非沿海省市区的人均GDP的中位数是否一样。(α=0.05) 实验过程:

一、两个相关样本的非参数检验

1.符号检验

2. Wilcoxon符号秩检验

激活数据管理窗口,建立数据文件,定义锻炼前的晨脉变量为dlq,定义锻炼后的晨脉变量为dlh, 按顺序输入数据,结果如图4.32。

图4.32

选择Analyze/ Nonparametric Tests/2 Related Samples… ,打开Two-Related Samples Tests对话框,如图4.33所示:

图4.33

图4.33左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Pair(s) List框中。

(1)Current Selections:用于动态反映当前所选中的变量名称。

从左从侧候选变量框中选择检验的两个相关变量,单击鼠标使它们置于光带中,在Current Selections框中的Variable 1和Variable 2 后面的框中一次出现所选择的两个相关变量,单击向右的箭头按钮,一对变量被移动到Test Pair(s) List框中,注意,必须同时选定一对变量,向右箭头才会变黑。如果相关的成对变量为多组,重复上述过程即可。

(2)Test Pair(s) List框:用于选入需要进行检验的成对变量,注意变量必须成对引入。可以同时指定多对,系统会对其依次进行分析。本例中选中变量dlq和dlh,使之进入Test Pair(s) List框。

(3)Test Type:指定用来进行检验的方法。在Test Type框中,提供了可供用来检验的方法有有四种:

Wilcoxon复选项:用于检验两个相关样本是否取自同一总体,即最

常用的配对设计的Wilcoxon符号秩检验方法,系统默认选项。

Sign(符号)复选项:符号检验方法,通过计算两个样本的正负符号

的个数来检验两个样本是否来自同一总体,秩和检验要用到次序的大小,而符号检验只利用正负号,显而易见它的效率较低,除非资料本身就是两

分类,否则最好不要使用。

McNemar复选项:实际上就是常用的配对卡方检验,因此只适用 于

用于两个相关二分变量的检验。

Marginal Homogeneity 复选项:是McMemar检验的扩展,适用于资料为有序分类的情况。

(4)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(5)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图4.5 一样。

在本例中,选择Analyse/Nonparametric Tests/2 Related Samples…,打开Two-Related Samples Tests主对话框,在对话框左侧的候选变量列表中选dlq,在Current Selections栏的Variable 1处出现dlq,选dlh,在Current Selections栏的Variable 2处出现dlh,然后点击向右箭头按钮使dlq –dlh(表明是配对变量)进入Test Pair(s) List框。在Test Type框中选择Wilcoxon和Sign两种方法,点击OK按钮即可,提交运行Two-Related Samples Tests命令,得到结果如下:

符号检验结果如图4.34和4.35:

图4.34

图4.34为符号检验中用到的出现正负号的次数列表,采用的是dlh-dlq的差值,可见,差值为负的有17次,差值为正的有3次,负号出现较多,即锻炼后测量的晨脉较低,但该差异有无统计学意义还需要看后面的检验结果(见图3.35)。

图4.35

图4.35 为符号检验的结果,给出了检验的近似显著性p值,可见p值=0.003,小于0.05,拒绝原假设H0,认为锻炼前后测量的晨脉有显著的差异,可见长跑运动对增强普通高校学生的心功能有显著的效果。

Wilcoxon符号秩检验结果如图4.36和4.37:

图4.36

图4.36为Wilcoxon符号秩检验中用到的出现正负号的秩和情况列表,采用的是dlh-dlq的差值,可见,差值为负的有17次,平均秩为11.53,秩和为196,差值为正的有3次,平均秩为4.67,秩和为14,可见负的秩和较大,即锻炼后测量的晨脉较低,但该差异有无统计学意义还需要看后面的检验结果(见图3.37)。

图4.37

图4.37 为Wilcoxon符号秩检验的结果,给出的是Z统计量和近似的显著性

p值,可见p值=0.001,小于0.05,拒绝原假设H0,认为锻炼前后测量的晨脉有显著的差异,可见长跑运动对增强普通高校学生的心功能有显著的效果。 可见,符号检验和Wilcoxon符号秩检验的结果是一样的,但是可以看出,Wilcoxon符号秩检验的显著性p值0.001小于符号检验的显著性p值,也就是说,Wilcoxon符号秩检验的效率要比符号检验高,因为Wilcoxon符号秩检验利用了更多的数据信息。

二、两个样本的非参数检验 1. Brown-Mood中位数检验

需要注意的是,Brown-Mood中位数检验的过程不在2 Independent Samples…过程中,而在k Independent Samples…过程里。所以操作过程放在下一个实验里介绍。

2. Mann-Whitney-Wilcoxon秩检验 3.两样本K-S检验

4. Wald-Wolfowitz游程检验

激活数据管理窗口,建立数据文件,定义沿海和非沿海地区的人均国内生产总值变量为rjgdp,定义分组变量为group(沿海地区为1,非沿海地区为2),切换到Variable View中,定义变量值标签,在group变量中,1表示沿海地区,2表示非沿海地区,再切换到Data View中,按顺序输入数据,结果如图4.38。

图4.38

选择Analyze/Nonparametric Tests/2 Independent Samples… ,打开Two-Independent-Samples Tests对话框,如图4.39所示:

图4.39

图4.39左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向

右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,可以选入一个或多个,如果选入多个,系统会对其依次进行分析。本例中选中变量rjgdp,使之进入Test Variable List框。

(2)Grouping Variable框:指定分组变量。

从左侧候选变量框中选择用来分组的变量,单击向右箭头移动到Grouping Variable框中,此时,Define Groups按钮会变黑,单击此按钮,进入Define Groups对话框,如图4.40所示,在Define Groups对话框中的Group 1和Group 2中可指定分组变量的值。本例中,在Group 1后的框中输入1,在Group 2后的框中输入2。

图4.40

(3)Test Type:指定用来进行检验的方法。在Test Type框中,提供了可供用来检验的方法有有四种:

Mann-Whitney U 复选项:又称为秩和U 检验用于检验,用于检验两

个样本是否来自相同的总体(与t 检验类似),相当于最常用的两样本秩和检验,在检验时利用了大小次序,系统默认选项。

Kolmogorov-Smirnov Z复选项:用于检验两个样本是否取自同一

总体,和单样本K-S检验类似。

Moses extreme reactions复选项:该检验有其特定的用途,顾名思义,如果施加的处理使得某些个体出现正向效应,而另一些个体出现负向效应时,用该方法检验,检验两个样本是否来取具有同一分布总体。

Wald-Wolfowitz Runs复选项:是游程检验的一种,检验两个样本是否取自同一分布总体。

(4)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(5)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图4.5 一样。

在本例中,选择Analyse/Nonparametric Tests/2 Independent Samples…,打开Two-Independent Samples Tests主对话框,在对话框左侧的候选变量列表中选rjgdp,单击向右箭头按钮使之进入右侧的Test Variable List框;

从左侧候选变量框中选择group,单击向右箭头移动到Grouping Variable框中,此时,Define Groups按钮会变黑,单击此按钮,进入Define Groups对话框,在Group 1后的框中输入1,在Group 2后的框中输入2,单击continue返回主对话框;

在Test Type框中选择Mann-Whitney U、Kolmogorov-Smirnov Z和Wald-Wolfowitz Runs三种方法,点击OK按钮即可,提交运行Two-Independent Samples Tests命令,得到结果如下:

Mann-Whitney-Wilcoxon秩检验结果如图4.41和4.42:

图4.41

图4.41为Mann-Whitney-Wilcoxon秩检验中用到的秩和情况列表,可见,沿海地区共有12个观测,平均秩为23.5,秩和为282,非沿海地区共有19个观测,平均秩为11.26,秩和为214,可见沿海地区的秩和较大(默认是从小到大的顺序排秩)。

图4.42

图4.42 为Mann-Whitney-Wilcoxon秩检验的结果,一共给出了Mann-Whitney U统计量、Wilcoxon W统计量和Z统计量三个统计量的值,下面给出了近似的显著性双尾p值和确切的双尾p值。可见Mann-Whitney U=24,Wilcoxon W=214,Z=-3.65,近似的p值=0.000,精确的p值=0.000,可见两种算法的得出的结论是一致的,均小于0.05,拒绝原假设H0,认为沿海地区和非沿海地区的人均国内生产总值(GDP)有显著的差异,可见,沿海地区的人均GDP要高于非沿海地区的人均GDP。

两样本Kolmogorov-Smirnov检验结果如图4.43和4.44:

图4.43

图4.43为两样本Kolmogorov-Smirnov检验中的频数列表,可见,沿海地区有12个观测,非沿海地区有19个观测。

图4.44

图4.44 为两样本Kolmogorov-Smirnov检验的结果,可见,两个样本经验分布的绝对差异的最大值为0.781,Kolmogorov-Smirnov Z统计量为2.117 ,近似的显著性p值=0.000,小于0.05,拒绝原假设H0,认为沿海地区和非沿海地区的人均国内生产总值(GDP)有显著的差异,可见,沿海地区的人均GDP要高于非沿海地区的人均GDP。

Wald-Wolfowitz游程检验结果如图4.45和4.46:

图4.45

图4.45为Wald-Wolfowitz游程检验输出的的频数列表,可见,沿海地区有12个观测,非沿海地区有19个观测。

图4.46

图4.46 为Wald-Wolfowitz游程检验的结果,可见,游程的数目R=8,Z统计量=-2.781,近似的显著性p值=0.003,小于0.05,拒绝原假设H0,认为沿海地区和非沿海地区的人均国内生产总值(GDP)有显著的差异,可见,沿海地区的人均GDP要高于非沿海地区的人均GDP。

可见,Mann-Whitney-Wilcoxon秩检验、两样本K-S检验和Wald-Wolfowitz游程检验这三种方法的结论是一致的。

实验六 K个样本模型的非参数检验

多样本的问题是统计中最常见的一类问题,主要涉及如何检验几种不同的方法,决策或试验条件(称为处理)所产生的结果是否一样等问题。首先看这些样本是否,在各样本不,即为相关样本时,我们将利用Friedman检验和Corchran检验两种检验方法,在的条件下我们将利用Kruskal-Wallis检验和Jonckheere-Terpstra检验两种检验方法。

实验目的:

掌握K个样本模型的非参数检验方法。 实验内容:

一、K个相关样本的非参数检验 1. Cochran Q检验 2. Friedman检验 3. Kendall协同系数检验 二、K个样本的非参数检验 1. Kruskal-Wallis检验 2. Jonckheere-Terpstra检验 3.中位数检验 实验工具:

SPSS非参数统计分析菜单项。 知识准备:

一、K个相关样本的非参数检验 1. Cochran Q检验

Cochran Q检验也译为科库兰检验。它是用以检验三组或三组以上的频数或比例之间有无显著差异的方法。

考虑完全区组设计的一个极重要的特殊情况——观察值仅取两个值之一。例如,“是”与“否”,“+”与“-”,“成功”与“失败”,“同意”与“不同意”等等。通常以1表示成功,0表示失败,于是每一个区组由k个0或1构成。由于数据中存在有太多的重复数据,秩方法的应用就会受到,Cochran(1950)提出了Q检验法来检验二元定类数据的多个样本之间是否存在差异。

若有k个相关样本,每个样本有n个观测结果,检验k个样本之间是否有显著差异,则可以建立原假设和备择假设为:

H0:k个样本间无显著差异

H1:k个样本间有显著差异

由于三个及三个以上样本间差异的方向难于判定,因而,通常只建立双侧备择假设进行检验。

假设将获得的k样本数据可排成一个b行(区组)k列(处理)的表。如果H0为真,那么将测量结果用1和0表示的话,1和0应随机地分布在表中的各行各列。

我们以Lj表示第j个区组内成功(取值为1)的次数(列总和),而以Ni表示第i种处理中成功(取值为1)的次数(行总和)。Cochran Q检验的统计量定义为:

kk(k1)(NiQi1bbNki12j1kik)2k(k1)Ni(k1)Ni1b22

kLjj1Lj1kNLj12j在原假设H0下,对于固定的k,当b,Q统计量的抽样分布近似为自由度df=k-1的分布,所以根据自由度df=k-1,给定的显著性水平,能够在卡方分布表中查找出临界值

22,若

Q2,则在显著性水平下拒绝H0,表

明样本之间存在着显著差异。反之,则不能拒绝H0。

使用Cochran检验应注意的是:

(1)运用Cochran Q检验时应注意,只有当列数b不太小时,Q的抽样分布才近似于df=k-1的2分布。但是,b的最小数值日前并没有明确的说明,使用者采用时视具体问题而定。

(2)Cochran Q检验适用于定类尺度测量的数据,其它测量层次的数据也可以运用,需要将数据转化为两类,但这样做可能浪费数据中包含的信息。因此,Cochran Q检验一般只用于定类尺度的数据。

2. Friedman检验

Friedman检验也称为佛利得曼秩方差分析法,是1937年Friedman提出的检验方法,它是对k个样本是否来自同一总体的检验。Friedman提出的检验方法是地在每一个区组内各自对数据进行排秩。

与Cochran Q检验相似,Friedman检验也是用来检验各个样本所得的结果在整体上是否存在显著差异。因此原假设和备择假设和Cochran Q检验一样:

H0:k个样本间无显著差异

H1:k个样本间有显著差异

假设将获得的k样本数据可排成一个b行(区组)k列(处理)的表,行代表不同的受试者,即区组,列代表各个样本,即处理。对每一行的观测结果分别评秩,秩1是最小的,依次排序,秩从1到k。如果H0为真,那么每一列中秩的分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等,也就是说各列的秩和应该大致相等。检验过程如下:

第一步: 在每一个区组内分配各处理的秩。 设Rij为第i个处理第j个区组的秩,定义: (1) 第i个处理关于各区组所取秩的总和

bRiRj1ij(i1,2,...,k);

bk(k1)2(2) R1R2...Rkb(12...k)k

R(3) Ri1ikb(k1)2

若k个样本之间不存在差异,那么无论从哪一个区组去观察,每一种处理所得到的数据在该区组内可能排秩为1至k中的任何一个数。因此,如果H0真的

b话,对每一个i,Ri应与Rb(k1)2R相距不远,或者其秩平均Rii1ibk应与

(k+1)/2相差不多。仿照方差分析的做法,由处理产生的“秩变异平方和”为:

ki1b(Rik12k)2

k12当原假设H0为真时,b(Rii1)2应该比较小。反之,若该平方和较大的话,

则为拒绝原假设提供有力证据。

第二步:构造检验统计量

这个平方和究竟多大才算大,多小才算小,统计学的处理方法是:将它与另外的平方和或均方和来比较,Friedman检验统计量就是将这个平方和除以秩的整体平均平方和再乘以修正系数得到的。

bkij秩的整体平方和为:Var(Rk)ij(Rj1ikRi)/bk2(k1)(k1)12

b(RQi1ik12)2(k1)(k1)1212k2k1kk(k1)i1212kb(Rik12)2

bbk(k1)i1(Rik12)Rbk(k1)i112k2i3b(k1)式中,Ri第i个处理中不同区组的秩和,该统计量是Friedman(1937)提出来的,后来又被Kendall(1938,1962)和Kendall&Smith(1939)发展到多元变量的协同系数相关问题上。

对于有限的k和b,在H0下,可查Friendman检验临界值表,但查的时候要做变换,W似Q。

Q的抽样分布在n、k

Qb(k1),当查不到时,可用自由度为(k-1)的2分布近

不太小时,近似于自由度df=k—l的2分布。因此,

在卡方分布表中,可以根据给定的显著性水平,自由度df=k-1查得H0为真时相应的临界值2。若Q2,则在水平上拒绝H0,否则不能拒绝H0。

当数据有相同秩(出现结)时,Q可修正如下:

QC1Qg

3i2(i1i)bk(k1)式中,i为第i个结的长度,g为结的个数。 3.Kendall协同系数检验

在实际生活中,人们感兴趣的是几个变量之间是否具有同步或相关性,比如m个选民对n个候选人的评价,m个咨询机构对一系列(n个)企业的评估以及m个评委对n个歌手打分等等。人们往往想知道,这m个结果是否一致。令原假设H0为:“这些评估(对于不同个体)是不相关的”而备择假设为H1:“它们(对各个个体)是相关的。”这里完全有理由用前面的Friedman方法来检验。Kendall一开始也是这样做的,后来,Kendall和Smith(1939)提出了协同系数(Coefficient of concordance),协同系数可以看成为二元变量的Kendall τ在多元情况的推 广。Kendall协同系数(Kendall Coefficient of Concordance)用于多组秩之间关联程度的测定。

设有k个样本,每个样本有n个数据,那么对于每一个样本,可以分别赋予某一个秩,在这一组数据内所有的秩和为:

12...nn(n1)2

kn(n1)2如果有k组样本,那么这k组样本秩的秩总和就是对于每一个观察对象来说,平均的秩次和应为

。如果Rj

kn(n1)2nk(n1)(j=l,2,„,n)表示每一观察对象的实际秩和,那么,Rj与

2k(n1)2越接近,表

明对第j个观察对象的秩越接近于平均秩;二者相差越远,越远离平均秩。由于

Rj与

k(n1)2的差值可正可负,因此,在分析时应采用差值的平方和。定义差值

的平方和为S,即

n Sj1(Rjk(n1)2)

2在k组秩完全一致时,各个观察对象的秩和与平均秩和的离差平方和,是最大可能的离差平方和。由于k组秩完全一致时,各观察对象的秩和分别为k,2k,„,nk,也就是说,当k组秩评定之间完全一致的时候,Rj应是k,2k,„,nk。因此,最大可能的离差平方和为:

n(jkj1k(n1)2n)k22(jj1(n1)2)2kn(n1)1222

实际偏差平方和与最大可能偏差平方和之比,在一定程度上能够反映k组秩之间的一致性,即协调程度。

因此上述两式相除可得到Kendall协同系数W:

12Skn(n1)22nW12j1(Rj2k(n1)22kn(n1))2

W的取值在0到1之间。若W=0,表明k组秩之间不相关;若W=1,表明k组秩之间完全相关,即完全一致。

为方便计算,上式还可以展开成下面的形式:

n12RWj12j23kn(n1)222kn(n1)

协同系数W,实际表达了实际偏差平方和和最大可能偏差平方和之比,在一定程度上反映了k组秩之间的一致性,即协同程度。

在作检验时,W统计量和S统计量可查Kendall协同系数检验表;当大样本时,有2k(n1)W12Skn(n1)(n1)

2二、K个样本的非参数检验 1. Kruskal-Wallis检验

Kruskal-Wallis检验是1952年由Kruskal和Wallis两人提出的。它是两个样本Mann—Whitney—Wilcoxon检验推广到3个或更多个样本的方法。

若有k个总体,各自的连续累积分布函数为F1(x),F2(x),...,Fk(x),那么Kruskal—Wallis检验的原假设为:

H0:F1(x)F2(x)...Fk(x) 对所有的x

若研究时偏重于考察位置参数,并且位置参数采用各个总体的中位数,那么,H0等价于k个总体的中位数相等。若仍以M1,M2,...,Mk代表k个总体的中位数,则Kruskal—Wallis检验建立的假设为:

H0:M1M2...Mk

H1:Mj(j1,...,k)中至少有两个不相等

这里的备择假设对于k>2时不存在单侧备择假设的配对,因为对于Mj(j1,...,k)来说,有k!种不同的有序排列,不便于进行检验。

假设有k个的随机样本,其大小为n1,n2,...,nk,分别从各自的总体中抽取,总体分别具有连续的累积概率分布F1(x),F2(x),...,Fk(x)。

将k个样本数据混合起来从小到大进行排序,记观察值xij在混合样本中的秩为Rij。定义:

nkRiRj1ij(i1,2,...,k)为第i个样本的秩和;

RiRini(i1,2,...,k)为第

n(n1)2i个样本的平均秩和; 为所有数据混合后的秩和;

R..12...nkRR..i1inn(n1)2n(n1)2为所有观察值的秩的平均。

当Ri存在较大差别时,有理由怀疑H0是否为真。

混合数据各秩的平方和为:

Rij12...n2222n(n1)(2n1)6

因此混合数据各秩的总平方和为:

nkk2nkkSSTj1i1(RijR..)(RijR../n22n(n1)(n1)12

j1i1总方差估计(总均方)为:

Var(Rij)MSTSSTn1n(n1)12

各样本处理间的平均和为:

kkiSStni1(RiR..)2Ri12i/niR..2kRi12i/nin(n1)/4

2由此,仿照方差分析的做法,可以构造检验的统计量,将它定义为H:

kHSStMSTi1Ri/nin(n1)/4n(n1)/122212n(n1)ki1Ri/ni3(n1)

2在H0为真的条件下,只要k大于3, H近似的服从自由度为(k-1)的2分布。 或者可以这样来思考:

将所有数据按从小到大的顺序合并成一个单一的样本,其大小

nn1n2...nk。将每一个观察值给出一个秩,秩为整数,从1到n。对于n

个观察值来说,平均秩是:

12...nnn(n1)2nn12

ni(n1)2对于含有ni个观察值的第i个样本来说,秩和的期望值是第i个样本的实际秩和,那么Rini(n1)2。若以Ri表示

就表示k个样本中第i个样本秩和

与其均值的偏差。如果H0为真,所有样本数据混合排列成一个单一的随机样本,秩应该在k个样本之间均匀地分布,也就是说,各样本实际的秩和Ri与期望秩和

ni(n1)2之间的偏差应很小。

因此,Kruskal—wallis检验定义的统计量可以建立在实际秩和Ri与期望秩和

ni(n1)2的偏差的基础上。计算公式为:

12kHn(n1)i1[Ri-ni(n1)/2]ni22Rn(n1)i112ki2/ni3(n1)

因此,可以构造Kruskal-Wallis检验统计量为: HRn(n1)i112ki2/ni3(n1)~(k1)

2 小样本时,可以查K-W检验临界值表得出检验结论。

大样本时,可以查2分布表得出结论。当样本数k、每个样本包含的观察值数目ni,不是很小时,检验统计量H近似服从自由度df=k-1的2分布。根据给定的显著性水平,自由度df=k-1,在卡方分布表中可以查找到H0为真时

的临界值2。若H<2,数据支持H0,k个样本之间无显著差异。若H>2,数据拒绝H0,k个样本之间存在显著差异。

通常情况下,当k=3和各个ni5时,渐近的P值无法由卡方分布表得到,而只能查K-W检验临界值表。这个表是Kruskal.W.H和Wallis.W.A.于1952年在其合作的著作中发表的。

当数据有相同值(存在结)时,H可修正如下:

HC1Hg

3i(i13i)nn式中,i为第i个结的长度,g为结的个数。 2. Jonckheere-Terpstra检验

设有k个样本X1,X2,...,Xk,Xi~F(Xi),其中1,2,...,k为位置参数。K-S检验主要用于双边假设检验,但在实践中,有可能需要我们判断样本的位置是否呈现出某种趋势(上升或下降趋势),若为持续上升的趋势,检验假设为:

H0:12...k,H1:12...k,若为持续下降的趋势,检验假设为:H0:12...k,H1:12...k,这时可以使用

Jonkheere-Terpstra检

验。与Mann-Whitney检验类似,如果一个样本中观察值小于另一个样本中的观察值,则可以考虑两总体的位置之间有大小关系。

Jonkheere-Terpstra检验过程为: 第一步:计算

Uij#(XikXjl,i1,2,...,ni;j1,2,...,nj),表示样本

i中观察值小于样本j

中观察值的对数。

第二步:对所有的Uij在ij范围内求和,这样就产生了Jonkheere-Terpstra统计量。

Jonkheere-Terpstra检验的统计量可以定义为: JU

ijijJ的取值范围为:0Jnijinj

由J的定义可知,J越大对H0越不利。因而尾概率为P(Jc),查

Jonkheere-Terpstra检验临界值表可求出临界值c。

如果有结的情况出现,则Uij应作修正,检验统计量也应作相应的变动:

Uij#(XikXjl,i1,2,...,ni;j1,2,...,nj)*12#(XikXjl,i1,2,...,ni;j1,2,...,nj)相应的检验统计量为:J*U

*ijij 在大样本时,可以使用正态近似。

kJ(nZ[n(2n3)2k2ni12i2i)/4N(0,1)

ni1(2ni3)]/723. 中位数检验

两个样本Brown-Bood中位数检验在k个样本中的推广。 实验背景:

一、K个相关样本的的非参数检验

1.为考察甲、乙、丙三名推销员的推销能力,设计实验,让推销员向指定的12位客户推销商品,若顾客认为推销员的推销服务满意,就给1分,,否则给0分,所得结果如下:

客户 1 2 3 4 5 6 7 8 9 10 11 12 甲推销员 1 1 1 1 1 1 0 0 1 1 1 0 乙推销员 0 1 0 1 0 0 0 1 0 0 0 0 丙推销员 1 0 1 0 0 1 0 1 0 0 0 1 试利用Cochran检验检验三位推销员的推销效果是否相同。(α=0.05)(数据来源,王星,《非参数统计》,中国人民大学出版社,2005,P155)

2. 美国三大汽车公司(A、B、C三种处理)的五种不同的车型某年产品的油耗数据如下:

公司 A B C Ⅰ 20.3 25.6 24.0 Ⅱ 21.2 24.7 23.1 Ⅲ 18.2 19.3 20.6 Ⅳ 18.6 19.3 19.8 Ⅴ 18.5 20.7 21.4 试利用Friedman检验分析不同公司的油耗是否存在差异。(α=0.05)(数据来源,王星,《非参数统计》,中国人民大学出版社,2005,P155)

3.下面是4个机构对12种彩电(A-L)的综合性能的排序结果: 评估机构 被评估的12种彩电(A-L)的排名 A B C D E F G H I J K L Ⅰ Ⅱ Ⅲ Ⅳ 12 9 2 4 10 7 11 6 8 5 3 1 10 1 3 12 8 7 5 9 6 11 4 2 11 8 4 12 2 10 9 7 5 6 3 1 9 1 2 10 12 6 7 4 8 5 11 3 试利用Kendall检验检验这些排序是否产生较一致的结果。(α=0.05)(数据来源,吴喜之,《非参数统计》,中国统计出版社,1999,P118)

二、K个样本的的非参数检验

1. 我国2005年沿海和非沿海省地区的人均国内生产总值(GDP)的数据如

下(单位为元):

沿海地区包括:北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西和海南。人均国内生产总值分别为:

45444 35783 14782 183 51474 24560 27703 186 20096 24435 8788 10871

非沿海省地区包括:山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南、重庆、四川、贵州、云南、、陕西、甘肃、青海、宁夏和。人均国内生产总值分别为:

12495 16331 13348 14434 8675 9440 11346 11431 10426 10982

9060 5052 7835 9114 99 7477 10045 10239 13108 利用Brow-Mood中位数检验检验沿海和非沿海省市区的人均GDP的中位数是否一样。(α=0.05)

2.我国2005年东、中、西三个地区的人均国内生产总值(GDP)的数据如下(单位为元):

东部地区包括:北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东广东和海南。人均国内生产总值分别为:

45444 35783 14782 183 51474 24560 27703 186 20096 24435 10871

中部地区包括:山西、吉林、黑龙江、安徽、江西、河南、湖北和湖南。人均国内生产总值分别为:

12495 13348 14434 8675 9440 11346 11431 10426

西部地区包括:广西、内蒙古、重庆、四川、贵州、云南、、陕西、甘肃、青海、宁夏和。人均国内生产总值分别为:

8788 16331 10982 9060 5052 7835 9114 99 7477 10045 10239 13108

(1)试利用Kruskal-Wallis检验检验验沿海和非沿海省市区的人均GDP的中位数是否一样。(α=0.05)

(2)研究认为,我国人均国内生产总值为:西部地区中部地区东部地区,试利用Jonkheere-Terpstra检验检验这种结论是否正确。(α=0.05)

(3)试利用Brow-Mood中位数检验检验沿海和非沿海省市区的人均GDP的中位数是否一样。(α=0.05)

实验过程:

一、K个相关样本的非参数检验 1. Cochran Q检验

激活数据管理窗口,建立数据文件,定义客户对甲推销员的满意程度变量为jia,客户对乙推销员的满意程度变量为yi,客户对丙推销员的满意程度变量为bing,按顺序输入数据,结果如图4.47。

图4.47

选择Analyze/ Nonparametric Tests/K Related Samples… ,打开Tests for Serveral Related Samples对话框,如图4. 48所示:

图4.48

图4.48左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的Test Variables框中。

(1)Test Variables框:用于选入需要进行检验的变量,从左侧候选变量框列表中选择需要进行检验的变量,移入该框。本例中选中变量jia、yi和bing三个变量,使之进入Test Variables框。

(2)Test Type:指定用来进行检验的方法。在Test Type框中,提供了可供用来检验的方法有有三种:

Friedman复选项:双向方差分析,即最常用的随机区组设计资料

的秩和检验,考察多个相关样本是否取自同一总体,系统默认选项。 Cochran’s Q 复选项:科库兰检验,两相关样本McNemar 检验

的多样本推广,适用于二分类变量。

Kendall W复选项:Kendall和谐系数检验,通过计算Kendall 和

谐系数W,以检验多个相关样本是否来自同一分布的总体,取值在0到1之间。

(3)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(4)Statistics子对话框:选择可供输出的统计量。如图4.49

图4.49

Descriptive:输出常用的描述统计量,包括变量的均值、标准差、最大值、最小值等等。

Quartiles:输出变量的四分位数。

在本例中,选择Analyse/Nonparametric Tests/K Related Samples…,打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选jia、yi、bing三个变量,然后单击向右箭头按钮使它们进入Test Variable框。在Test Type框中选择Cochran’s Q方法,单击OK按钮即可,提交运行Tests for Several Related Samples命令,得到结果如图4.50和4.51:

图4.50

图4. 50为Cochran’s Q检验输出的频数列表, 其中样本jia中0出现了3次,1出现了9次,样本yi中0出现了9次,1出现了3次,样本bing中0出现了7次,1出现了5次。

图4.51

图4.51为Cochran’s Q检验的结果,给出了样本的观测数目N、Cochran’s Q统计量,自由度,检验的近似显著性p值,可见N=12,Cochran’s Q=5.091 ,自由度地方=2,近似的p值=0.078,大于0.05,不拒绝原假设H0,认为三位推销员的推销效果是相同的。如果=0.1,则拒绝原假设H0,认为三位推销员的推销效果是不同的。

2. Friedman检验

激活数据管理窗口,建立数据文件,定义三大汽车公司为变量a、b、c,按顺序输入数据,结果如图4.52。

图4.52

选择Analyze/ Nonparametric Tests/K Related Samples… ,打开Tests for Serveral Related Samples对话框,如图4. 53所示:

图4.53

选择Analyse/Nonparametric Tests/K Related Samples…,打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选a、b、c三个变量,然后单击向右箭头按钮使它们进入Test Variable框。在Test Type框中选择Friendman方法,单击OK按钮即可,提交运行Tests for Several Related Samples命令,得到结果如图4.54和4.55:

图4.54

图4.54为Friedman检验输出的各个样本的秩情况表, 其中样本A的平均秩为1,样本B的平均秩为2.4,样本C的平均秩为2.6。

图4.55

图4.55 为Friedman检验的结果,给出了样本的观测数目N、Chi-Square统计量,自由度,检验的近似显著性p值,可见N=5,Chi-Square=7.600,自由度df=2,近似的 p值=0.022,小于0.05,拒绝原假设H0,认为美国三大汽车公司的油耗存在显著的差异。

3. Kendall协同系数检验

激活数据管理窗口,建立数据文件,定义12种彩电的综合性能的排序变量分别为A、B、C、D、E、F、G、H、I、J、K、L, 按顺序输入数据,结果如图4.56。

图4.56

选择Analyze/ Nonparametric Tests/K Related Samples… ,打开Tests for

Serveral Related Samples对话框,如图4. 57所示:

图4.57

选择Analyse/Nonparametric Tests/K Related Samples…,打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选a、b、c、d、e、f、g、h、i、j、k、l12个变量,然后单击向右箭头按钮使它们进入Test Variable框。在Test Type框中选择Kendall’s W方法,单击OK按钮即可,提交运行Tests for Several Related Samples命令,得到结果如图4.58和4.59:

图4.58

图4.58为Kendall’s W检验输出的各个样本的秩情况表, 其中样本A的平均

秩为10.5,样本B的平均秩为4.75,样本C的平均秩为2.75,样本D的平均秩为9.5,样本E的平均秩为8,样本F的平均秩为7.5,样本G的平均秩为8,样本H的平均秩为6.5,样本I的平均秩为6.75,样本J的平均秩为6.75,样本K的平均秩为5.25,样本L的平均秩为1.75。

图4.59

图4.59 为Kendall’s W检验的结果,给出了样本的观测数目N、Kendall’s W统计量、Chi-Square统计量,自由度,检验的近似显著性p值,可见N=4,Kendall’s W=0.503,Chi-Square=55.115,自由度df=11,近似的 p值=0.023,小于0.05,拒绝原假设H0,认为这些排序产生的结果是一致的,也就是说,这个评估是有道理的。

二、K个样本的非参数检验 1. Kruskal-Wallis检验

激活数据管理窗口,建立数据文件,定义东、中、西部的人均国内生产总值变量为rjgdp,定义分组变量为group(东部地区为1,中部地区为2,西部地区为3),切换到Variable View中,定义变量值标签,在group变量中,1表示东部地区,2表示中部地区,3表示西部地区,再切换到Data View中,按顺序输入数据,结果如图4.60。

图4.60

选择Analyze/ Nonparametric Tests/K Independent Samples… ,打开Tests for Serveral Independent Samples对话框,如图4. 61所示:

图4.61

图4.61左侧为候选变量框,在候选变量框中选择一个或多个变量,单击向

右箭头按钮使其进入右侧的Test Variable List框中。

(1)Test Variable List框:用于选入需要进行检验的变量,从左侧候选变

量框列表中选择需要进行检验的变量,移入该框。本例中选中rjgdp变量,使之进入Test Variable List框。

(2)Grouping Variable框:指定分组变量值的范围。

从左侧候选变量框中选择用来分组的变量,单击向右箭头移动到Grouping Variable框中,此时,Define Range按钮会变黑,单击此按钮,进入Define Range对话框,如图4.62所示,定义变量值的范围。

Minimum:定义分组变量范围的最小值,即下限值。

Maximum:定义分组变量范围的最大值,即上限值。本例中,在Minimum

后的框中输入1,在Maximun后的框中输入3。

图4.62

(3)Test Type:指定用来进行检验的方法。在Test Type框中,提供了可供用来检验的方法有有三种:

Kruskal-Wallis H 复选项:即常用的多样本比较的秩和检验,为单向方

差分析,检验多个样本在中位数上是否有差异,系统默认选项。

Median 复选项:中位数检验,用于检验两个或多个样本是否来自具

有相同中位数的总体,三种方法中它的检验效能最低。

Jonckheere-Terpstra复选项:用于检验多个样本的位置是否出现某种趋势,检验这种趋势在统计上是否显著。它适用于连续性资料或有序分类资料,当分组变量是有序分类资料时,此法比Kruskal-Wallis H 检验法更为有效。

(4)Exact子对话框:用于设定是否进行确切概率的计算以及具体的计算方法。同前面的图4.4一样。

(5)Option子对话框:选择输出结果形式及缺失值的处理方式,同前面的图

4.5 一样。

在本例中,选择Analyse/Nonparametric Tests/K Independent Samples…,打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选rjgdp变量,然后单击向右箭头按钮使它们进入Test Variable List框;

从左侧候选变量框中选择变量group,单击向右箭头移动到Grouping Variable框中,单击Define Range按钮,进入Define Range对话框,在Minimum后的框中输入1,在Maximun后的框中输入3,单击continue返回主对话框;

在Test Type框中选择Kruskal-Wallis H检验方法,单击OK按钮即可,提交运行Tests for Several Independent Samples命令,得到结果如图4.63和图4.:

图4.63

图4.63为Kruskal-Wallis H检验输出的秩情况列表,其中东部地区11个观测,平均秩为25.18,中部地区8个观测,平均秩为13.88,西部地区12个观测,平均秩为9。

图4.

图4. 为Kruskal-Wallis H检验的结果,给出了Chi-Square统计量,自由度,近似的显著性p值。可见Chi-Square=18.768,自由度=2,近似的p值=0.000,小于0.05,拒绝原假设H0,认为我国东中西三个地区的人均国内生产总值(GDP)

有显著的差异。

2. Jonckheere-Terpstra检验

激活数据管理窗口,建立数据文件,定义东、中、西部的人均国内生产总值变量为rjgdp,定义分组变量为group(西部地区为1,中部地区为2,东部地区为3),切换到Variable View中,定义变量值标签,在group变量中,1表示西部地区,2表示中部地区,3表示东部地区,再切换到Data View中,按顺序输入数据,结果如图4.65。

图4.65

在本例中,选择Analyse/Nonparametric Tests/K Independent Samples…,打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选rjgdp变量,然后单击向右箭头按钮使它们进入Test Variable List框;

从左侧候选变量框中选择变量group,单击向右箭头移动到Grouping Variable框中,单击Define Range按钮,进入Define Range对话框,在Minimum后的框中输入1,在Maximun后的框中输入3,单击continue返回主对话框;

在Test Type框中选择Jonckheere-Terpstra检验方法,单击OK按钮即可,提交运行Tests for Several Independent Samples命令,得到结果如图4.66:

图4.66

图4.66为Jonkheere-Terpstra检验的结果,给出了样本的个数,观测值的数目,J-T统计量,近似的显著性双尾p值。可见 样本为3个,观测值为31个,J-T统计量=281,近似的p值=0.000,小于0.05,拒绝原假设H0,认为我国东中西三个地区的人均国内生产总值(GDP)有显著的差异,可见,我国的人均国内生产总值为:西部地区中部地区东部地区。

3.中位数检验

(1) 两样本 Brown-Mood中位数检验

需要注意的是,两个样本的Brown-Mood中位数检验的过程在k Independent Samples…过程里。

激活数据管理窗口,建立数据文件,定义沿海和非沿海地区的人均国内生产总值变量为rjgdp,定义分组变量为group(沿海地区为1,非沿海地区为2),切换到Variable View中,定义变量值标签,在group变量中,1表示沿海地区,2表示非沿海地区,再切换到Data View中,按顺序输入数据,结果如图4.67。

图4.67

选择Analyze/ Nonparametric Tests/K Independent Samples… ,打开Tests for Serveral Independent Samples对话框,如图4. 68所示:

图4.68

在本例中,选择Analyse/Nonparametric Tests/K Independent Samples…,

打开Tests for Several Related Samples 对话框,在对话框左侧的候选变量列表中选rjgdp变量,然后单击向右箭头按钮使它们进入Test Variable List框;

从左侧候选变量框中选择变量group,单击向右箭头移动到Grouping Variable框中,单击Define Range按钮,进入Define Range对话框,在Minimum后的框中输入1,在Maximun后的框中输入2,单击continue返回主对话框;

在Test Type框中选择Median中位数检验方法,单击OK按钮即可,提交运行Tests for Several Independent Samples命令,得到结果如图4.69和4.70:

图4.69

图4.69为Median检验输出的频数列表, 其中混合样本中大于混合中位数的沿海地区有10个观测,非沿海地区有5个观测,小于等于混合中位数的沿海地区有2个观测,非沿海地区有14个观测。

图4.70

图4.70 为Median检验的结果,给出了样本的观测数目N、混合中位数Median,Chi-Square统计量,自由度,近似的显著性p值以及Yates'连续型校正Chi-Square统计量,自由度,近似的显著性p值。可见N=31,混合后的

Median=11431 ,Chi-Square=9.754,自由度=1,近似的p值=0.002,Yates'连续型校正Chi-Square=7.427,自由度=1,近似的显著性p值=0.006,小于0.05,拒绝原假设H0,认为沿海地区和非沿海地区的人均国内生产总值(GDP)有显著的差异,可见,沿海地区的人均GDP要高于非沿海地区的人均GDP。

(2) 多个样本中位数检验

激活数据管理窗口,建立数据文件,定义东、中、西部的人均国内生产总值变量为rjgdp,定义分组变量为group(东部地区为1,中部地区为2,西部地区为3),切换到Variable View中,定义变量值标签,在group变量中,1表示东部地区,2表示中部地区,3表示西部地区,再切换到Data View中,按顺序输入数据,结果如图4.59所示:

选择Analyze/ Nonparametric Tests/K Independent Samples… ,打开Tests for Serveral Independent Samples对话框,如图4. 60所示:

在对话框左侧的候选变量列表中选rjgdp变量,然后单击向右箭头按钮使它们进入Test Variable List框;

从左侧候选变量框中选择变量group,单击向右箭头移动到Grouping Variable框中,单击Define Range按钮,进入Define Range对话框,在Minimum后的框中输入1,在Maximun后的框中输入3,单击continue返回主对话框;

在Test Type框中选择Median检验方法,单击OK按钮即可,提交运行Tests for Several Independent Samples命令,得到结果如图4.71和图4.72:

图4.71

图4.70为Median检验输出的频数列表, 其中混合样本中大于混合中位数的东部地区有10个观测,中部地区有3个观测,西部地区有2个观测,小于等

于混合中位数的东部地区有1个观测,中部地区有5个观测,西部地区有10个观测。

图4.72

图4.72 为Median检验的结果,给出了观测的个数N,混合的中位数Median,Chi-Square统计量,自由度,近似的显著性p值。可见N=31 ,Median=11431,Chi-Square=13.178,自由度=2,近似的p值=0.001,小于0.05,拒绝原假设H0,认为我国东中西三个地区的人均国内生产总值(GDP)有显著的差异。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务