第六章 参数检验与置信区间
第一节 单个正态总体的均值检验与置信区间 一、基本问题
设总体X服从正态分布N(,2),样本为x1,x2,„,xn,欲检验如下假设
H0:0H1:0
并求平均值的置信度为(1-)100%的置信区间。 二、基本原理
1.假设检验
(1)检验所用的统计量
在H0成立的条件下,
Tx0snnn~t(n1)1(xix)2n1i1n其中x1xi,snni1
由于正态总体平均数的估计量是样本平均数,所以x0的偏差程度,反映了与x0偏大,T值偏大,这说明0
之间的差异程度。显然
与0有显著性差异,即H0不成立。
至于大到什么程度才是“偏大”,一般这要用“临界值”来判定。SPSS是用“临界概率”(显著性概率)来判定。
(2)判定方法
根据t分布计算出的显著性概率
Sig.=P(TT值)
如果Sig.< ,其中是给定的显著性水平,则拒绝H0,即认为与0有显著差异;
如果Sig.> ,则接受H0,即认为与0没有显著差异。 2.置信区间
所谓一个未知参数θ的置信区间是指:满足
P[θ1(x1,x2,„,xn)≤θ≤θ2(x1,x2,„,xn)]=1-α 则称[θ1(x1,x2,„,xn), θ2(x1,x2,„,xn)]是未知参数θ的置信度为1-α的置信区间,其中θ1(x1,x2,„,xn),θ(x1,x2,„,xn)是统计量,0<α<1为小概率。
对正态总体参数μ的(1-α)100%的置信区间是
[xt(n1)2sns,xt(n1)nnn2]
三、基本计算
1.数据文件
只有一个变量 2.选择统计方法
Analyze→Compare mean→One-Sample T Test 变量进Test栏;
Test下的小栏内填写100。 注
:
事
实
上
是
检
验
H0:00H1:00,置信区间也是对-0作出的。3.结果说明
结合例6.1.1的结果来说明。
第二节 两个正态总体的均值检验与置信区间
一、基本问题
设样本X1,X2,Xm来自正态总体X~N(1,12),样本Y1,Y2,,Yn来自正态总体222Y~N(2,2),其中12,2未知,当12=2时,欲检验如下假设 H0:12H1:12
并求μ1-μ2的置信度为(1-α)100%的置信区间。 二、基本原理 1.假设检验
(1)检验所有的统计量
当H0成立时,
TXY2(m1)S12m(n1)S2nmn(mn2)~t(mn2)
mn2其中X,S12m为来自X总体的样本平均数与样本方差,Y,S2n为来自Y总体的样本平均与样本方差。
(2)具体判断
根据
t分布计算出的显著性概率
Sig.=P(TT值)
如果Sig.< ,其中是给定的显著性水平,则拒绝H0,即认为1与2有显著差异;
如果Sig.> ,则接受H0,即认为1与2没有显著差异。
2.置信区间
μ1-μ2的置信度为(1-α
)100%的置信区间为
[xyt(mn2)d,xyt(mn2)d]222(m1)s12m(n1)s2nmn(mn2)mn
其中d
3.方差齐性检验
由于在检验时需要条件:两总体都服从正态分布以及它们的方差相等,而正态分布由中心极限定理比较容易满足,而它们的方差是否相等,需要进行检验。
方法是:
22欲检验H0:122H1:122在H0成立的条件下,
2S1*mF2~F(m1,n1)S2n
当Sig.P(FF值)时,H0不成立;反之,H0成立。三、基本计算
1.数据文件
要有二个变量,一个是分组变量,另一个是分析变量。 2.选择统计方法
Analyze→Compare means→Independent Samples T Test 两个变量分别进入对应的栏; 3.结果说明
结合例6.2.1的结果来说明。 注:1.进一步考察哪一个总体为好。
以平均数为标准。
方法是比较两总体样本的平均数。
SPSS的处理:先拆分文件,再计算两总体样本平均数,具体是:先Data→ Split File→在主对话框选○compare group。
再Descriptive Statistics→Descriptives… 2.结果的保存与导出的方法 保存用Save;
导出用copy(对文本)或copy object(对图表)。
补充:成对相依样本t检验
要比较同一组受试者在两次测验成绩的差异时使用(测验成绩服从正态分布)。这时数据成对出现(X,Y)。因此成对相依样本数据文件中的变量是X与Y两个,选择统计方法是 Analyze→Compare means→Paired- Samples T Test