〈统计分析与SPSS的应用(第五版)》(薛薇)
课后练习答案
第5章SPSS的参数检验
1、某公司经理宣称他的雇员英语水平很高 ,如果按照英语六级考试的话 ,一般平均得分为
75分。现从雇员中随机选出11人参加考试,得分如下:80, 81,72, 60, 78, 65, 56, 79,
77,87, 76 请问该经理的宣称是否可信
。
原假设:样本均值等于总体均值 输出结果
即u=u0=75 步骤:生成spss数据T分析T比较均值T单样本t检验T相关设置T
(An alyze->compare mean s-> on e-samples T test
采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异
单个样本统计量 );
N 成绩
均值 73.73 单个样本检验 检验值=75 标准差 9.551 均值的标准误 2.880 11 差分的95%置信区间 t 成绩 -.442 df 10 Sig.(双侧) .668 均值差值 -1.273 下限 -7.69 上限 5.14 分析:指定检验值:在 test后的框中输入检验值 (填75),最后ok! 分析:N=11人的平均值(mean )为73.7,标准差(std.deviation )为9.55,均值标准误差(std error mean)为2.87. t统计量观测值 为-4.22 , t统计量观测值的双尾概率 p-值(sig.(2-tailed))为 0.668 ,六七列是总体均值与原假设值差的
95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a
和p。T统计量观测值的双尾概率 p-值(sig.(2-tailed))为0.66 8 > a=0.05所以不能拒绝原假设 ;
且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所 以经理的话是可信的。
2、在某年级随机抽取 35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小
时)
24 6 30 10 15 47
17 28 17 20 30 25 36 26 44 「 26 29 39 32 ' 13 35 26 37 38 8 40 33 26 45 15 27 28 17 29 16 (1) 请利用SPSS对上表数据进行描述统计,并绘制相关的图形。 (2)
大学生每周上网时间平均值的 (1)分析描述统计描述、频率 (2)分析 比较均值 单样本T检验
基于上表数据,请利用SPSS给出9 5%的置信区间。
One-Sample Statistics N
Mean 35 27.5429 Std. Deviation Std Error Mean 10.7000^ 1JB0B 上网旳闾 One-Sa)nple Test Test Value = 0 95% Conftdence lirlerval ofltie Difference t 15.229 df Sig.(2-taiied) .000 Diflference 27.54285 Lower 23,8673 Upper 31.2184 上网31 每周上网时间的样本平均值为 27.5 ,标准差为10.7,总体均值95%的置信区间为23.8-31.2.
3、经济学家认为决策者是对事实做出反应 ,不是对提出事实的方式做出反应 。然而心理学家则倾 向于认为提出事实的方式是有关系的 。为验证哪种观点更站得住脚 ,调查者分别以下面两种不同的 方式随机访问了足球球迷 。
原假设:决策与提问方式无关,即u-u0=0 步骤:生成spss数据T分析T比较均值T两样本t检验T相关设置T输出结果 表5-3
组统计量 提问方式 N 决策 均值 .46 .88 标准差 .500 .326 均值的标准误 .035 .024 丢票再买 厶J 丿'< 丢钱再买 200 183 表5-4
决策者的决策与提问方式有关
由表5-4看出,样本在
样本检验 0.05的检验值为
0,小于
方差方程的 Levene 检验 均值方程的t 检验 差分的95%置信 Sig.(双 均值差 值 -.420 -.420 标准误差 值 .044 .043 区间 下限 -.505 -.504 F 决假设方差相等 Sig. .000 t -9.0 -9.815 df 381 345.536 侧) .000 .000 上限 -.334 -.336 257.985 策假设方差不相 等 分析:由表5-3可以看出,提问方式不同所做的相同决策的平均比例是
46%和88% ,认为0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关 更站得住脚。
,心理学家的观点
分析:
从上表可以看出票丢仍买的人数比例为 样本比例有较大差距。
1•两总体方差是否相等 F检验:F的统计量的观察值为
257.98,对应的
46%,钱丢仍买的人数比例为
88%,两种方式的
P值为0.00,;如果显著性水平为 0.05,由于概率P值小于0.05,两种方式的方差有显著差异 。 看假设方差不相等行的结果
。2.两总体均值(比例)差的检验:.T统计量的观测值为-9.815,
对应的双尾概率为 0.00,T统计量对应的概率 P值<0.05,故推翻原假设,表明两总体比例有显 著差异.更倾向心理学家的说法。
4、一种植物只开兰花和白花。按照某权威建立的遗传模型,该植物杂交的后代有75%的 几率开兰花,25%的几率开白花。现从杂交种子中随机挑选 200颗,种植后发现142株开了
兰花,请利用SPSS进行分析,说明这与遗传模型是否一致 ? 原假设:开蓝花的比例是75%,即u=u0=0.75 步骤:生成spss数据T分析T比较均值T单样本t检验T相关设置T输出结果 表5-5
单个样本统计量 N 开花种类 200 均值 1.29 标准差 .455 均值的标准误 .032 表 5-6
单个样本检验 检验值=0.75 差分的95%置信区间 t df 199 Sig.(双侧) .000 均值差值 .540 下限 .48 上限 .60
开花种类 16.788 分析:由于检验的结果 sig值为0 ,小于0.05 ,故拒绝原假设 ,由于检验区间 为
(1.23,1.35 ), 0.75不在此区间内,进一步说明原假设不成立 致。
,故认为与遗传模型不一
5、给幼鼠喂以不同的饲料,用以下两种方法设计实验:方式1 :同一鼠喂不同的饲料所测 得的体内钙留存量数据如下 : 鼠号 1 2 3 4 5 6 7 8 9 饲料1 33.1 33.1 26.8 36.3 39.5 30.9 33.4 31.5 28.6 饲料2 36.7 28.8 35.1 35.2 43.8 25.7 36.5 37.9 28.7 方式2 :甲组有12只喂饲料1 ,乙组有9只喂饲料2所测得的钙留存量数据如下 甲组饲料 1 : 29.7 26.7 28.9 31.1 31.1 26.8 26.3 39.5 30.9 33.4 33.1 28.6
乙组饲料 2: 28.7 28.3 29.3 32.2 31.1 30.0 36.2 36.8 30.0
请选用恰当方法对上述两种方式所获得的数据进行分析 不同
,研究不同饲料是否使幼鼠体内钙 的留存量有显著
原假设:不同饲料使幼鼠体内钙的留存量无显著不同
方式1步骤:生成SPSS数据T分析T比较均值T配对样本t检验T相关设置T输出结果
表5-7
成对样本统计量 均值 对1 N 9 9 标准差 3.8108 5.5993 均值的标准误 1.2703 1.86 饲料1钙存量 饲料2钙存量 32.578 34.267 表5-8
成对样本相关系数 N 对1 相关系数 .571 Sig. .108 饲料1钙存量&饲料2钙存量 9 表5-9
成对样本检验 成对差分 差分的95%置信 均值的标准 均值 对1饲料1钙存量-饲料2 钙存量 -1.68 标准差 4.6367 误 1.5456 下限 -5.2529 区间 上限 1.8752 t -1.093 df 8 T
Sig.(双 侧) .306 方 式2步骤:生成spss数据表 5-10
T
分析
T
比较均值
T
样本t检验
T
相关设置输出结果
组统计量
饲料类型 N 钙存量 均值 30.508 31.400 标准差 3.6882 3.1257 均值的标准误 1.07 1.0419 饲料1 「 饲料2 12 9
表 5-11
样本检验 方差方程的 Levene 检验 均值方程的t检验 差分的95%置 Sig.(双 F 钙存 量 均值差 值 -.17 标准误差 值 1.5268 信区间 下限 -4.0873 上限 2.3040 Sig. .811 t -.584 df 19 侧) .566 假设方差相 等 .059 假设方差不 相等 -.599 18.5 .557 -.17 1.47 -4.0136 2.2303 分析:采用配对样本t检验法所得结果如表5-7,5-8,5-9所示,配对样本的分析结果可以 看出两组的平均差是 1.7在置信区间内 (-5.2529,1.8752) 同时sig值为0.153>0.05 不 应该拒绝原假设。采用样本t检验法所得结果如表5-10,5-11所示,可以看出均值差为
0.2在置信区间内 sig值为0.405,大于0.05,故不能拒绝原假设。所以,两种饲料使用 后的钙存量无显著差异。
6、如果将第2章第9题的数据看作是来自总体的样本 原假设:男女生课程平均分无显著差异
,试分析男生和女生的课程平均分是 否存在显著差异?
步骤:分析T比较均值T单因素分析T因变量选择课程,因子选择性别进行 T输出结果: 表 5-12
描述 poli 均值的95%置信区间
N 均值 标准差 标准误 下限 上限 极小值 极大值 female male
30 30 60 78.8667 76.7667 77.8167 10.41793 18.73901 15.06876 1.90205 3.42126 1.94537 74.9765 69.7694 73.9240 82.7568 83.7639 81.7093 56.00 .00 .00 94.00 96.00 96.00 总数 表 5-13
ANOVA
poli 平方和 组间 组内 66.150 13330.833 df 1 58 均方 66.150 F .288 显著性 .594 229.842 总数 13396.983 59 分析:由表5-12和5-13可以看,出男生和女生成绩平均差为
1.4021在置信区间内sig值为 0.307,大于0.05,故不能拒绝原假设,即认为男生和女生的平均成绩没有显著差异
7、如果将第2章第9题的数据看作是来自总体的样本 ,试分析哪些课程的平均分差异不显 著。
步骤:计算出各科的平均分:转换T计算变量T相关的设置 表 5-14
组统计量
sex N average 均值 67.5208 68.9229 标准差 9.08385 9.85179 均值的标准误 1.65848 1.79868 female male 30 30
重新建立SPSS数据T分析T比较均值T单因素T进行方差齐性检验 T选择Tukey方法进行 检验。 利用配对样本T检验,逐对检验
成对样本检验 成对差分 差分的95%置信 均值的标准 均值 对1 培训前-培 训后 -70.833 标准差 106.041 误 30.611 下限 -138.20 9 区间 上限 -3.458 t -2.314 11 Sig.(双 df 侧) .041 培训前 440 500 580 460 490 480 600 590 430 510 320 470 培训后 620 520 ______ 550 500 440 540 500 0 580 620 590 620 8、以下是对促销人员进行培训前后的促销数据
试分析该培训是否产生了显著效果
原假设:培训前后效果无显著差异
步骤:生成SPSS数据T分析T比较均值T配对样本t检验T相关设置T输出结果 表 5-15
成对样本统计量 均值 对1 N 12 12 标准差 78.098 61.938 均值的标准误 22.545 17.880 培训前 培训后 4.17 560.00
表 5-16
成对样本相关系数 N 对1
相关系数 -.135 Sig. .675 培训前&培训后 12 表 5-17
成对样本检验 成对差分 差分的95%置信 均值的标准 均值 对1 培训前-培 训后 -70.833 标准差 106.041 误 30.611 区间 下限 -138.209 上限 -3.458 t -2.314 df 11 Sig.(双 侧) 0.41 分析:由表5-15 , 5-16,5-17可以看出,培训前与培训后的均值差为 70.83 ,由sig值为 0.041 ,小于0.05 ,故拒绝原假设,认为培训前后有显著差异
即培训产生了显著效果