《医学统计学》计算题答案
《医学统计学》最佳选择题和计算分析题答案
教材:孙振球,徐勇勇主编. 医学统计学. 第4版. 北京:人民卫生出版社,2014
最佳选择题答案
第二章 计量资料的统计描述(第20-21页) (1)D (2)C (3)D (4)D (5)C
(6)E (7)E (8)D (9)E (10)B
第三章 总体均数的估计与假设检验(第43-44页) (1)E (2)C (3)E (4)E (5)B (6)E 第四章 多个样本均数比较的方差分析(第63-64页) (1)D (2)C (3)D (4)A (5)C (6)A 第五章 计数资料的统计描述(第20-21页) (1)B (2)D (3)A (4)A (5)E (6)D
(7)D (8)E (9)D (10)C
(7)A
(7)C (8)E (9)B (10)D
第六章 几种离散型变量的分布及其应用(第94页) (1)A (2) 不要求 (3) 不要求 (4)E (5)不要求 (6)不要求 第七章 c2检验(第112-113页) (1)D (2)C (3)C (4)A
(5)不要求 (6)A (7)不要求
第八章 秩转换的非参数检验(第128页) (1)E (2)D (3)D (4)D (5)A
(6)C
第九章双变量回归与相关(第151-152页) (1)B (2)E (3)C (4)C (5)不要求 (6)D
(7)B (8) 不要求
第十章统计表与统计图(第163-164页) (1)B (2)D (3)B (4)E (5)选项有误 (6)D (7)E (8)D (9)C 注:第(5)题的选项是(箱式图),但5个选项中没有“箱式图”。 第十九章 生存分析(第300页)
(1)A (2) E (3)B (4)D (5)D
第三十四章 观察性研究设计(第544-545页) (1)C (2)C (3)C (4)C (5)D (6)C (7)A (8)D (11)E (12)E (13)B (14)A (15)B
第三十六章 试验研究设计(第582页) (1)D (2)D (3)D (4)E (5)A 第三十七章 临床试验研究设计(第603-604页) (1)C (2)C (3)C (4)D
1
(10)C
(9)D (10)A
(6)D
暨南大学医学院医学统计学教研室
计算分析题参考答案
第二章 计量资料的统计描述
计算分析题(P21)
1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:
(1)描述集中趋势应选择何指标?并计算之。 (2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?
某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果
组段 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~1.7 合计
频数
1 3 9 13 19 25 18 13 9 5 1 116
(1)数据文件
数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
2
暨南大学医学院医学统计学教研室
(2)操作步骤
AnalyzeèDataèWeight Cases;Weight Cases by 频数。
AnalyzeèDescriptivesèDescriptives;将“组中值”选入Variable框中;单击OK。
(3)结果解释
表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L),标准差为0.20(mmol/L);
该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L。计算过程根据公式x±1.96s,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L以下者估计占总人数的3.59%,1.5 mmol/L以下者估计占总人数的95.54%。计算过程:当x=0.8时,u=(0.8-1.16)/0.20= -1.8,查附表1得曲线下面积为0.0359;当x=1.5时,u=(1.5-1.16)/0.20= 1.7,查附表1得曲线下面积为1-0.0446=0.9554。
Descriptive StatisticsN组中值Valid N (listwise)116116Minimum.65Maximum1.65Mean1.1560Std.Deviation.20442 2. 某地微丝蚴血症患者42例治疗后7年,用间接荧光抗体试验测得抗体滴度如下。求平均抗体滴度。
抗体滴度的倒数 例数
10 5
20 12
40 13
80 7
160 5
(1)数据文件
数值变量名:抗体滴度,例数。
(2)操作步骤
AnalyzeèDataèWeight Cases;Weight Cases by例数。 AnalyzeèReportsèCase Summarizes;将“抗体滴度”选入Variable框中,单击Statistics,将Geometric Mean从Statistics框中选入Cell Statistics框。
3
暨南大学医学院医学统计学教研室
(3)结果解释
Case SummariesGeometric Mean抗体滴度36.83 42例微丝幼血症患者治疗后7年平均抗体滴度为1:37。
3.测得某地300名正常人尿汞值,其频数表如下。试计算均数和中位数,何者的代表性较好?并求正常人尿汞值95%的参考值范围。
某地300名正常人尿汞值( mg/L)频数表
组段 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 32~ 36~ 40~ 44~ 48~ 52~ 56~~ 60~ 64~ 68~72~ 合计
例数
49 27 58 50 45 22 16 9 9 4 5 0 3 0 2 0 0 1 300
(1)数据文件
数值变量名:组中值,例数。组中值按2,6,10...66,70输入。
(2)操作步骤
AnalyzeèDataèWeight Cases;Weight Cases by 频数。
表2-2显示该组正常人的尿汞值为明显的偏态分布,因而选用中位数描述平均水平,用百分位数法计算95%参考值范围。由于尿汞值以过高为异常,故求单侧上限95%参考值范围。
AnalyzeèDescriptivesèFriquencies;将“组中值”选入Variable框中;单击Statistics按钮,选择Median,选择Percentitile计算P95,选择“Values are grouped midpoint”,单击Continue;单击OK。
4
暨南大学医学院医学统计学教研室
4.结果解释
该地正常人尿汞值的中位数为13.3g/L,95%参考值范围为0~36.8(g/L)。
Statistics组中值NMedianPercentilesValidMissing95300013.33a36.77ba. Calculated from grouped data.b. Percentiles are calculated from grouped data.
4.(补充题)随机抽取某地110名正常成年男性,测得血清胆固醇(mmol/L) 结果如下。请据此资料:
(1)绘制频数分布图,判断该资料属于何种分布? (2)描述集中趋势应选择何指标?并计算之。 (3)描述离散趋势应选择何指标?并计算之。
(4)求该地正常成年男性血清胆固醇的95%参考值范围。
某地110名正常成年男性血清胆固醇(mmol/L)测量结果 5.25 4.88 4.52 5.46 4.78 5.80 4.52 4.71 4.42 5.75 3.53
5.36 4.29 4.37 5.93 5.07 3.87 4.58 4.50 4.55 3.59 3.64
3.82 5.43 5.17 4.78 4.06 4.29 4.13 6.27 5.33 4.63 5.60
6.45 5.43 5.23 6.08 3.82 4.45 4.63 3.87 4.26 5.82 5.78
4.47 3.79 5.38 3.87 5.20 5.69 5.17 4.47 4.16 5.12 3.02
5.75 3.54 4.29 4.26 4.52 5.54 4.52 4.81 3.22 3.69 4.65
4.52 4.78 5.77 4.73 3.82 6.58 4.03 3.38 5.07 3.90 5.20
5.46 4.47 4.60 2.94 6.08 5.46 6.55 4.37 4.76 5.98 5.30
5.49 3.69 4.91 4.19 4.19 4.19 4.73 4.06 4.91 4.63 3.72
6.03 4.60 4.81 4.99 3.40 4.39 4.76 4.42 4.97 3.80 5.75
(1)数据文件:数值变量X表示血清胆固醇。 (2)操作步骤:AnalyzeèDescriptivesèFriquencies (3)结果解释
频数分布图显示某地110名正常成年男性血清胆固醇(mmol/L)测量结果呈正态分布,故选择均数描述集中趋势,标准差描述离散趋势。样本均数为4.73(mmol/L),标准差为0.80(mmol/L)。该地正常成年男性血清胆固醇的95%参考值范围是(0.77,1.55)mmol/L。计算过程根据公式x±1.96s,即4.73±1.96×0.80。
5
暨南大学医学院医学统计学教研室
Histogram2015Frequency10502.003.004.005.006.007.00Mean = 4.7292Std. Dev. = 0.80073N = 110血清胆固醇(mmol/L) StatisticsxNMeanStd. DeviationValidMissing11004.7292.80073
5.(补充题)随机抽取某地109名正常成年女性(18~50岁),测得血清铁蛋白 (ng/ml)结果如下。请据此资料:
(1)绘制频数分布图,判断该资料属于何种分布? (2)描述集中趋势应选择何指标?并计算之。 (3)描述离散趋势应选择何指标?并计算之。
(4)求该地正常成年女性(18~50岁)血清铁蛋白的95%参考值范围。
某地109名正常成年女性(18~50岁)血清铁蛋白 (ng/ml)测量结果 4.4 5.3 6.3 7.5 8.0 8.5 9.0 9.0 10.5 11.3
12.0 12.5 12.6 13.0 13.2 14.0 14.7 15.0 15.3 15.8
16.5 16.5 17.0 17.2 17.5 18.0 18.0 18.4 18.5 18.5
18.5 18.5 18.5 19.0 19.0 20.0 21.5 22.0 23.0 23.0
23.0 23.0 24.0 24.0 24.0 25.0 25.0 25.5 27.0 28.0
28.5 29.0 30.0 30.0 31.0 31.5 31.5 32.0 32.0 33.0
33.0 33.0 34.0 34.4 36.0 37.5 38.0 39.0 40.0 40.0
42.0 42.0 42.0 42.0 43.0 44.0 44.0 44.0 44.0 46.0
46.0 47.0 47.0 50.0 50.0 50.0 50.0 50.0 52.0 53.0
53.5 54.0 56.0 60.0 60.0 68.0 72.0 77.5 78.0 80.0
88.0 92.0 95.5 98.5 101.0 120.0 148.0 152.0 160.0
6
暨南大学医学院医学统计学教研室
(1)数据文件:数值变量X表示血清铁蛋白。 (2)操作步骤:AnalyzeèDescriptivesèFriquencies
(3)结果解释:频数分布图显示109名正常成年女性(18~50岁)血清铁蛋白 (ng/ml)测量结果呈明显偏态分布,故选择中位数描述集中趋势,四分位数间距描述离散趋势,用百分位数法计算95%参考值范围。中位数为4.73(mmol/L);第25百分位数和第75百分位数分别为18.2(ng/ml)和47.0(ng/ml),四分位数间距为28.8 (ng/ml);该地正常成年女性(18~50岁)血清铁蛋白的95%参考值范围是(6.05,149.0)ng/ml。
StatisticsxNPercentilesValidMissing2.525507597.510906.05018.20031.00047.000149.000
3025Frequency201510500.050.0100.0150.0200.0血清铁蛋白 (ng/ml)
7
暨南大学医学院医学统计学教研室
第三章 总体均数的估计与假设检验
计算分析题(P45)
1.某地随机抽样调查了部分健康成人的红细胞数和血红蛋白含量,结果如下表:
2010年某地健康成年人的红细胞数和血红蛋白含量
指标
红细胞数(×1012/L)
血红蛋白(g/L)
性别 男 女 男 女
例数 360 255 360 255
均数 标准差
0.58 4.66
4.18 0.29 134.5 7.1 117.6 10.2
标准值*
4.84 4.33 140.2 124.7
*《实用内科学》(1976年)所载均数(转为法定计量单位)
请就上表资料:
(1)说明女性的红细胞数与血红蛋白的变异程度何者为大? (2)计算男性两项指标的抽样误差。
(3)试估计该地健康成年女性红细胞数的均数。 (4)该地健康成年男、女血红蛋白含量是否不同?
(5)该地男性两项血液指标是否均低于上表的标准值(若测定方法相同)?
参考答案如下:
(1)女性红细胞数和血红蛋白的变异系数分别为6.94%和8.67%,故血红蛋白比红细胞数的变异程度大。
(2)男性两项指标的抽样误差分别为:红细胞数的标准误为0.031(1012/L);血红蛋白的标准误为0.374(g/L)。
(3)已知健康成人的红细胞数服从正态分布,而且例数较大为255,故采用正态近似法计算其总体均数的95%可信区间。该地健康成年女性红细胞数总体均数的95%可信区间为(4.14, 4.22)(1012/L)。
(4)两样本t检验结果显示:该地健康成年男、女血红蛋白含量不同(t=24.23, P<0.0005)。 (5)单样本t检验结果显示:该地男性红细胞数(t= 5.89, P < 0.0005)和血红蛋白含量(t =15.23, P < 0.0005)均低于标准值。
2. 一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg,标准差为2.22mg。试估计该批药剂有效成分的平均含量。
参考答案:该批药剂有效成分平均含量的95%可信区间为(101.41, 104.59)mg。
3.通过以往大量资料得知某地20岁男子平均身高为1.68cm,今随机抽得当地16名20岁男子,算得其平均身高为1.72m,标准差为0.14m。问当地现在20岁男子是否比以往高?
参考答案:
单样本t检验结果显示:尚不能认为该地20岁男子身高比以往高(t =1.14, P > 0.20)。
4. 为了解DSCT冠状动脉造影和超声心动图检查两种方法测定心脏病患者左室舒张末容积(EDV,ml)的差别,某医院收集心脏病患者12例,同时分别用两种检测方法测得其
8
暨南大学医学院医学统计学教研室
EDV的大小如下表所示。问两种检测方法的检测结果是否不同?
编号 1 2 3 4 5 6 7 8 9 10 11 12
DSCT检查 137.6 133.2 136.4 125.9 126.5 130.4 133.2 134.1 128.4 135.6 129.2 130.2
超声心动图检查
80.5 77.8 76.3 74.5 80.2 78.8 81.2 79.7 89.0 88.4 90.1 86.2
(1)数据文件
数值变量:编号,DSCT,超声心动图。 (2)SPSS操作步骤
AnalyzeèCompare Meansè Paired Samples t test (3)结果解释
Paired Samples StatisticsMean131.72581.892N1212Std.Deviation3.86275.2320Std. ErrorMean1.11511.5103Pair1DSCT超声心动图 Paired Samples TestPaired Differences95% ConfidenceInterval of theDifferenceLowerUpper45.559054.1077Pair 1DSCT - 超声心动图Mean49.8333Std.Deviation6.7273Std. ErrorMean1.9420t25.661df11Sig. (2-tailed).000 配对t检验结果显示两种检测方法的检测结果不同(t =25.66, P = 0.000),DSCT检查结果的EDV值高于超声心动图检查,均数的差值为49.8(95% CI:45.6, 54.1)ml。
5. 为了解某一新降血压药物的效果,将28名高血压患者随机等分到试验组和对照组,试验组采用新降压药,对照组采用标准药物治疗,测得治疗前后舒张压(mmHg)的差值(前-后)如下表。问:新药和标准药的疗效是否不同?
两种药物治疗前后的舒张压(mmHg)之差 新药 标准药
9
12 -2 10 9 7 10 8 5 4 0 5 -2 16 10
32 -8 11 4 13 1 4 2 8 -3 14 4 14 5
暨南大学医学院医学统计学教研室
(1)数据文件
数值变量Group表示分组(1:新药;2:标准药),BP表示舒张压差值。 (2)SPSS操作步骤
AnalyzeèCompare MeansèIndependent Samples t test (3)结果解释
Independent Samples TestLevene's Test forEquality of Variancest-test for Equality of Means95% ConfidenceInterval of theDifferenceLowerUpper3.9233.90313.64813.668FBPEqual variancesassumedEqual variancesnot assumed.117Sig..735t3.7143.714df2623.983Sig. (2-tailed).001.001MeanDifference8.7868.786Std. ErrorDifference2.3652.365 两样本t检验结果显示:新药和标准药疗效的差别有统计学意义(t = 3.71, P = 0.001),两药舒张压均数的差值为8.8(95% CI:3.9~13.6)mmHg。
6. 某营养师观察补充复合微量营养素6个月改善儿童体质状况的效果, 将85名8~11岁健康儿童随机分为试验组(服用复合微量营养素咀嚼片)和对照组(服用与复合微量营养素咀嚼片外形完全相同的安慰剂)。在补充前/后分别对两组儿童的仰卧起坐成绩进行观察,算得两组儿童的平均仰卧起坐成绩提高值如下表。问试验组和对照组儿童的平均仰卧起坐成绩提高值是否不同?
两组儿童平均仰卧起坐成绩提高值(次/分)
分组 试验组 对照组
例数 47 38
平均仰卧起坐成绩提高值
7.1 4.9
标准差 4.7 2.8
试验组和对照组儿童仰卧起坐成绩提高值的标准差相差较大,其方差的比值为2.82。方差齐性检验结果显示两总体方差不等。Scatterthwaite近似t检验结果显示:试验组和对照组儿童的平均仰卧起坐成绩提高值不同(t′ =2.54, P < 0.05)。
7. 将钩端螺旋体病人的血清随机分为两组,分别用标准株作凝溶试验,测得稀释倍数如下表,问两组的平均效价是否不同?
钩端螺旋体病患者血清作凝溶试验测得的稀释倍数 标准株(11人) 100 200 400 400 400 400 800 1600 1600 1600 3200
水生株(9人) 100 100 100 200 200 200 200 400 400
(1)数据文件
数值变量Group表示分组(1:标准株;2:水生株),x表示稀释倍数。
由于稀释倍数资料明显服从偏态分布,故将原始数据进行对数变换,然后进行两样本t检验。
10
暨南大学医学院医学统计学教研室
(2)SPSS操作步骤
AnalyzeèCompare MeansèIndependent Samples t test
(3)结果解释
Independent Samples TestLevene's Test forEquality of Variancest-test for Equality of Means95% ConfidenceInterval of theDifferenceLowerUpper.17511.19197.87698.86011FlgxEqual variancesassumedEqual variancesnot assumed5.063Sig..037t3.1493.345df1815.585Sig. (2-tailed).006.004MeanDifference.52604.52604Std. ErrorDifference.16704.15725 对原始数据取对数后,两总体方差仍然不等(F =5.06,P = 0.037),故采用Scatterthwaite近似t检验。结果显示标准株的平均效价高于水生株(t′ =3.35, P = 0.004)。
8. 某医师观察某新药治疗肺炎的疗效,将肺炎病人随机分为新药组和旧药组,得两组的退热天数如下表。
表3-4 新旧两药的退热天数
分组 新药 旧药
例数 35 37
平均退热天数
3.8 5.2
退热天数的标准差
0.8 0.9
(1)请计算两药平均退热天数之差的95%CI?
(2)请对两药平均退热天数是否不同进行假设检验。 (3)上述两种方法有何联系? 参考答案如下:
(1)两药平均退热天数之差总体均数的95%可信区间为(1.0, 1.8)天。
(2)两样本t检验结果显示:新药和旧药的平均退热天数不同(t = 6.96, P < 0.001),新药平均退热天数(3.8天)比旧药(5.2天)短。
(3)上述两种方法的联系在于:都可得到新药和旧药平均退热天数不同的结论,即可信区间也可回答假设检验的问题,因上述可信区间(1.0, 1.8)天没有包含0(即H0:m1-m2=0)。
11
暨南大学医学院医学统计学教研室
9. 为比较治疗组和对照组肺表面活性物质PaO2在治疗新生儿呼吸窘迫综合症患儿过程中的作用是否不同,某医生得到30名患儿治疗后48小时资料如下表。问治疗后48小时,两组的PaO2是否不同?
表3-5 两组患儿PaO2(kPa)比较
分组 治疗组 对照组
例数 15 15
均数 12.55 9.72
标准差 0.33 2.03
两组患儿PaO2的标准差相差较大,其方差的比值为37.8。方差齐性检验结果显示两总体方差不等。Scatterthwaite近似t检验结果显示:治疗后48小时两组的PaO2不同(t′ =5.33, P < 0.001)。
第四章 多个样本均数比较的方差分析
计算分析题(P64)
1.研究动物被随机分成三个组来比较对三种不同刺激的反应时间(秒),问动物在三种不同刺激下的反应时间是否有差别?
刺激I 刺激II 刺激III
16 6 8
14 7 10
14 7 9
13 8 10
13 4 6
12 8 7
12 9 10
17 6 9
17 8 11
17 6 11
19 4 9
14 9 10
15 5 9
20 5 5
(1)数据文件
数值变量:Group表示分组变量(1:刺激I;2:刺激II;3:刺激III),time表示反应时间。
(2)SPSS操作步骤
AnalyzeèCompare MeansèOne-way ANOVA (3)结果解释
三种刺激反应时间的均数(秒)依次为:15.2(刺激I), 8.7(刺激III)和6.6(刺激I)。完全随机设计资料的方差分析结果显示:三种刺激反应时间的均数不同(F = 67.81,P= 0.000)。用SNK法进行多个样本均数间的多重比较,结果显示三种刺激反应时间均数两两间都有差别(P < 0.05)。
Test of Homogeneity of VariancestimeLeveneStatistic2.053df12df239Sig..142 ANOVAtimeSum ofSquares561.571161.500723.071df23941Mean Square280.7864.141F67.806Sig..000Between GroupsWithin GroupsTotal 12 暨南大学医学院医学统计学教研室
timeStudent-Newman-KeulsaSubset for alpha = .05GroupN123刺激Ⅱ146.57刺激Ⅲ148.86刺激Ⅰ1415.21Sig.1.0001.0001.000Means for groups in homogeneous subsets are displayed.a. Uses Harmonic Mean Sample Size = 14.000. 2. 为研究药的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A、B、C和对照组,分别接受不同的处理。A、B、C三个实验组分别注射0.5、1.0和1.5ml 30%的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见下表。问不同剂量药物注射液的抑癌作用有无差别?
表4-2 某药物对小白鼠抑癌作用实验结果 对照组 3.6 4.5 4.2 4.4 3.7 5.6 7.0 4.1 5.0 4.5
A 3.0 2.3 2.4 1.1 4.0 3.7 2.8 1.9 2.6 1.3
实验组 B 0.4 1.8 2.1 4.5 3.6 1.3 3.2 2.1 2.6 2.3
C 3.3 1.2 1.3 2.5 3.1 3.2 0.6 1.4 1.3 2.1
(1)数据文件
数值变量:分组(1:对照组A;2:实验组B;3:实验组C;4:实验组D),肿瘤重量。
(2)SPSS操作步骤
AnalyzeèCompare MeansèOne-way ANOVA
(3)结果解释
4个不同剂量药物注射液小白鼠肿瘤重量的均数是:对照组4.66(g),A组2.51(g),B组2.39(g)和C组2.00(g);完全随机设计的方差分析结果显示:4个不同剂量药物注射液的抑癌作用有差别(F=13.70, P=0.000);用Dunnet-t法进行多个实验组与一个对照组均数差别的多重比较,结果显示3个不同剂量药物注射液与对照组的小白鼠肿瘤重量有差别,即3个不同剂量药物注射液都有抑癌作用(P值均小于0.001)。
13
暨南大学医学院医学统计学教研室
Test of Homogeneity of Variances肿瘤重量LeveneStatistic.178df13df236Sig..910 ANOVA肿瘤重量Between GroupsWithin GroupsTotalSum ofSquares43.19437.84281.036df33639Mean Square14.3981.051F13.697Sig..000 Multiple ComparisonsDependent Variable: 肿瘤重量MeanDifference(I-J)-2.1500*-2.2700*-2.6600*Dunnett t (2-sided)a(I) 分组实验组A实验组B实验组C(J) 分组对照组对照组对照组Std. Error.4585.4585.4585Sig..000.000.00095% Confidence IntervalLower BoundUpper Bound-3.274-1.026-3.394-1.146-3.784-1.536*. The mean difference is significant at the .05 level.a. Dunnett t-tests treat one group as a control, and compare all other groups against it. 3. 为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?
(1)数据文件
数值变量:种系(1:A;2:B;3:C;4:D),剂量(1:0.25;2:0.50;3:0.75),子宫重量。
(2)SPSS操作步骤
AnalyzeèGeneral Linear ModelèUnivariate
表4-3 大白鼠注射不同剂量雌激素后的子宫重量(g)
大白鼠种系
A B C D
雌激素剂量(mg/100g) 0.25 0.50 0.75 108 46 70 43
112 64 96 65
142 116 134 98
(3)结果解释
大白鼠注射0.25、0.50和0.75不同剂量(mg/100g)雌激素后的子宫重量均数依次为:66.75(g)、84.25(g)和122.50(g)。随机区组设计的方差分析结果显示:不同剂量雌激素
14
暨南大学医学院医学统计学教研室
对大白鼠的子宫重量有影响(F=44.87, P=0.000);多重比较的SNK检验结果显示:3个剂量组子宫重量均数两两之间的差异均有统计学意义(P<0.05)。大白鼠子宫重量均数随雌激素剂量的增加而增加,呈剂量反应关系。
Tests of Between-Subjects EffectsDependent Variable: 子宫重量Type III Sumof SquaresSourceInterceptHypothesis99736.333Error5115.667剂量Hypothesis6503.167Error434.833种系Hypothesis5115.667Error434.833a. MS(种系)b. MS(Error)df132636Mean Square99736.3331705.222a3251.58372.472b1705.22272.472bF58.48944.86723.529Sig..005.000.001 子宫重量Student-Newman-Keulsa,b剂量0.250.500.75Sig.N444166.75Subset284.253122.501.0001.0001.000Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 72.472.a. Uses Harmonic Mean Sample Size = 4.000.b. Alpha = .05. 4. 某医院在新洁尔灭器械消毒液以工业亚硝酸钠为防腐剂的抑菌实验中,观察了五种含不同品种防腐剂的新洁尔灭溶液的抑菌效果,第20天抑菌实验结果(抑菌圈直径,mm)如下表。问五种溶液的抑菌效果有无差别?四种细菌被抑制的效果有无差别?
表4-4 五种溶液的抑菌效果(抑菌圈直径,mm)比较的实验结果
细菌种类 大肠杆菌 铜绿假单胞菌 金黄色葡萄球菌 痢疾杆菌
A 14 11 26 20
B 16 12 29 17
C 15 14 25 18
D 17 11 30 13
E 12 9 21 16
(1)数据文件
数值变量:抑菌圈直径,防腐剂种类(1:A;2:B;3:C;4:D;5:E),细菌种类(1:大肠杆菌;2:铜绿假单胞菌;3:金黄色葡萄球菌;4:痢疾杆菌)。
(2)SPSS操作步骤
AnalyzeèGeneral Linear ModelèUnivariate
15
暨南大学医学院医学统计学教研室
(3)结果解释
随机区组设计的方差分析结果显示:五种溶液抑菌效果的差别无统计学意义(F=1.88, P=0.179),但四种细菌被抑制的效果有差别(F=37.14, P=0.000)。抑菌圈的平均直径(mm)最大为金黄色葡萄球菌(26.2),其次为痢疾杆菌(16.8)和大肠杆菌(14.8),最小为铜绿假单胞菌(11.4)。
Tests of Between-Subjects EffectsDependent Variable: 抑菌圈直径Type III Sumof SquaresSourcedfMean SquareCorrected Model643.300a791.900Intercept5985.80015985.800防腐剂种类40.700410.175细菌种类602.6003200.867Error64.900125.408Total6694.00020Corrected Total708.20019a. R Squared = .908 (Adjusted R Squared = .855)F16.9921106.7731.88137.140Sig..000.000.179.000 16
暨南大学医学院医学统计学教研室
抑菌圈直径Student-Newman-Keulsa,bSubset214.8016.8026.201.000细菌种类铜绿假单胞菌大肠杆菌痢疾杆菌金黄色葡萄球菌Sig.N5555111.4031.000.199Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 5.408.a. Uses Harmonic Mean Sample Size = 5.000.b. Alpha = .05. 5. 某研究者为研究5种防护服对人脉搏的影响,有5 人在不同的5天中穿着防护服测定脉搏数,结果见下表。试分析5种防护服对脉搏数有无不同作用(甲、乙、丙、丁、戊代表5个受试者,A、B、C、D、E表示5套不同的防护服)。
表4-5 不同日期5个受试者穿5中不同防护服的脉搏次数(次/分) 试验日期
1 2 3 4 5
受试者
甲 A(129.8) B(144.4) C(143.0) D(133.4) E(142.8)
乙 B(116.2) C(119.2) D(118.0) E(110.8) A(110.6)
丙 C(114.8) D(113.2) E(115.8) A(114.0) B(105.8)
丁 D(104.0) E(132.8) A(123.0) B(98.0) C(120.0)
戊 E(100.6) A(115.2) B(103.8) C(110.0) D(109.8)
(1)数据文件
数值变量:试验日期(1,2,3,4,5),受试者(1:甲;2:乙;3:丙;4:丁;5:戊),防护服(1:A;2:B;3:C;4:D;5:E)。
(2)SPSS操作步骤
AnalyzeèGeneral Linear ModelèUnivariate
17
暨南大学医学院医学统计学教研室
(3)结果解释
拉丁方设计的方差分析结果显示:不同防护服对脉搏影响的差异无统计学意义(F=1.24, P=0.344),试验日期对脉搏影响的差异也无统计学意义(F=2.90, P=0.068),仅受试者间的脉搏次数有差别(F=16.27, P=0.000)。
防护服Dependent Variable: 脉搏次数95% Confidence IntervalLower BoundUpper Bound112.068124.972107.188120.092115.068127.972109.228122.132114.108127.012防护服ABCDEMean118.520113.640121.520115.680120.560Std. Error2.9612.9612.9612.9612.961 Tests of Between-Subjects EffectsDependent Variable: 脉搏次数Type III SumSourceof SquaresdfMean SquareaCorrected Model3579.77312298.314Intercept348005.6061348005.606试验日期508.0744127.018受试者2853.6744713.418防护服218.026454.506Error526.1411243.845Total352111.52025Corrected Total4105.91424a. R Squared = .872 (Adjusted R Squared = .744)F6.8047937.1672.89716.2711.243Sig..001.000.068.000.344 6. 在儿童哮喘病治疗中,采用双盲、交叉试验法,将12个患者随机分成两组,分别在两个时期中按次序A、B和B、A服用两种药物,服药后5小时测PEF值。单位为L/min,数据见下表。试对交叉试验的结果进行方差分析。
表4-6 两阶段交叉设计试验结果
患者
1 2 3 4 5 6 7 8 9 10 11 12
18
时期1 A(310) A(310) A(370) A(410) A(250) A(380) B(370) B(310) B(380) B(290) B(260) B(290) 时期2 B(270) B(260) B(300) B(390) B(210) B(350) A(385) A(400) A(410) A(320) A(340) A(220)
暨南大学医学院医学统计学教研室
(1)数据文件
数值变量:患者,时期,药物(1:A药;2:B药),PEF值。 (2)SPSS操作步骤
AnalyzeèGeneral Linear ModelèUnivariate
(3)结果解释
两阶段交叉设计的方差分析结果显示:A药和B药的PEF值均数分别为342(L/min)和307(L/min),差异有统计学意义(F=8.45, P=0.016)。
Tests of Between-Subjects EffectsDependent Variable: PEF值Type III SumSourceof SquaresdfMean SquareaCorrected Model75063.542135774.119Intercept2525259.37512525259.375患者67303.125116118.466时期234.3751234.375药物7526.04217526.042Error8902.08310890.208Total2609225.00024Corrected Total83965.62523a. R Squared = .894 (Adjusted R Squared = .756)F6.4862836.7066.873.2638.454Sig..003.000.002.619.016 药物Dependent Variable: PEF值药物A药B药Mean342.083306.667Std. Error8.6138.61395% Confidence IntervalLower BoundUpper Bound322.892361.274287.476325.858 19
暨南大学医学院医学统计学教研室
第五章 计数资料的统计描述
计算分析题(P77)
1. 某单位于1993年对所有1191名职工进行冠心病普查,结果按年龄、职业分组统计如下表。作者认为:该单位干部、工人的冠心病发病率均随年龄增加而下降,发病率高峰都在40~组,这与其他资料的结果不符。你同意上述分析吗?说明理由。
不同职业的各年龄(岁)组冠心病发病率比较
职业 干部 工人 合计
40~ 病人数 21 12 33
% 60.0 70.6 63.5
50~
% 25.7 23.5 25.0 9 4 13
5 1 6 60~70 病人数
% 14.3 5.9 11.5
病人数
合计 35 17 52
答:将构成比误当作率进行分析。此作者普查的结果只有冠心病人的年龄构成,只能说明干部和工人的冠心病患者中40~50岁组占的比例高。而要说明冠心病发病率与年龄的关系,必须知道各年龄段的职工数以及1993年当年新发病例数,而表格中未提供此方面的数据,所以不能得出该单位干部、工人的冠心病发病率均随年龄增加而下降,发病率高峰都在40~50岁组的结论。
2. 根据下表资料完成表中指标的计算并回答问题。
某年某地区按人口年龄分组的某疾病资料 年龄 0~ 20~ 40~ 60~
人口数 患者数 82920 36639 28161 9370
488 451 273 110 1322
新发病例数
170 152 133 46 501
死亡数
9 17 22 25 73
死亡百分患病率 发病率 死亡率 病死率 比(%) (‰) (‰) (‰) (%)
12.33 23.29 30.14 34.24 100.00
5.89 12.31 9.69 11.74 8.42
2.05 4.15 4.72 4.91 3.19
0.11 0.46 0.78 2.67 0.46
1.84 3.77 8.06 22.73 5.52
合计 157090
(1)患者以0~岁组为最多,占36.91%。
(2)患病率以20~岁组为最高,达到12.31‰。 (3)发病率以60~岁组为最高,达到4.91‰。 (4)死亡率以60~岁组为最高,达到2.67‰。 (5)病死率以60~岁组为最高,达到22.73%。
3. 某医院研究枸橼酸乙胺嗪与酒石酸锑钾对丝虫病的疗效,对81例不合并其他寄生虫病的丝虫病患者采用枸橼酸乙胺嗪治疗,对120例合并血吸虫病得丝虫病患者用酒石酸锑钾治疗,结果如下表。据此表,作者认为,枸橼酸乙胺嗪疗效比酒石酸锑钾好,你怎么评价?
枸橼酸乙胺嗪与酒石酸锑钾治疗丝虫病的疗效比较
药物 枸橼酸乙胺嗪 酒石酸锑钾
20
病例数 81 120 治愈例数 52 25 治愈率% 64.2 20.8
暨南大学医学院医学统计学教研室
本题的错误是:①枸橼酸乙胺嗪组与酒石酸锑钾组两组不具备可比性。要比较两种治疗方法治疗丝虫病的效果,两组病人均不能合并血吸虫病,使他们具有可比性;②所比较的两组均是样本治疗率,要想评价两组治疗好坏,应该在有可比性的情况下做假设检验。
4. 试就下表资料分析比较某年某省城乡女性原发性骨质疏松症患病率。
某年某省城乡女性原发性骨质疏松症患病率的比较 年龄组(岁) 50~ 60~ 70~
80及以上 合计
城市
调查人数 患病人数 患病率(%)
354 78 22.0 251 125 49.8
90 69.2 130
41 29 71.7
776
322
41.5
农村
调查人数 患病人数 患病率(%)
241 49 20.3 315 136 43.2 175 110 62.8 58 40 69.0
789
335
42.5
比较城市与农村女性原发性骨质疏松症患病率,由于城市与农村的年龄别人口构成不同,所以计算标准化患病率。本题以两者合并人口的年龄构成为标准化人口。女性原发性骨质疏松症患病率:标化前农村为42.5%,城市为41.5%;而标化后农村为39.9%,城市为44.4%。
该资料显然来自抽样调查,需要对两样本标化率进行假设检验后才能比较。
该资料更合适用四格表资料的卡方检验,分别比较4个年龄组城乡患病率是否有差别。
第六章 几种离散型变量的分布及其应用
计算分析题(P94)
1. 已知某种常规药物治疗某种非传染性疾病的有效率为0.70,今改用一种新药治疗该疾病患者10人,发现9人有效。问新药的疗效是否优于常规药物?
解:用直接计算概率法进行样本率与总体率的比较,得单侧概率P=0.149。故尚不能认为新方法的疗效优于常规治疗。
2. 一项研究表明,15岁女孩青春痘的发生率为0.60.现在某中学的初中班上对15岁的女生以其学号为抽样框,随机抽取了10人,发现9人长有青春痘。问该班15岁女生青春痘的发生率与同龄女孩青春痘的发生率是否不同?
解:显然,这是双侧检验的问题。记15岁女生青春痘的发生率为p,其检验假设为 H0:p=0.60 H1:p¹0.60 a=0.05
本例n=10,按p=0.60,实际样本阳性数X=9(包括X=0,1,2,3,…,10)出现的概率可用SPSS的Compute过程直接得出:
P(X=9)=0.040311
P è CDF.BINOM(x, 10, 0.60) - CDF.BINOM(x - 1, 10, 0.60)
比实际样本更背离无效假设的事件,即满足P(X= i)小于或等于0.040311的i(i=9)分别有:0,1,2,10。
因此,所要计算的双侧检验概率P值为
21
暨南大学医学院医学统计学教研室
P= P(X=9)+ P(X=0)+ P(X=1)+ P(X=2)+ P(X=10)
=0.040311+0.000104858+0.001572864+0.010617+0.006046618=0.058652 按a=0.05水准,不拒绝H0,尚不能认为该班15岁女生青春痘的发生率与同龄女孩青春痘的发生率不同。
(该资料的数据不难获得。如果样本例数足够多,则可用正态近似法,计算简单且结论可靠。)
3. 一课题组对某职业人群的艾滋病知识知晓率情况进行基线调查,发现其知晓率为60%。课题组采取整群抽样方法对120名该职业人员开展艾滋病知识的同伴教育活动,活动结束后按事先的设计进行了相应知识的问卷调查,发现有96人回答正确。问这种同伴教育活动是否能提高该人群艾滋病知识的知晓率?
解:记同伴教育活动后的艾滋病知识知晓率为p,而p0=0.60。其检验假设为: H0:p=0.60
H1:p¹0.60(一般情况下,选用双侧检验) a=0.05
本例n=120,p=96/120=0.80,代入公式得:
u=
p-p00.80-0.60
==4.47
p0(1-p0)/n0.60(1-0.60)/120
查u界值表(t界值表中n为∞的一行)u0.001/ 2 = 3.29,得P<0.001。按a=0.05水准,拒
绝H0,认为这种同伴教育活动可以提高该人群艾滋病知识的知晓率。
4. 在对45~50岁男性人群胃癌的发病情况研究中,某医师在甲、乙两个地区进行了调查。甲地区调查了8000人,胃癌患者有42人;乙地区调查了7600人,胃癌患者25人。问乙地区45~50岁男性人群胃癌的发病率(应该是患病率)是否低于甲地区?
解:经c2检验(用SPSS计算),尚不能认为两地45~50岁男性人群胃癌的发病率有差别(c2=3.50,P=0.061)。该题如果用单侧检验,则用Fisher确切概率法,单侧P=0.040,认为两地45~50岁男性人群胃癌的发病率有差别。
6. 按国家规定平均每毫升饮用水的细菌总数不得超过100个,现从某水源随机抽取2ml水,测得细菌230个。问该水源是否符合饮用水的条件?
解:该水源的细菌发生数可以认为服从Poisson分布。若此水源2ml的细菌发生数没有超过200个,即可认为它是符合饮用水的条件。用正态近似法进行样本均数与总体均数的比
22
暨南大学医学院医学统计学教研室
较,得u=2.12,大于u0.05 / 2=1.96,故P值小于0.05,可认为该水源不符合饮用水的条件。
u=
230-200
=2.12
200
第七章 c2检验
计算分析题(P113)
1. 为研究特发性血小板减少性紫癜(ITP)与幽门螺旋杆菌(HP)感染间的关系,某医院收集特发性血小板减少性紫癜患儿134例,其中急性ITP患者74例,HP感染率为40.54%;慢性ITP患者60例,HP感染率为65.00%。问两类ITP患者的HP感染率有无差别?
解: c2检验结果显示:两类ITP患者的HP感染率有差别(c2=7.94,P=0.005),即急性ITP患者HP感染率(40.5%)低于慢性ITP患者(65.0%)。
Chi-Square TestsValue7.936b6.9878.0297.877134df1111Asymp. Sig.(2-sided).005.008.005.005Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.006.004a. Computed only for a 2x2 tableb. 0 cells (.0%) have expected count less than 5. The minimum expected count is 29.10. 2. 121名前列腺癌患者中,82名接受电切术治疗,术后有并发症者8人;69名接受开放手术治疗,术后有并发症者2人。试分析两种手术的并发症发生率有无差别? 解:c2检验结果显示:两种手术并发症发生率的差异无统计学意义(c2=1.85,P=0.174)。
Chi-Square TestsValue2.849b1.8483.0822.831151df1111Asymp. Sig.(2-sided).091.174.079.092Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.111.085a. Computed only for a 2x2 tableb. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.57. 3. 某医院皮肤科欲比较紫外线和抗病毒药物治疗带状疱疹的疗效,按随机化原则将带状疱疹患者随机分为两组,临床观察结果见下表。问两组的总体有效率有无差别?
紫外线和抗病毒药物治疗带状疱疹的疗效比较
组别 紫外线组 抗病毒药物组 合计
有效 55 31 86
无效
9 25
34
23
合计
64 56 120
有效率(%)
85.94 56.36
71.67
暨南大学医学院医学统计学教研室
解:c2检验结果显示:两组的总体有效率有差别(c2=13.76,P<0.001),即紫外线组的有效率(85.9%)高于抗病毒药物组(55.4%)。
Chi-Square TestsValue13.755b12.29014.08913.640120df1111Asymp. Sig.(2-sided).000.000.000.000Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.000.000a. Computed only for a 2x2 tableb. 0 cells (.0%) have expected count less than 5. The minimum expected count is 15.87.
4. 某医师欲观察超短波、温热磁和蜡疗三种疗法治疗肩周炎的疗效,按随机化原则将1072例肩周炎患者分为3组,治疗结果见下表,问三种疗法的总体有效率有无差别?
三种疗法治疗肩周炎的疗效比较
疗法 超短波组 温热磁组 蜡疗组 合计
有效 357 229 386 972
无效
48 32 20 100
合计 405 261 406 1072
有效率(%)
88.14 87.74 95.07
90.67
解:c2检验结果显示:三种疗法的总体有效率有差别(c2=15.01,P=0.001)。进行三种疗法间的两两比较,将检验水准调整为a¢=0.0125(将检验水准0.05除以4,因总共进行了4次假设检验,即进行了1次总的是否有差别,3次两两之间是否有差别)。按a¢=0.0125检验水准,蜡疗组的有效率高于超短波组(c2=12.66,P=0.000)和温热磁组(c2=11.89,P=0.001),超短波组与温热磁组的有效率差异无统计学意义(c2=0.025,P=0.874)。
Chi-Square TestsValue15.005a16.32911.4951072df221Asymp. Sig.(2-sided).001.000.001Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 24.35. 24
暨南大学医学院医学统计学教研室
用Select Cases选择需要比较的两个组
5. 某省观察三个地区的花生污染黄曲霉素B1的情况见下表。问三个地区花生的黄曲霉素B1的污染率均有差别吗?
某省三个地区的花生污染黄曲霉素B1的污染率
地区 甲 乙 丙 合计
未污染
6 30 8
44
污染
23 14 3
40
合计
29 44 11
84
污染率(%)
79.3 31.8 27.3
47.6
解:c2检验结果显示:三个地区的花生污染黄曲霉素B1污染率有差别(c2=17.91, P<0.001)。
Chi-Square TestsValue17.907a18.75514.31584df221Asymp. Sig.(2-sided).000.000.000Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 5.24. 6. 某研究者检测脑梗死组与对照组血清中Apo(a)表型的分布,结果见下表。问病例与对照两组血清中Apo(a)表型的构成比有无不同?
脑梗死组与对照组血清中Apo(a)表型的分布 分组 病例组 对照组 合计
25
S1 12 6 18
S2 9 12 21
S1+ S2
8 4 12
S3 21 27 48
S4 14 20 34
Null 4 8 12
合计 68 77 145
暨南大学医学院医学统计学教研室
解:c2检验结果显示:还不能认为病例组与对照组血清中Apo(a)表型的构成比不同 (c2=6.37,P=0.272)。
Chi-Square TestsValue6.370a6.4453.385145df551Asymp. Sig.(2-sided).272.265.066Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 5.63.
7. 某实验室分别用PCR法和痰培养法检测耐甲氧西林葡萄球菌,结果见下表。问两种方法的检测结果有无差别?
PCR法和痰培养法检测耐甲氧西林葡萄球菌的检测结果
PCR法 + - 合计
痰培养法 + 14 2 16
- 7 52 59
合计 21 54 75
解:配对四格表资料的c2检验结果显示:还不能认为两种方法的检出率不同(P=0.180)。
PCR法 * 痰培养法 Crosstabulation痰培养法阳性阴性14766.7%33.3%87.5%11.9%2523.7%96.3%12.5%88.1%165921.3%78.7%100.0%100.0%Total21100.0%28.0%54100.0%72.0%75100.0%100.0%PCR法阳性阴性TotalCount% within PCR法% within 痰培养法Count% within PCR法% within 痰培养法Count% within PCR法% within 痰培养法 Chi-Square TestsValueMcNemar TestN of Valid Cases75Exact Sig.(2-sided).180aa. Binomial distribution used.
26
暨南大学医学院医学统计学教研室
8. 某研究者将PD型乳腺癌患者按不同首发症状分为两组,观察其腋窝淋巴结转移情况见下表。问两种乳腺癌患者腋窝淋巴结转移率有无不同?
两组PD型乳腺癌患者腋窝淋巴结转移率的比较
组别 乳头病变 乳腺肿块 合计
腋窝淋巴结转移 + -
3
5 8
8 6 14
合计 11 11 22
解:Fisher确切概率法检验结果显示:两组乳腺癌患者腋窝淋巴结转移率的差异无统计学意义(P=0.659)。
Chi-Square TestsValue.786b.196.792.75022df1111Asymp. Sig.(2-sided).375.658.373.386Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.659.330a. Computed only for a 2x2 tableb. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.00.
9. 某医院内科血液病用某疗法治疗血友病患者14例,其中AL血浆诱导率≤0.7的患者5例全部死亡,而>0.7的9例患者中有2例死亡,7例存活,该组据此得出AL血浆诱导率≤0.7者比>0.7者病死率高的结论。结论对吗?应该如何分析该资料?
解:Fisher确切概率法检验结果显示:用该疗法治疗血友病患者,AL血浆诱导率≤0.7者比>0.7者病死率高(P=0.021)。
Chi-Square TestsValue7.778b4.9789.8737.22214df1111Asymp. Sig.(2-sided).005.026.002.007Exact Sig.(2-sided)Exact Sig.(1-sided)Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases.021.010a. Computed only for a 2x2 tableb. 4 cells (100.0%) have expected count less than 5. The minimum expected count is2.50.
10. 调查某市412名艾滋病高危人群的CCR2-64I基因和SDF1-3′A基因的基因型分布情况见下表。问两个基因型之间是否有关联?
27
暨南大学医学院医学统计学教研室
412名艾滋病高危人群CCR2-64I基因和SDF1-3′A基因的基因型分布 SDF1-3′A基因 Wt/wt Wt/mt Mt/mt 合计
CCR2-64I基因
Wt/wt 121 36 8 165
Wt/mt
52 72 51 175
Mt/mt 11 54 7 72
合计 184 162 66 412
解:c2检验结果显示:两种基因型间有关联(c2=122.81,P=0.000),Pearson列联系数为0.479。
Chi-Square TestsValue122.809a122.82259.702412df441Asymp. Sig.(2-sided).000.000.000Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 11.53. Symmetric MeasuresValue.479412Approx. Sig..000Nominal by NominalN of Valid CasesContingency Coefficienta. Not assuming the null hypothesis.b. Using the asymptotic standard error assuming the null hypothesis.
11. 某医院在冠心病普查中欲研究冠心病与眼底动脉硬化的关系,资料见下表。问两者之间是否存在线性趋势关系?
某单位职工冠心病与眼底动脉硬化普查结果
眼底动脉硬化级别 Ⅰ Ⅱ Ⅲ Ⅳ 合计
冠心病诊断
正常 340 73 97 3 513
可疑 11 13 18 2 44
冠心病
6 6 18 1 31
合计 357 92 133 6 588
解:本题为双向有序属性不同的R×C表,研究目的是分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。
经有序分组资料的线性趋势检验,得出线性回归分量有统计学意义(c2=53.72,P=0.000),Spearman等级相关系数为0.310(P=0.000)。等级相关系数为正相关,说明眼底动
28
暨南大学医学院医学统计学教研室
脉硬化级别越高,越容易得冠心病。
Chi-Square TestsValue61.594a57.04553.723588df661Asymp. Sig.(2-sided).000.000.000Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 3 cells (25.0%) have expected count less than 5. Theminimum expected count is .32. Symmetric MeasuresValue.303.310588Asymp.Std. Errora.042.040Approx. Tb7.6837.893Approx. Sig..000c.000cInterval by IntervalOrdinal by OrdinalN of Valid CasesPearson's RSpearman Correlationa. Not assuming the null hypothesis.b. Using the asymptotic standard error assuming the null hypothesis.c. Based on normal approximation. 第八章 秩转换的非参数检验
计算分析题(P128)
1. 下表资料是10名健康人用离子交换法与蒸馏法测定尿汞值的结果,问两法测定结果有无差别?
10名健康人用离子交换法与蒸馏法测定尿汞值(mg/L) 编号 离子交换法 蒸馏法
1 0.5 0.0
2 2.2 1.1
3 0.0 0.0
4 2.3 1.3
5 6.2 3.4
6 1.0 4.6
7 1.8 1.1
8 4.4 4.6
9 2.7 3.4
10 1.3 2.1
解:据经验,尿汞值不符合正态分布,故选用秩和检验。配对样本比较的Wilcoxon符号秩和检验结果显示:两法测定尿汞值的差异无统计学意义(Z=0.474,P=0.635)。
RanksNMean RankSum of Ranks5a5.3026.50b44.6318.501c10Test Statisticsb蒸馏法 - 离子交换法Negative RanksPositive RanksTiesTotala. 蒸馏法 < 离子交换法b. 蒸馏法 > 离子交换法c. 蒸馏法 = 离子交换法蒸馏法 - 离子交换法ZAsymp. Sig. (2-tailed)-.474a.635 a. Based on positive ranks.b. Wilcoxon Signed Ranks Test
29
暨南大学医学院医学统计学教研室
2. 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试验结果如下表,问局部温热治疗小鼠移植肿瘤是否可延长小鼠生存日数?
实验组 对照组
10 2
12 3
15 4
15 5
16 6
17 7
18 8
20 9
23 10
90以上 11 12
13
解:生存时间一般服从偏态分布,故选用秩和检验。两个独立样本比较的Wilcoxon秩和检验结果显示:实验组小鼠生存日数长于对照组(Z=3.63,P=0.000),即温热治疗小鼠移植肿瘤可延长小鼠生存日数。
Test StatisticsMann-Whitney UWilcoxon WZAsymp. Sig. (2-tailed)Exact Sig. [2*(1-tailedSig.)]a. Not corrected for ties.b. Grouping Variable: 分组bRanks生存日数分组实验组对照组TotalN101222Mean Rank17.006.92Sum of Ranks170.0083.00生存日数5.00083.000-3.630.000.000a 3. 下表资料是某药治疗两种不同病情的老年慢性支气管炎病人的疗效,问该药对两种病情的疗效是否不同?
某药对两种不同病情的老年慢性支气管炎病人的疗效
疗效 控制 显效 有效 无效 合计
单纯型
65 18 30 13 126
单纯型合并肺气肿
42 6 23 11 82
(1)数据文件
数值变量:病情(1:单纯型;2:单纯型合并肺气肿),疗效(3:控制;2:显效;1:有效;0:无效),频数。
30
暨南大学医学院医学统计学教研室
(2)SPSS操作步骤
AnalyzeèNonparametric testsèIndependent Samples
解:疗效分4个等级,故选用秩和检验。两个独立样本比较的Wilcoxon秩和检验结果显示:还不能认为该药对两种病情的疗效不同(Z=0.543,P=0.587)。
Test StatisticsaRanks疗效Mean RankSum of Ranks106.1813378.50101.928357.50Mann-Whitney UWilcoxon WZAsymp. Sig. (2-tailed)4954.5008357.500-.543.587疗效病情单纯型单纯型合并肺气肿TotalN12682208a. Grouping Variable: 病情 4. 据下表资料,问三种不同人群的血浆总皮质醇测定值有无差别?如果有差别,作两两比较。
三种不同人群的血浆总皮质醇测定值(102mmmol/L)
正常人 0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92
单纯性肥胖
0.17 0.33 0.55 0.66 0.86 1.13 1.38 1.63 2.04 3.75
皮质醇增多症
2.70 2.81 2.92 3.59 3.86 4.08 4.30 4.30 5.96 6.62
解:本例为小样本资料,而且数据离散程度较大,如单纯肥胖组的标准差接近均数,故选用秩和检验。多个样本比较的Kruskal-Wallis H 检验结果显示:三种不同人群的血浆总皮质醇测定值有差别(c2=18.13,P=0.000)。
RanksTest Statisticsa,b皮质醇人群正常人单纯性肥胖皮质醇增多症Total皮质醇N10101030Mean Rank9.6511.7525.10Chi-SquaredfAsymp. Sig.18.1302.000a. Kruskal Wallis Test b. Grouping Variable: 人群 3个独立样本两两比较的Nemenyi法检验:用SPSS的Syntax Editor编程进行计算。程序第1行的变量名Hc,r1,r2,r3,n1,n2,n3分别表示:卡方值(18.13),3个样本的平均秩(9.65,11.75,25.10)及样本含量(10,10,10),第3行为相应的数据。
data list free/Hc r1 r2 r3 n1 n2 n3 . begin data
18.13 9.65 11.75 25.10 10 10 10 end data.
compute N=n1+n2+n3.
31
暨南大学医学院医学统计学教研室
compute
H=(12*((r1*n1)**2/n1+(r2*n2)**2/n2+(r3*n3)**2/n3))/(N*(N+1))-3*(N+1). compute c=H/Hc.
compute x12=(r1-r2)**2/((N*(N+1)/12)*(1/n1+1/n2)*c). compute x13=(r1-r3)**2/((N*(N+1)/12)*(1/n1+1/n3)*c). compute x23=(r2-r3)**2/((N*(N+1)/12)*(1/n2+1/n3)*c). compute p12=1-cdf.chisq(x12,2). compute p13=1-cdf.chisq(x13,2). compute p23=1-cdf.chisq(x23,2). formats p12(F8.3). formats p13(F8.3). formats p23(F8.3). execute.
程序运行结果(下图):血浆总皮质醇测定值在正常人与单纯性肥胖者之间无差别(c2=0.28,P=0.867),在正常人与皮质醇增多症者之间有差别(c2=15.41,P=0.000),在单纯性肥胖者与皮质醇增多症者之间也有差别(c2=11.50,P=0.003)。
附:4个独立样本两两比较的Nemenyi法检验(第3行数据需要修改)
data list free/Hc r1 r2 r3 r4 n1 n2 n3 n4. begin data
15.52 43.50 29.10 24.09 22.23 17 15 17 11 end data.
compute N=n1+n2+n3+n4. compute
H=(12*((r1*n1)**2/n1+(r2*n2)**2/n2+(r3*n3)**2/n3+(r4*n4)**2/n4))/(N*(N+1))-3*(N+1). compute c=H/Hc.
compute x12=(r1-r2)**2/((N*(N+1)/12)*(1/n1+1/n2)*c). compute x13=(r1-r3)**2/((N*(N+1)/12)*(1/n1+1/n3)*c). compute x14=(r1-r4)**2/((N*(N+1)/12)*(1/n1+1/n4)*c). compute x23=(r2-r3)**2/((N*(N+1)/12)*(1/n2+1/n3)*c). compute x24=(r2-r4)**2/((N*(N+1)/12)*(1/n2+1/n4)*c). compute x34=(r3-r4)**2/((N*(N+1)/12)*(1/n3+1/n4)*c). compute p12=1-cdf.chisq(x12,3). compute p13=1-cdf.chisq(x13,3). compute p14=1-cdf.chisq(x14,3).
32
暨南大学医学院医学统计学教研室
compute p23=1-cdf.chisq(x23,3). compute p24=1-cdf.chisq(x24,3). compute p34=1-cdf.chisq(x34,3). formats p12(F8.3). formats p13(F8.3). formats p14(F8.3). formats p23(F8.3). formats p24(F8.3). formats p34(F8.3). execute.
5. 据下表资料,问三种产妇在产后1个月内的泌乳量有无差别?
三种产妇在产后1个月内的泌乳量
乳量 无 少 多 合计
早产 30 36 31 97
足月产 132 292 414 838
过期产 10 14 34 58
解:经多个样本比较的Kruskal-Wallis H 检验,可认为三种产妇在产后1个月内的泌乳量有差别(c2=17.00,P=0.000)。
RanksTest Statisticsa,b乳量产妇种类早产足月产过期产Total乳量9783858993Mean Rank395.21505.82539.83Chi-SquaredfAsymp. Sig.16.9962.000Na. Kruskal Wallis Test b. Grouping Variable: 产妇种类 6. 10例食管癌病人在某种药物的保护下,做不同强度的放射线照射,观察血中淋巴细胞畸变百分数,结果如下表。问三者的淋巴细胞畸变百分数有无差别?如果有差别,作两两比较。
10例食管癌病人放射线照射后血中淋巴细胞畸变百分数
病例号 1 2 3 4 5 6 7 8 9 10
照射前
1.0 1.0 0.0 1.2 1.0 1.0 1.0 1.0 1.0 4.0
33
照射6000g
0.0 18.0 6.7 0.0 29.0 17.0 5.0 6.0 10.0 7.0
照射9000g
0.0 12.0 9.7 6.3 16.0 16.7 25.0 2.5 9.0 7.0
暨南大学医学院医学统计学教研室
解:本题为百分数资料,而且数据离散程度很大,3个组的标准差都接近均数,故选用秩和检验。经多个相关样本比较的Friedman M检验,可认为三者的血中淋巴细胞畸变百分数有差别(c2=7.79,P=0.020)。
Test StatisticsaRanks照射前照射6000照射9000Mean Rank1.302.402.30NChi-SquaredfAsymp. Sig.107.7892.020 a. Friedman Test
第九章 双变量回归与相关
计算分析题(P152)
1. 某地10名一年级女大学生的胸围(cm)与肺活量(L)数据如下表所示。试建立肺活量Y与胸围X的回归方程,并估计胸围为75cm时相应肺活量均数的95%可信区间以及个体值的95%可信区间。
10名一年级女大学生的胸围(cm)与肺活量 学生编号 胸围X 肺活量Y
1 72.5 2.51
2 83.9 3.11
3 78.3 1.91
4 88.4 3.28
5 77.1 2.83
6 81.7 2.86
7 78.3 3.16
8 74.8 1.91
9 73.7 2.98
10 79.4 3.28
ˆ=-1.43+0.053X。但对回归系数进行t检验,尚不能认解:建立的回归方程为:Y
为胸围与肺活量之间有直线关系(t=1.65,P=0.138)。故没有必要做进一步的直线回归分
析分析。
CoefficientsaUnstandardizedCoefficientsBStd. Error-1.4302.559.053.032StandardizedCoefficientsBeta.504Model1(Constant)胸围Xt-.5591.649Sig..592.138a. Dependent Variable: 肺活量Y 2. 某医师测得10名正常成年男性的血浆清蛋白含量(g/L)及其血红蛋白含量(g/L)数据如下表所示。请对这两项指标作相关分析并计算相关系数的95%可信区间。
10名正常成年男性的血浆清蛋白含量(g/L)及其血红蛋白含量(g/L) 编号
1
2
3
4
5
6
7
8
9
10
血浆清蛋白含量 35.5 36.5 38.5 37.5 36.5 35.5 34.5 34.2 34.6 33.5
119.5 120.5 127.5 126.5 120.5 118.5 110.5 109.5 108.5 105.3 血红蛋白含量
解:散点图显示:血浆清蛋白含量与血红蛋白含量有直线趋势。直线相关分析结果显示:血浆清蛋白含量与血红蛋白含量之间有正的直线相关关系(r=0.960;95% CI:0.8352, 0.9908;P=0.000)(计算公式:z=tanhr, z±1.96/n-3)。
34
-1
暨南大学医学院医学统计学教研室
39.038.0血浆清蛋白含量(g/L)37.0Correlations36.0血浆清蛋白含量血浆清蛋白含量Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N110.963**.00010血红蛋白含量.963**.0001011035.034.0血红蛋白含量33.0105.0110.0115.0120.0125.0130.0血红蛋白含量(g/L)**. Correlation is significant at the 0.01 level (2-tailed).
可信区间的计算方法:
从计算机桌面选择:程序è附件è计算器(科学型),输入相关系数0.960,选择Inv(反,逆)和tanh(双曲正切函数),可得反双曲正切函数1.9459;输入1.9459,单击tanh可得0.960;输入1.2051,单击tanh可得0.8352。
3. 两名放射科医师对13张肺部X线片各自做出评定,评定方法是将X线片按病情严重程度给出等级,结果如下表所示。问他们的等级评定结果是否相关。
两名放射科医师对13张肺部X线片的评定结果 X线片编号 甲医师 乙医师
两名放射科医师对13张肺部X线片的评定结果(用0~4分别表示5个等级)
X线片编号 甲医师 乙医师
1 2 1
2 3 3
3 0 2
4 1 2
5 0 0
6 2 3
7 3 4
8 4 3
9 3 4
10 4 4
11 0 1
12 3 3
13 2 3
1 + ±
2 + + + +
3 - +
4 ± +
5 - -
6 + + +
7
8
9
10
11
12 + + + +
13 + + +
+ + +++ + + +++ - +++ + + +++ +++ ±
解:本资料为等级数据,故选用秩相关。经秩相关分析,可认为两名医师的评定结果存在正相关关系(rs=0.808,P = 0.001)。
Correlations甲医师Spearman's rho乙医师.808**.001131.000.13甲医师乙医师Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N1.000.13.808**.00113**. Correlation is significant at the 0.01 level (2-tailed). 35 暨南大学医学院医学统计学教研室
第十章 统计表与统计图
计算分析题(P165)
1. 对下列统计表提出意见,并绘制改进后的统计表。
职业 工人 农民 职员
性别 男 女 合计 男 女 合计 男 女 合计
例数 102 77 107 80 86 91 182 163 198
发病率 例数
3 7 18 20 2 10 23 9 28
% 2.9 9.1 16.8 25.0 2.3 11.0 12.6 5.5 14.1
答:该表没有标题,行的层次多,不应该有竖线,修改如下:
表1 某年某地不同职业居民的某病发病率(%) 职业 工人 农民 职员
男
例数 102 77 107
发病数 发病率
3 7 18
2.9 9.1 16.8
例数
80 86 91
女
发病数 发病率
20 2 10
25.0 2.3 11.0
例数
182 163 198
合计 发病数
23 9 28
发病率 12.6 5.5 14.1
2. 请评价下表是否符合统计表的制表原则,并作改进。
两组临床疗效观察
项目
治 疗 前 253 247 144 171 159 245 211 246
花斑竹组(226例) 治疗后 消失
例数 % 239 235 137 148 142 232 182 206
94.5 95.1 95.1 86.5 89.3 95.7 86.3 83.7
平均天数 11.82 11.80 7.17 17.39 23.09 16.84 29.41 25.84
维生素B12组(70例)
治疗后 消失
例数 % 54 51 30 27 22 58 29 53
90.0 91.1 100.0 65.0 68.8 98.3 56.9 80.3
平均天数 19.43 9.37 24.41 30.68 23.19 37.24 30.38
改善 无效
1 1 4 4 1 6 2
治 疗
改善 无效 前
8 6 6 4 19 14 7 22 32
6 3 4 3 6 7 8
60 56 30 41 32 59 51 66
食欲不振 疲乏无力 恶心呕吐 肝区疼痛 肝脏肿大 黄疸 麝絮 GPT高
19.28 5
4 10 6 16 11
36
暨南大学医学院医学统计学教研室
答:该表有竖线、标题不具体、层次多,疗效指标过多、例数显示不当。修改如下:
表1 花斑竹和维生素B12治疗某病的临床疗效观察
花斑竹组
观察指标 食欲不振 疲乏无力 恶心呕吐 肝区疼痛 肝脏肿大 黄疸 麝絮 GPT高
3. 某地两年三种死因别死亡率资料如下表,请绘制合适的统计图描述该资料。
某地两年三种死因别死亡率(1/10万)
死因 肺结核 心脏病 恶性肿瘤
1952年 163.2 72.5 57.2
1992年 24.7 83.4 156.3
治疗例数 253 247 144 171 159 245 211 246
症状消失 率(%) 94.5 95.1 95.1 86.5 89.3 95.7 86.3 83.7
症状消失 平均天数
11.82 11.80 7.17 17.39 23.09 16.84 29.41 25.84
治疗例数 60 56 30 41 32 59 51 66
维生素B12组 症状消失 率(%) 90.0 91.1 100.0 65.0 68.8 98.3 56.9 80.3
症状消失 平均天数
19.28 19.43 9.37 24.41 30.68 23.19 37.24 30.38
答:该资料是比较两个年度三种死因的变化,适宜用复式直条图,绘制如下:
180160年份1952年1992年死140亡120率100806040200(1/10万)肺结核心脏病恶性肿瘤 图1 某地1952年与1992年三种死因的死亡率比较
37
暨南大学医学院医学统计学教研室
4. 某医生统计1992年某市机械工业生产性外伤例数见下表,请用适当的统计图描述。
1992年某市机械工业生产性外伤分类的病例数
外伤类型 创伤 挫伤 眼外伤 烧伤 其他 合计
病例数 381 305 118 92 43 939
百分比(%)
40.57 32.48 12.57 9.80 4.58 100.0
答:该资料是描述生产性外伤的构成比,适宜用圆图,绘制圆图如下:
9.8%烧伤4.58%其他12.57%眼外伤40.58%创伤32.48%挫伤 图2 1992年某市机械工业939例生产性外伤类型的百分比
5. 根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。
某年某地食管癌不同性别与年龄别的发病率(1/10万)
年龄(岁)
40~ 45~ 50~ 55~ 60~ 65~ 70~ 75~ 80~
男 4.4 7.2 7.3 6.9 19.3 50.2 68.5 86.2 97.0
女 2.1 3.3 4.5 5.5 6.7 16.4 12.5 19.9 15.2
普通线图显示:在55岁以后,男性食管癌发病率随年龄的增长幅度明显大于女性;半对数线图显示:男性和女性食管癌发病率随年龄的增长速度接近。
38
暨南大学医学院医学统计学教研室
100.0发病率(1/1010.0男性女性1.01404550556065707580万)年龄(岁)
某年某地食管癌不同性别与年龄别的发病率
6. 三种不同人群的血浆总皮质醇测定资料见下表,试选用合适类型的统计图描述以下资料。
三种不同人群的血浆总皮质醇测定值(102mmmol/L)
正常人 0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92
单纯性肥胖
0.17 0.33 0.55 0.66 0.86 1.13 1.38 1.63 2.04 3.75
皮质醇增多症
2.70 2.81 2.92 3.59 3.86 4.08 4.30 4.30 5.96 6.62
答:由于数据的离散程度很大,该资料合适用箱式图。
7.00306.00血浆总皮质醇测定值5.004.00203.00102.001.000.00正常人单纯性肥胖皮质醇增多症人群 不同人群的血浆总皮质醇测定值(102mmmol/L)
39
暨南大学医学院医学统计学教研室
7. 补充习题:为研究药的抑癌作用,使一批小白鼠致癌后,按完全随机设计的方法随机分为四组,A、B、C和对照组,分别接受不同的处理。A、B、C三个实验组分别注射0.5、1.0和1.5ml 30%的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见下表。请分别用Error Bar描述该资料。
四组小白鼠的肿瘤重量(g)
对照组 3.6
4.5 4.2 4.4 3.7 5.6 7.0 4.1 5.0 4.5 6A 3.0 2.3 2.4 1.1 4.0 3.7 2.8 1.9 2.6 1.3 实验组 B 0.4 1.8 2.1 4.5 3.6 1.3 3.2 2.1 2.6 2.3 C 3.3 1.2 1.3 2.5 3.1 3.2 0.6 1.4 1.3 2.1 肿瘤重量(g)第十一章 多因素试验资料的方差分析
计算分析题(P185)
1. 研究不同负荷(A因素)和不同航空供养装置(B因素)的呼吸阻力。A因素有三个水平,即在自行车功量计上静坐、250与600kg/min体力负荷;B因素有两个水平,即YX-1与YX-3供养系统。如有12名受试者,每人只能接受一种处理,应如何进行试验设计?如果在一段时间内每人可重复接受所有的处理,又应如何设计?试写出这两种条件下地随机化分组结果。
解:A因素有三个水平:A1=(静坐),A2=(250kg/min体力负荷),A3=(600kg/min体力负荷);B因素有两个水平:B1=(YX-1供氧系统),B2 =(YX-3供氧系统)。G=3×2=6,共有6个处理组:
T1=(A1,B1),T2=(A1,B2),T3=(A2,B1),T4=(A2,B2),T5=(A3,B1),T6=(A3,B2)。
40
95% CI 54321对照组0.5 ml1.0 ml1.5 ml分组 某种药物对小白鼠抑癌作用实验结果
暨南大学医学院医学统计学教研室
现有12名受试者,每人只能接受一种处理,用完全随机分组方法将12名受试者等分6组,每组2人。随机分组表如下(随机数字序号R为1,2分配T1,R为3,4分配T2,…,余类推)。
受试者序号 随机数字 随机数序号R 处理分组
1 22 3 T2
2 17 2 T1
3 68 7 T4
4 65 6 T3
5 81 9 T5
6 68 8 T4
7 95 12 T6
8 23 4 T2
9 92 11 T6
10 35 5 T3
11 87 10 T5
12 02 1 T1
如果在一段时间内每个受试者可重复接受所有的处理,用区组随机化设计安排处理,即 受试者 序 号 1 2 3 ... 12
试验时间
1 T2 ... ... ... ...
... ... ... ... 2 T4
... ... ... ... 3 T3
... ... ... ... 4 T6
... ... ... ... 5 T5
... ... ... ... 6 T1
各个试验时间的处理顺序随机确定(随机数序号R为对应的处理号)。如第一个受试者试验 时间顺序 随机数字 随机数序号R 处理分组
1 19 2 T2
2 36 4 T4
3 27 3 T3
4 59 6 T6
5 46 5 T5
6 13 1 T1
第2~12个受试者的处理分配重复以上步骤。
2. 下表为完全随机设计3×5析因试验结果,A因素为毫米波照射频率,B因素为照射时间,表内Tk(k=1, 2,…,15)为各处理组的实验结果小计。试进行统计分析。
小鼠肝细胞DNA含量的合计(n=5)(绝对单位AU)
B因素
(J=5) 即刻 1天 3天 5天 7天
36.04GHZ 2.2035(T1) 1.9155(T2) 1.9705(T3) 1.9120(T4) 1.9204(T5)
A因素(I=3) 50.05GHZ 1.9380(T6) 1.9140(T7) 1.6630(T8) 1.9810(T9) 1.9755(T10) 9.4715(A2)
空白对照 2.1820(T11) 1.9875(T12) 1.8825(T13) 2.0615(T14) 1.9090(T15) 10.0225(A3)
A因素 小计(Bi) 6.3235(B1) 5.8170(B2) 5.5160(B3) 5.9545(B4) 5.8085(B5) 29.4195(∑X)
A因素小计(Ai) 9.9255(A1) 平方和 ∑X2=11.7074
解:本题为完全随机设计3×5析因试验结果。没有给原始数据,不能用SPSS处理。结果略。
41
暨南大学医学院医学统计学教研室
3. 研究高锰酸盐处理后对甘蓝叶核黄素浓度测量结果的影响。试验分3天进行,每天安排1次2×2的析因处理,A因素为试样处理方式,B因素为试样重量,试验结果见下表。试进行析因设计资料的方差分析。
甘蓝叶核黄素浓度测量结果(mg/g)
试验日期 第1天 第2天 第3天
高锰酸盐处理
0.25g 试样
27.2 23.2 24.8
1.00g 试样
24.6 24.2 22.2
39.5 43.1 45.2
不处理
0.25g 试样
1.00g 试样
38.6 39.5 33.0
解:本题为有4个处理组的2×2析因设计试验。试验分3天进行,即每个试验重复3次。经析因设计的方差分析,可认为高锰酸盐处理(F=108.42,P=0.000)及其试样重量(F=5.51,P=0.047)对甘蓝叶核黄素浓度测量结果有影响;还不能认为高锰酸盐和试样重量的交互作用对甘蓝叶核黄素浓度测量结果有影响(F=1.97,P=0.198),即高锰酸盐处理对甘蓝叶核黄素浓度测量结果的作用与试样重量无关。
Tests of Between-Subjects EffectsDependent Variable: 测量结果Type III SumSourceof SquaresdfaCorrected Model765.5293Intercept12358.5011高锰酸盐716.1081试样重量36.4011高锰酸盐 * 试样重量13.0211Error52.8408Total13176.87012Corrected Total818.36911a. R Squared = .935 (Adjusted R Squared = .911)Mean Square255.17612358.501716.10836.40113.0216.605F38.6341871.083108.4195.5111.971Sig..000.000.000.047.198 4. 补充题:将54只患肿瘤小鼠随机分为9组,进行3×3析因实验,观察微波照射时间和血卜啉(HPD)对小鼠肿瘤组织DNA含量的影响。微波照射时间有三个水平,照射15分钟(A1)、6小时(A2) 、24小时(A3) ;HPD的应用也有三个水平,即不用HPD (B1) 、用HPD后微波照射(B2) 、用微波照射后用HPD (B3) 。实验结果见下表。试进行析因分析。
小鼠肿瘤组织DNA含量(μg/100)
A1
B1 440 275 275 275 265 160
42
B3 218 188 360 202 345 60
B1 141 188 230 160 202 218
A2 B2 218 145 360 330 265 202
B3 230 160 230 130 145 145
B1 230 330 246 246 246 218
A3 B2 290 246 218 218 304 202
B3 188 102 75 145 102 175
B2 202 304 246 265 246 275
暨南大学医学院医学统计学教研室
经析因设计的方差分析,微波照射时间的主效应(F=3.39,P=0.043)和血卜啉使用方法的主效应(F=7.11,P=0.002)均有差别;尚不能认为微波照射时间与血卜啉使用方法之间有交互作用(F=1.71,P=0.164),即微波照射时间对小鼠肿瘤组织DNA含量的作用与血卜啉使用方法无关;在9组小鼠中,对小鼠肿瘤组织DNA含量的影响最大的组是微波照射时间24小时与微波照射后用血卜啉,小鼠DNA含量的均数为131.3(mg/100),其它8组小鼠DNA含量的均数最小为173.3(mg/100),最大为281.7(mg/100)。
Tests of Between-Subjects EffectsDependent Variable: DNA含量Type III SumSourceof SquaresdfMean SquareaCorrected Model113562.333814195.292Intercept2702788.16712702788.167微波照射时间27643.111213821.556血卜啉使用方法58007.444229003.722微波照射时间 * 27911.77846977.944血卜啉使用方法Error183612.500454080.278Total2999963.00054Corrected Total297174.83353a. R Squared = .382 (Adjusted R Squared = .272)Descriptive StatisticsDependent Variable: DNA含量微波照射时间15分钟血卜啉使用方法不用HPD用HPD后微波照射用微波照射后用HPDTotal不用HPD用HPD后微波照射用微波照射后用HPDTotal不用HPD用HPD后微波照射用微波照射后用HPDTotal不用HPD用HPD后微波照射用微波照射后用HPDTotalMean281.67256.33228.83255.61189.83253.33173.33205.50252.67246.33131.17210.06241.39252.00177.78223.72Std.Deviation89.75934.238111.09482.68734.15581.25444.90764.32339.57141.96045.16469.85868.76753.13280.72774.880N66618666186661818181854F3.479662.4033.3877.1081.710Sig..003.000.043.002.164 6小时24小时Total 5. 例11-5 研究高频呼吸机A,B,C,D,E五个参数对通气量的影响,每个参数有高、低两个水平,试按正交设计安排试验。
43
暨南大学医学院医学统计学教研室
表11-19 高频呼吸机五个参数选择的正交设计与试验结果
试验 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
A (1) 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2
B (2) 1 1 1 1 2 2 2 2 1 1 1 1 2 2 2 2
C (4) 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2
D (8) 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
E (15) 1 2 2 1 2 1 1 2 2 1 1 2 1 2 2 1
通气量 (升/分) 16.26 19.38 23.60 28.43 20.28 34.88 49.10 47.44 18.32 24.85 39.45 32.08 45.50 50.30 55.26 66.64
注:表中(1),(2),(4),(8),(15)为L16(215)正交表的列号。
试对例11-5的表11-19正交试验结果进行统计分析。分析A、B、C、D、E五个参数对通气量的影响,同时分析AB、AC、AE三个1阶交互作用。
解:首先对该资料的质量进行分析。该资料的研究对象应该是16个健康人或患者,但16次试验中每个试验没有重复。生物个体对相同一个试验的变异一般较大,应考虑重复每个试验。如将48名研究对象完全随机分为16组,每组3名受试者。
假定该试验结果受研究对象个体差异的影响较小,可进行正交设计资料的方差分析。先用SPSS的Mean过程计算出A、B、C、D、E五个参数两个水平的均数。可以看出A、B、C、D四个参数都是第2水平的均数高于第1水平,而参数E是第1水平的均数高于第2水平。这些观察到的差别可能由抽样误差或机会造成,需要进行假设检验。
x * aMeana12Totalx29.921341.550035.7356Meanb12Totalx25.296346.175035.7356x * bMeanc12Totalx * cMeanx * dMeanx33.471338.000035.7356e12Totalx * ex28.721342.750035.7356d12Totalx38.138833.332535.7356 经正交设计资料的方差分析,按a=0.05水准,呼吸机参数A、B、C对通气量的影响均有统计学意义(FA=24.73,P=0.002;FB=79.72,P=0.000;FC=35.99,P=0.001);
参数D、E对通气量的影响无统计学意义(FD=3.75,P=0.094;FE=4.22,P=0.079); AB、AC、AE的交互作用也无统计学意义(Fa*b=4.34,P=0.076;Fa*c=0.03,P=0.865;Fa*e=0.02,P=0.897);
A、B、C三个参数都是第2水平的均数高于第1水平,故应该取参数2。虽然参数D和E对通气量的影响无统计学意义,但样本提供的信息是参数D的2水平高于1水平,参数E的1水平高于2水平,故使通气量达到最大的参数选择为A、B、C、D均取2,E参数取1,这种参数水平组合的通气量为66.64(L/min),是16次试验中通气量最高的一种组合。
44
暨南大学医学院医学统计学教研室
Tests of Between-Subjects EffectsDependent Variable: xType III SumSourceof SquaresdfMean SquareCorrected Model3342.257a8417.782Intercept20432.558120432.558a540.9111540.911b1743.68911743.689c787.2231787.223d82.038182.038e92.400192.400a * b94.916194.916a * c.6851.685a * e.3941.394Error153.109721.873Total23927.92416Corrected Total3495.36615a. R Squared = .956 (Adjusted R Squared = .906)F19.101934.15624.73079.72035.9913.7514.2244.339.031.018Sig..000.000.002.000.001.094.079.076.865.897 第十二章 重复测量设计资料的方差分析 计算分析题(P199)
2. 将10名中度甲亢患者随机等分为两组,分别用甲巯咪唑和甲巯咪唑+普萘洛尔治疗,治疗前和治疗后4周的心律测量结果如下表。试分析治疗方法的主效应、治疗时间的主效应和两者的交互作用。
甲亢患者治疗前后的心律(次/分)
患者编号
1 2 3 4 5 6 7 8 9 10
治疗方法 甲巯咪唑 甲巯咪唑 甲巯咪唑 甲巯咪唑 甲巯咪唑
甲巯咪唑+普萘洛尔 甲巯咪唑+普萘洛尔 甲巯咪唑+普萘洛尔 甲巯咪唑+普萘洛尔 甲巯咪唑+普萘洛尔
治疗前 115 120 124 116 114 117 110 118 119 122
治疗后4周
91 94 88 82 96 83 80 92 85 84
解:重复测量设计的方差分析结果显示:甲亢患者治疗前后四周的心率均数有差别(F=238.10,P=0.000);两种治疗方法甲亢患者心率均数的差异无统计学意义(F=1.84,P=0.212);治疗方法与时间的交互作用无统计学意义(F=1.52,P=0.252),即不同治疗方法心率下降幅度的差异无统计学意义。
45
暨南大学医学院医学统计学教研室
Descriptive Statistics治疗前治疗方法甲巯咪唑甲巯咪唑+普萘洛尔Total治疗后甲巯咪唑甲巯咪唑+普萘洛尔TotalMean117.80117.20117.5090.2084.8087.50Std.Deviation4.1474.4384.0625.4954.4385.503N55105510 Tests of Within-Subjects EffectsMeasure: MEASURE_1SourceType III Sumof Squares4500.0004500.0004500.0004500.00028.80028.80028.80028.800151.200151.200151.200151.200df11.0001.0001.00011.0001.0001.00088.0008.0008.000Mean Square4500.0004500.0004500.0004500.00028.80028.80028.80028.80018.90018.90018.90018.900F238.095238.095238.095238.0951.5241.5241.5241.524Sig..000.000.000.000.252.252.252.252时间时间 * 治疗方法Error(时间)Sphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-bound Tests of Between-Subjects EffectsMeasure: MEASURE_1Transformed Variable: AverageType III SumSourceof SquaresdfIntercept210125.000治疗方法45.000Error196.000118Mean Square210125.00045.00024.500F8576.5311.837Sig..000.212
46
暨南大学医学院医学统计学教研室
5. 根据下表资料分析新旧剂型与测量时间对血药浓度的影响。
16名受试者服药后的血药浓度(mmol/L) 编号 1 2 3 4 5 6 7
旧剂型
0小时 4小时 8小时 12小时 90.53 88.43 100.01 46.32 73.69 105.27 86.32
142.12 163.17 144.75 126.33 138.96 126.33 121.06
65.54 48.95 86.06 48.95 70.02 75.01 78.95
73.28 71.77 80.01 39.54 60.89 83.66 70.24
编号 8 9 10 11 12 13 14 15 16
新剂型
0小时 4小时 8小时 12小时 70.53 68.43 57.37 105.80 80.01 56.32 53.69 85.27 66.32
97.38 95.27 78.43 120.54 104.75 75.27 110.02 110.01 115.27
112.12 133.17 83.16 136.33 114.75 96.33 138.96 126.33 129.06
58.50 56.90 48.34 84.03 65.61 47.52 45.44 69.47 55.29
重复测量设计的方差分析结果显示:两种剂型受试者平均血药浓度的差异无统计学意义(F=0.09,P=0.770);受试者服药后不同时间的平均血药浓度有差别(F=74.97,P=0.000);剂型与时间的交互作用有统计学意义(F=46.90,P=0.000),即两种剂型受试者服药后不同时间血药浓度的变化趋势有差别;旧剂型的血药浓度峰值在服药后4小时,新剂型的血药浓度峰值在服药后8小时(图1)。
Descriptive StatisticsStd.Deviation19.5853516.6695818.5718814.4614015.7279723.8810514.3191919.0991331.0907414.6939112.3871713.84764time_0分组旧剂型新剂型Totaltime_4旧剂型新剂型Totaltime_8旧剂型新剂型Totaltime_12旧剂型新剂型TotalMean84.367171.526777.1444137.5314100.7711116.853867.6400118.912296.480668.484359.011163.1556N7916791679167916 Mauchly's Test of SphericitybMeasure: MEASURE_1EpsilonaApprox.GreenhousMauchly's WChi-SquaredfSig.e-GeisserHuynh-FeldtLower-bound.11927.0285.000.675.847.333Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables isproportional to an identity matrix.a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed inthe Tests of Within-Subjects Effects table.b. Design: Intercept+分组 Within Subjects Design: timeWithin Subjects Effecttime 47
暨南大学医学院医学统计学教研室
Tests of Within-Subjects EffectsMeasure: MEASURE_1SourcetimeType III Sumof Squares26560.04626560.04626560.04626560.04616614.53216614.53216614.53216614.5324959.7564959.7564959.7564959.756df32.0262.5411.00032.0262.5411.0004228.36935.57114.000Mean Square8853.34913107.07010453.51926560.0465538.1778199.0766539.15816614.532118.089174.827139.433354.268F74.97274.97274.97274.97246.89846.89846.89846.898Sig..000.000.000.000.000.000.000.000time * 分组Error(time)Sphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-boundSphericity AssumedGreenhouse-GeisserHuynh-FeldtLower-bound Tests of Between-Subjects EffectsMeasure: MEASURE_1Transformed Variable: AverageType III SumSourceof SquaresdfIntercept493771.8701分组59.9161Error9469.95614Mean Square493771.87059.916676.425F729.972.089Sig..000.770
第十五章 多元线性回归分析
有学者认为,血清中低密度脂蛋白增高和高密度脂蛋白降低是引起动脉硬化的一个重要原因。现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白AI、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白和高密度脂蛋白含量,资料如下表所示:
1. 用多元线性回归的逐步回归法筛选变量,选定进入和剔除变量的检验水准分别为0.10和0.15。以低密度脂蛋白(Y1)、高密度脂蛋白(Y2),以及两者的比值(Y2/Y1)为应变量进行分析。待筛选的变量为分别为载脂蛋白AI、载脂蛋白B、载脂蛋白E和载脂蛋白C。
48
暨南大学医学院医学统计学教研室
应变量为低密度脂蛋白:只有载脂蛋白B和载脂蛋白C两个变量引入方程,回归系数分别为1.25和-2.34,决定系数R2为0.5377(表1)。
应变量为高密度脂蛋白:只有载脂蛋白AI和载脂蛋白C两个变量引入方程,回归系数分别为0.498和-0.497,决定系数R2为0.7749(表2)。
应变量为高密度脂蛋白与低密度脂蛋白的比值(Y2/Y1):载脂蛋白AI、载脂蛋白B和载脂蛋白C引入方程,回归系数分别为0.00264、-0.00363和0.00333,决定系数R2为0.8439(表3)。
根据多元线性回归分析的结果,可以认为:
血清胆固醇中低密度脂蛋白含量与载脂蛋白B和载脂蛋白C有关:载脂蛋白B的含量愈高,血清胆固醇中低密度脂蛋白含量也愈高;而载脂蛋白C则对低密度脂蛋白含量起一定的抑制作用。
血清胆固醇中高密度脂蛋白含量与载脂蛋白AI呈正相关,而同样与载脂蛋白C呈负相关作用。
高密度脂蛋白与低密度脂蛋白的比值(Y2/Y1)与载脂蛋白AI和载脂蛋白C呈正相关,与载脂蛋白B呈负相关。载脂蛋白B使高密度脂蛋白的相对含量减少,可增加患动脉硬化的危险性。
30例就诊者血清载脂蛋白对低密度脂蛋白影响的多元线性回归分析 变量 常数项 载脂蛋白B 载脂蛋白C
表2 30例就诊者血清载脂蛋白对高密度脂蛋白影响的多元线性回归分析
变量 常数项
载脂蛋白AI 载脂蛋白C
回归系数 -11.781 0.498 -0.497
标准回归系数
— 0.851 -0.249
t -1.31 9.32 -2.72
P 0.201 0.000 0.011
95% CI -30.225~6.664 0.389~0.608 -0.871~-0.122
回归系数 41.84 1.254 -2.341
标准回归系数
— 0.676 -0.485
t 1.33 5.02 -3.60
P 0.193 0.000 0.001
95% CI -22.51~106.19 0.742~1.767 -3.675~-1.007
表3 30例就诊者血清载脂蛋白对高、低密度脂蛋白比值影响的多元线性回归分析 变量 常数项
载脂蛋白AI 载脂蛋白B 载脂蛋白C
回归系数 0.355 0.003 -0.004 0.003
标准回归系数
— 0.583 -0.612 0.216
t 4.02 7.36 -7.51 2.70
P 0.000 0.000 0.000 0.012
95% CI 0.174~0.537 0.002~0.004 -0.005~-0.003 0.001~0.006
残差分析:
(1)离群值分析:应变量为低密度脂蛋白:编号为10的就诊者其标准化残差为3.29;应变量为高密度脂蛋白:编号为29的就诊者其标准化残差为2.92;应变量为高、低密度脂蛋白比值:编号为10的就诊者其标准化残差为2.55。
(2)标准化残差图分析:3个残差图中的散点分布不是十分均匀,但基本上符合多元线性回归对资料的要求。
49
暨南大学医学院医学统计学教研室
图1 标准化残差图
第十七章 生存分析
1. 某研究者分别用免疫疗法、药物与免疫结合疗法治疗黑色素瘤患者,经随访得到患者的生存时间(月)见下表。
(1)试采用乘积极限法(Kaplan-Meier法)计算生存率及其标准误。 (2)对两组的生存率进行log-rank检验 (3)绘制生存曲线。 BCG治疗组
药物和BCG 结合治疗组
33.7+ 4.3 2.8
3.8
26.9+ 9.2
6.3
21.4+ 15.9
2.3
18.1+ 4.5
6.4 5.8 9.2
23.8+ 3.0 8.2+
1.8
11.0+ 8.2+
5.5 16.6+
22.1 23.0+ 7.8+
33.7+ 6.8
17.1+
10.8+
答:用Kaplan-Meier法计算生存率: BCG组11例,观察到死亡6例,患者的中位数生存时间为6.4月,6个月生存率为45.5%,其标准误为15.0%;药物和BCG组结合治疗组19例,观察到死亡10例,患者的中位数生存时间为15.9月,6个月生存率为68.4%,其标准误为10.7%。log-rank检验结果显示:两组生存率的差异无统计学意义(c2=0.06,P=0.811)。
Case Processing Summaryg12OverallTotal N111930N of Events61016CensoredNPercent545.5%947.4%1446.7% Means and Medians for Survival TimeMeana95% Confidence IntervalLower BoundUpper BoundEstimate9.01726.3656.40011.04220.32115.90013.19423.36915.900Median95% Confidence IntervalStd. ErrorLower BoundUpper Bound...5.2775.55626.2447.1561.87329.927gEstimateStd. Error117.6914.425215.6812.367Overall18.2812.596a. Estimation is limited to the largest survival time if it is censored. 50
暨南大学医学院医学统计学教研室
Overall ComparisonsLog Rank (Mantel-Cox)Chi-Square.057df1Sig..811Test of equality of survival distributions for the different levels ofg. Survival TableCumulative ProportionSurviving at the TimeEstimateStd. Error.909.087.818.116.727.134.636.145.545.150.455.150...........947.051.895.070.842.084.789.094.737.101.684.107.........547.122.....456.131.....304.152....N ofCumulativeEvents123456666661234566667888999101010N ofRemainingCases1098765432101817161514131211109876543210g12123456789101112345678910111213141516171819Time1.8002.3003.8005.5006.3006.40016.60017.10023.80033.70033.7002.8003.0004.3004.5005.8006.8007.8008.2008.2009.2009.20010.80011.00015.90018.10021.40022.10023.00026.900Status 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 0 0 0 1 1 0 0 1 0 0 1 0 0
图1 BCG治疗、药物与BCG结合治疗黑色素瘤患者的Kaplan-Meier生存率曲线
51
暨南大学医学院医学统计学教研室
2. 研究者收集的女性心绞痛病人的生存数据见下表。 (1)试计算生存率及其标准误。
(2)绘制生存曲线并估计其中位生存时间。
女性心绞痛病人的生存时间(年)资料
诊断后的年数
0~ 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~ 9~ 10~ 11~ 12~ 13~ 14~ 15~
期初观察人数
555 473 435 400 371 338 285 234 191 153 113 86 58 35 24 14
失访人数
0 8 8 7 7 28 31 32 24 27 22 23 18 9 7 11
死亡人数
82 30 27 22 26 25 20 11 14 13 5 5 5 2 3 3
答:用Life table法计算生存率,结果为555例女性心绞痛患者的中位生存时间为8.78年,3年、5年和10年生存率分别为75%、66%和45%,标准误为2%。 1.00.8生存率0.60.40.20.00123456789101112131415生存时间(年)图2 555例女性心绞痛患者的生存曲线
52
暨南大学医学院医学统计学教研室
Life Table
Interval Start Time
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Number Entering Interval
555 473 435 400 371 338 285 234 191 153 113 86 58 35 24
Number Number of Withdrawing Terminal during Interval Events
0
8 8 7 7 28 31 32 24 27 22 23 18 9 7
Cumulative Proportion Surviving at End of Interval
.85 .80 .75 .71 .66 .61 .56 .53 .49 .45 .42 .39 .35 .33 .28
Std. Error of Cumulative Proportion Surviving at End of
Interval
.02 .02 .02 .02 .02 .02 .02 .02 .02 .02 .02 .03 .03 .03 .04
82 30 27 22 26 25 20 11 14 13 5 5 5 2 3
The median survival time is 8.78
第二十九章 试验研究设计
1. 为比较两种药物治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选14名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。
(1)如何将病人分组?并写出分组结果。 (2)如何对结果进行统计分析处理? 解:(1)该设计为配对设计,病人分组可采用配对随机化方法。配对随机化方法如下:①按年龄、性别、病型和病情等条件将病人配成7对(或7个),病人编号为1和2的是1对,3和4的是1对,依此类推。②从随机数字表的任一行任一列,如第10行第1列开始,依次读取1位随机数录于编号下,在每个对子内将随机数按大小排序,规定序号为1的为A药治疗组,序号为2的为B药治疗组。分组结果如下表所示:
53
暨南大学医学院医学统计学教研室
14位患者配对随机分组结果
受试者编号
1 2 3 4 5 6 7 8 9 10 11 12 13 14
两个治疗组的受试者编号
配对号 1 2 3 4 5 6 7
A药治疗组
1 4 6 8 9 11 13
B药治疗组
2 3 5 7 10 12 14
配对号 1 1 2 2 3 3 4 4 5 5 6 6 7 7
随机数 5 8 7 1 9 6 3 0 2 4 1 8 4 6
序号 1 2 2 1 2 1 2 1 1 2 1 2 1 2
(2)首先以溃疡面积减少百分率40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式,然后用配对四格表的McNemar检验分析两种药物治疗消化性溃疡有效率的差别。但要注意的是,总例数才14例,只有两种治疗方法的有效率悬殊很大时,才能得出差别有统计学意义的结论。
该资料也可以使用配对样本比较的Wilcoxon符号秩和检验,以每个病人的溃疡面积减少百分率为测量值。
2. 某项研发降压药A与标准降压药B的疗效比较。已知B药能使血压平均下降2.2kPa(16.5mmHg),期望A药能使血压平均下降4 kPa(30mmHg),若降压值的标准差为5 kPa (37.6mmHg)。规定a=0.05(单侧),1-b=0.8,如果想发现A药比B药疗效更好,需观察多少例病例?
解:是两样本均数比较的样本含量估计。 由于a=0.05(单侧),b=0.20(单侧),故u0.05=1.645;u0.20=0.842;d=m1-m2=4-2.2=1.8,d/s=1.8/5=3.6,代入教材公式(36-2)得
é(1.645+0.842)2ù12
n=2´êú+´1.645=96.13, 取97
0.36ëû4
54
暨南大学医学院医学统计学教研室
故每种药物各需观察97例病人,共需194例病人。
也可使用查表法:附表17 两样本均数比较所需样本含量
d/s=1.8/5=3.6,表中最接近3.6的是3.5;单侧a=0.05,b=0.80(只有单侧),结果为102。故每种药物各需观察102例病人,共需204例病人。
由此可见,如果表中没有准确列出相应的d/s,公式法的结果准确些。在同样的a和b水准下,d/s越大,所需要的样本含量越小。如果表中没有列出实际的d/s(如本例的3.6),取表中列出的3.5,则用表查出的例数比公式法略高。
3. 用三种不同的抗凝剂处理血液标本后测得红细胞沉降率(mm/h)的预实验结果如下表所示。如果想发现这三种抗凝剂效果不同,规定a=0.05,b=0.10,正式实验需要多少样品?
三种抗凝剂的红细胞沉降率(mm/h)预实验结果
抗凝剂 A B C
均数 16.0 11.3 9.3
标准差 4.1 4.9 4.6
解:是多个样本均数比较的样本含量估计
X=(16.0+11.3+9.3)/3=12.2, åSi=4.12+4.92+4.62=61.98,
2
å(X得
11.3-12.2)+(9.3-12.2)=23.66 i-X)=(16.0-12.2)+(2
2
2
2
以a=0.05,b=0.10,n1=k-1=3-1=2,n2=¥查附表18得j=2.52,代入教材公式(29-3)
n(1)=(2.522´61.98/3)/(23.66/2)=11.1, 取12。
以a=0.05,b=0.10,n1=k-1=3-1=2,n2=k(n-1)=3(12-1)=33,查附表18得j=2.63,代
入教材公式(36-3)得
n(2)=(2.632´61.98/3)/(23.66/2)=12.1, 取13。
两次计算结果相近,故每组需要13个样品,三组共需39例。
5. 慢性肾炎治疗采用常规治疗方法的控制率为30%。先试验某新药,其控制率要求达到50%即可认为新药比常规药物疗效好。若规定a=0.05,b=0.10,至少需要多少病例可以发现两种药物疗效不同?
解:是样本率与已知总体率比较的样本含量估计。 由于a=0.05(双侧),b=0.20(单侧),故u0.05/2=1.96;u0.10=1.282;将其与p0=0.3,d=p1-p0=0.5-0.3=0.2代入教材公式(36-4)得
2
(1.96+1.282)n=0.3(1-0.3)2
0.2
=55.2, 取56。
55
暨南大学医学院医学统计学教研室
6. 某医师用A、B两药治疗慢性萎缩性胃炎患者,预试验中得到A药显效率为60%,B药显效率为85%。拟进一步正式试验,取a=0.05,b=0.20,若要得出药效有差别的结论,每组需要观察多少例患者?
解:是两独立样本率比较的样本含量估计。 由于a=0.05(双侧),b=0.20(单侧),故u0.05/2=1.96;u0.20=0.842;将其与p1=0.85, p2=0.60代入教材公式(36-5)得
1.96+0.842æö
n1=n2=1641.6´ç-1 ÷=47.7, 取48。-1
0.85-sin0.60øèsin
故每组需要观察48例患者,两组共需96名患者。
也可使用查表法:附表19(2) 两样本率比较所需样本含量(双侧)
本例较小率大于50%,则计算q=1-p,d=|q1-q2|,用q1、q2的较小者为较小率查表。 本例较小率(%)是1-85%=15%,两组率之差(%)是d=|q1-q2|=|40-15|=25。表中每个较小率对应有三行数据,上行为a=0.05,1-b=0.80。结果为48例(如果选定a=0.05,1-b=0.90,则结果为64例)。
2
56
因篇幅问题不能全部显示,请点此查看更多更全内容