一、教学大纲要求
〔一〕掌握内容 1.方差分析根本思想
〔1〕 多组计量资料总变异的分解,组间变异和组内变异的概念。 〔2〕 多组均数比拟的检验假设与F值的意义。 〔3〕 方差分析的应用条件。 2.常见实验设计资料的方差分析
〔1〕完全随机设计的单因素方差分析:适用的资料类型、总变异分解〔包括自由度的分解〕、方差分析的计算、方差分析表。
〔2〕随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解〔包括自由度的分解〕、方差分析的计算、方差分析表。
〔3〕多个样本均数间的多重比拟方法: LSD-t检验法;Dunnett-t检验法;SNK-q检验法。 〔二〕熟悉内容
多组资料的方差齐性检验、变量变换方法。 〔三〕理解内容
两因素析因设计方差分析、重复测量设计资料的方差分析。
二、教学内容精要
(一) 方差分析的根本思想 1. 根本思想
方差分析〔analysis of variance,ANOVA〕的根本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和〔sum of squares of deviations from mean,SS〕和自由度分解为两个或多个局部,除随机误差外,其余每个局部的变异可由某个因素的作用〔或某几个因素的交互作用〕加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对各组均数有无影响。
2.分析三种变异
〔1〕组间变异:各处理组均数之间不尽一样,这种变异叫做组间变异〔variation among groups〕,组间变异反映了处理因素的作用〔处理确有作用时 〕,也包括了随机误差〔 包括个体差异及测定误差 〕, 其大小可用组间均方〔MS组
间
〕表示,即 MS组间= SS组间/组间 , 其中,SS组间=
n(xii1kix)2 ,组间=k-1为组间自由度。k表示处理组数。
〔2〕组内变异:各处理组内部观察值之间不尽一样,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (MS组内) 表示, MS组内SS组内/组内 ,其中SS组内ni(xijxi)2, i1j1k组内Nk,为组内均方自由度。
〔3〕总变异:所有观察值之间的变异〔不分组〕,这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS总 )。按方差的计算方法,MS总= SS总/总 ,其中SS总=为第i组例数,总=N-1为总的自由度, N表示总例数。
〔二〕方差分析的应用条件
(1) 各样本是互相的随机样本,且来自正态分布总体。 (2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。 〔三〕不同设计资料的方差分析 1.完全随机设计的单因素方差分析
(xi1j1kniijx)2, k为处理组数,ni〔1〕资料类型:完全随机设计(completely random design)是将受试对象完全随机地分配到各个处理组。设计因素中只考虑一个处理因素,目的是比拟各组平均值之间的差异是否由处理因素造成。
(2) 方差分析表:见表5-1。FF时,回绝H0: 来源
组间
12k。
SS SS组间
表5-1 完全随机设计方差分析计算表
MS F值
组间k1
MS组间=
SS组间
组间SS组内F=
MS组间MS组内
组内 (误差) 总计
SS组内=SS总 - SS组间
组内=总-组内=N- k
MS组内=
组内 SS总
总= N - 1
2.随机区组设计的两因素方差分析
〔1〕资料类型:随机区组设计〔randomized block design〕是将受试对象按自然属性〔如实验动物的窝别、体重,病人的性别、年龄及病情等〕一样或相近者组成单位组〔区组〕,然后把每个组中的受试对象随机地分配给不同处理。设计中有两个因素,一个是处理因素,另一个是按自然属性形成的单位组。单位组的选择原那么是“单位组间差异越大越好,单位组内差异越小越好〞。 〔2〕方差分析表:见表5-2。F处理F时,回绝H0:
变异来源
12MS MS处理=
k。
F值
F处理 =
表5-2 随机区组设计方差分析计算表
SS 处理组间
SS处理
处理= k-1 SS处理处理
MS处理MS误差
单位组间 SS单位
SS误差= SS总- SS处理- SS单位 SS总
单位= b-1
误差=总-处理-单位
=N-k-n+1
MS单位=
SS单位单位误差
F单位 =
MS单位MS误差
误差 总计
MS误差=
SS误差
总 = N-1
3.多个样本均数的多重比拟
假如方差分析结果说明各组间有显著差异,那么需要进一步进展两两比拟,也称均数间的多重比拟〔multiple comparison〕。进展两两比拟的方法主要有:
(1) LSD-t检验:称为最小显著差异t检验。适用于k组中某一对或某几对在专业上有特殊意义的均数间差异的比拟。检验统计量为t值,自由度为方差分析表中的误差自由度,查t界值表。
t(2)
XAXB 其中 SdABSdABMS误差(n1n1) 〔5-1〕
ABDunnett-t检验:它适用于k-1个试验组与一个对照组均数差异的多重比拟,检验统计量为t值,自由
度为方差分析表中的误差自由度,查Dunnet-t界值表。
xix0tSxxi0 ,其中Sxix0=MS误差(11) 〔5-2〕 nin0 〔3〕SNK-q检验:在方差分析结果回绝H0时采用。适用于所有组均数的两两比拟。检验统计量为q,自由度为比拟组数a和方差分析表中的误差自由度,查q界值表。
q4.多组资料方差起行检验
(XAXB)Sd 其中,SdMS误差2(n1An1B) (5-3) 当各组标准差相差较大〔如1.5倍〕时,需检验资料是否满足方差齐性的条件。 5. 变量变换
当资料不能满足方差分析的条件时,假如进展方差分析,可能造成错误的判断。因此对于明显偏离上述应用条件的资料,可以通过变量变换的方法来加以改善。常用的变量变换方法有:
〔1〕对数变换 对数变换不仅可以将对数正态分布的数据正态化,还能使数据方差到达齐性,特别是各样本的标准差与均数成比例或变异系数接近于一个常数时。变换公式为:
XlgX (5-4)
当原始数据中有小值或零时,可用Xlg(X1)
〔2〕平方根变换 常用于使服从Possion分布的计数资料或轻度偏态的资料正态化;当各样本的方差与均数呈正相关时,可使资料到达方差齐性。变换公式为:
X当原始数据中有小值或零时,可用XX (5-5)
X0.5
X1/X (5-6)
〔3〕倒数变换 常用于数据两端波动较大的资料,可使极端值的影响减小。变换公式为:
〔4〕平方根反正弦变换 常用于服从二项分布的率或百分比资料。一般地,当总体率较小〔<30%〕或较大〔>70%〕时,通过平方根反正弦变换,可使资料接近正态,且到达方差齐性的要求。变换公式为:
XsinX (5-7) 〔5〕秩转换后,采用秩和检验比拟组间差异〔祥见第九章〕。 6.两因素析因设计方差分析
处理含有两因素两程度的全面组合。例如治疗肿瘤术后病人,可采用4种方法:既不放疗也不化疗〔a0b0〕;放疗不化疗〔a1b0〕;不放疗化疗〔a0b1〕;既放疗又化疗〔a1b1〕。设放疗为A因素〔两程度〕,化疗为B因素〔两程度〕,那么构成22析因设计,目的是分析A的主效应,B的主效应及AB的交互作用。
7.重复测量资料的方差分析
受试对象随机分组后,屡次测量某一观察指标,以比拟处理效应在不同时间点有无变化。如试验组和对照组的轻度高血压病人入院前、治疗后1天、2天、3天、4天的血压变化。设处理分组为A因素,重复测量的时间点为B因素,目的是分析A的主效应和AB的交互作用。
1三、典型试题分析
1.完全随机设计资料的方差分析中,必然有〔 〕
A.SS组内 方差分析时总变异的来源有:组间变异和组内变异,总离均差平方和等于组间离均差平方和与组内离均差平方差之和,因此,等式SS总=SS组间+SS组内是成立的。离均差平方和除以自由度之后的均方就不再有等式关系,因此C选项不成立。A、B选项不一定成立。D选项为正确答案。 2.单因素方差分析中,当P时,可认为〔 〕。 A.各样本均数都不相等 B.各总体均数不等或不全相等 C.各总体均数都不相等 D.各总体均数相等 答案:B [评析] 此题考点:方差分析的检验假设及统计推断。 方差分析用于多个样本均数的比拟,它的备择假设〔H1〕是各总体均数不等或不全相等,当P时,承受H1,即认为总体均数不等或不全相等。因此答案选B。 3. 以下说法中不正确的选项是〔 〕 A.方差除以其自由度就是均方 B.方差分析时要求各样本来自互相的正态总体 C.方差分析时要求各样本所在总体的方差相等 D.完全随机设计的方差分析时,组内均方就是误差均方 答案:A [评析] 此题考点:方差分析的应用条件及均方的概念。 方差就是标准差的平方,也就是均方,因此选项A是错误的。选项B、C是方差分析对资料的要求,因此选项B和C都是正确的。在完全随机设计的方差分析中,组内均方就是误差均方,D选项也是正确的。 4. 当组数等于2时,对于同一资料,方差分析结果与t检验结果〔 〕 。 A.完全等价且F = t B.方差分析结果更准确 C.tt 答案:D F [评析]此题考点:方差分析与t检验的区别与联络。 对于同一资料,当处理组数为2时,t检验和方差分析的结果一致且t 5. 完全随机设计与随机单位组设计相比拟〔 〕。 答案:C。 [评析]:此题考点:两种设计及其方差分析的区别。 两种设计不同,随机区组设计除处理因素外,还考虑了单位组因素。进展方差分析时,变异来源多分解出一项:单位组间变异。因此C选项为正确答案。 F,因此,正确答案为D。 四、习 题 (一) 名词解释 1.均方 2.方差分析根本思想 3.总变异 4.组间变异 5.组内变异 6.完全随机设计 7.随机区组设计 (二) 单项选择题 1. 两样本均数的比拟,可用〔 〕。 A.方差分析 B.t检验 C.两者均可 D.方差齐性检验 2.配伍组设计的方差分析中,配伍等于〔 〕。 A.总-误差 B.总-处理 C.总-处理+误差 D.总-处理-误差 3.在均数为μ,标准差为σ的正态总体中随机抽样,|σ B.1.96 C.t0.052,s D. x X|〔 〕的概率为5%。 t0.052,sx 4.当自由度〔1,2〕及显著性水准都一样时,方差分析的界值比方差齐性检验的界值〔 〕。 A.大 B.小 C.相等 D.不一定 5.方差分析中变量变换的目的是〔 〕。 A.方差齐性化 B.曲线直线化 C.变量正态化 D.以上都对 6.下面说法中不正确的选项是〔 〕。 A.方差分析可以用于两个样本均数的比拟 B.完全随机设计更合适实验对象变异不太大的资料 C.在随机区组设计中,每一个区组内的例数都等于处理数 D.在随机区组设计中,区组内及区组间的差异都是越小越好 7.随机单位设计要求〔 〕。 A.单位组内个体差异小,单位组间差异大 B.单位组内没有个体差异,单位组间差异大 C.单位组内个体差异大,单位组间差异小 D.单位组内没有个体差异,单位组间差异小 8.完全随机设计方差分析的检验假设是〔 〕。 A.各比照组样本均数相等 B.各比照组总体均数相等 C.各比照组样本均数不相等 D.各比照组总体均数不相等 9.完全随机设计、随机区组设计的SS和及自由度各分解为几局部〔 〕。 A.2,2 B.2,3 C.2,4 D.3,3 10.配对t检验可用哪种设计类型的方差分析来替代〔 〕。 A.完全随机设计 B.随机区组设计 C.两种设计都可以 D.AB都不行 〔三〕简答题 1.t检验和方差分析的应用条件? 2.如何合理选择检验水准? 3.以t检验为例,说明检验假设中和P的区别。 〔四〕计算题 1.某湖水在不同季节氯化物含量测定值如表5-3所示。问不同季节氯化物含量有无差异?假设有差异,进展32个程度的两两比拟。 表5-3 某湖水不同季节氯化物含量〔mg/L〕 春 22.6 21.0 ij夏 159.3 8 秋 8 冬 8 32 Xni 167.9 8 Xi X 2ij s2i 2.根据表5-4资料说明大白鼠感染脊髓灰质炎病毒后,再做伤寒或百日咳接种是否影响生存日数?假设结论为“有 影响〞,请做多重比拟〔与对照组比〕。 表5-4 各组大鼠接种后生存日数 伤寒 5 7 8 9 9 10 10 11 11 12 ij百日咳 6 6 7 8 8 9 9 10 10 11 84 10 732 对照 8 9 10 10 10 11 12 12 14 16 112 10 1306 288 30 2924 Xni 92 10 Xi X2ij886 s2i 3.有三种抗凝剂〔A1,A2,A3〕对一标本作红细胞沉降速度〔一小时值〕测定,每种抗凝剂各作5次,问三种抗凝剂对红细胞沉降速度的测定有无差异? A1:15 11 13 12 14 A2:13 16 14 17 15 A3:13 15 16 14 12 4.用Dunnett-t 法检验下表中四个处理组均数与对照组的均数的差异。 表5-5 家免脑损伤后大脑左半球组织水含量〔%〕 试验分组 对照〔未损伤〕 损伤后0.5小时 损伤后3小时 损伤后6小时 治疗组 n 8 5 5 8 9 Xi S 5.将36只大白鼠按体重相近的原那么配为12个单位组,各单位组的3只大白鼠随机地分配到三个饲料组。一个月后观察尿中氨基氮的排出量〔mg〕。经初步计算,SS总162,SS饲料8,SS误差110。试列出该实验数据的方差分析表。 6.将18名原发性血小板减少症患者按年龄相近的原那么配为6个单位组,每个单位组中的3名患者随机分配到A、B、C三个治疗组中,治疗后的血小板升高见表5-6,问3种治疗方法的疗效有无差异? 表5-6 不同人用鹿茸草后血小板的升高值 〔104/mm3〕 年龄组 1 2 3 4 5 6 A B C 7.某研究人员以0.3ml/kg剂量纯苯给大鼠皮下注射染毒,每周3次,经45天后,使实验动物白细胞总数下降至染毒前的50%左右,同时设置未染毒组。两组大鼠均按照是否给予升高白细胞药物分为给药组和不给药组,试验结果见下表,试作统计分析。 表5-7 试验效应指标〔吞噬指数〕数据 未染毒组 不给药 给药 染毒组 不给药 给药 五、 习题答题要点 (一) 名词解释 1.均方:均方差〔MS〕或方差,是由离均差平方和被自由度相除而得。 2.方差分析:方差分析〔analysis of variance,ANOVA〕就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个局部,除随机误差外,其余每个局部的变异可由某个因素的作用〔或某几个因素的交互作用〕加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。 3.总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方〔方差〕表示。 4.组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其大小可用组间均方表示。 5.组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 6.完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应,这种设计叫做完全随机设计。 7.随机区组设计:事先将全部受试对象按自然属性分为假设干区组,原那么是各区组内的受试对象的特征一样或相近,且受试对象数与处理因素的程度数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。 (二) 单项选择题 1.C 2 〔三〕 简答题 1. t检验和方差分析均要求各样本来自互相的正态总体且各总体方差齐。 2.设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。 3.以t检验为例,和P都是用t分布尾部面积大小表示,所不同的是:表示I型错误的概率,即H0为真而被错误地回绝的概率值。是在统计分析时,根据I型错误危害的大小,预先规定的,即规定统计结果为“承受 H1” 时的误判率的界限值为〔即检验水准〕。P值是由实际样本得出的统计结果为“承受 H1” 时误判率。根据P与的大小关系作出“不回绝H0”或“回绝H0”的统计推断。 〔四〕计算题 1.完全随机设计单因素芳差分析 解:H0:4个季节湖水中氯化物含量相等,即μ1=μ2=μ3=μ4 H1:4个季节湖水中氯化物含量不等或不全相等。 α=0.05 C(Xij)2/n588.42/3210819.205 SS总X2ijC11100.8410819.205281.635 SS组间[(Xij)2/ni]C(167.92159.32131.92129.32)/810819.205 141.170SS组内SS总SS组间281.635141170140.465 表5-8 方差分析表 变异来源 总变异 组间变异 组内变异 查F界值表,F0.05,3,28SS 281.635 31 3 28 MS F 2.95。因F>F0.05,3,28所以P<0.05。按α=0.05水准,回绝H0,承受H1,认为不同季节湖水 中氯化物含量不同或不全一样。 用SNK-q检验进展各组均数间两两比拟。 H0:任意两比照组的总体均数相等,μA=μB H1:μA≠μB α=0.05 表5-9 四个样本均数顺序排序 组别 Xi 位次 春 20.99 1 夏 19. 91 2 秋 16.49 3 冬 16.16 4 表5-10 四组均数两两比拟q检验 比照组 1 , 4 1 , 3 1 , 2 2 , 4 2 , 3 3 , 4 两均数之差 4. 83 4. 50 1. 08 3. 30 3. 42 0. 33 组数 4 3 2 3 2 2 q值 6. 099 5. 682 1.3 4. 735 4. 319 0. 417 P值 <0.01 <0.01 <0.01 <0.01 春与夏、秋与冬湖水中氯化物含量P,按α=0.05水准,不回绝H0,即不能认为春与夏、秋与冬季湖水中氯化物含量有差异。而其它4组均有P<0.01,按α=0.05水准,回绝H0,承受H1,即认为春夏两季湖水中氯化物含量高于秋冬两季。 2.完全随机设计单因素芳差分析 H0:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等. H1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等. α=0.05 C(Xij)2/n2882/3027.8 SS总X2ijC292427.8159.2 SS组间[(Xij)2/ni]C(9284112)/1027.841.6SS组内SS总SS组间159.241.6117.6 表5-11 方差分析表 222 变异来源 总变异 组间变异 组内变异 查F界值表,F0.05,2,27 SS 29 2 27 MS F 3.35。因F 〉F0.05,2,27得P ,按α=0.05水准,回绝H0,承受H1,认为大白鼠感染脊 髓灰质炎病毒后,再接种伤寒或百日咳菌苗对生存日数有影响. 用Dunnet-t检验方法进展均数间多重比拟: H0:任一组与对照组总体均数一样 H1:任一组与对照组总体均数不同 α=0.05 由Dunnett-t检验公式,伤寒与对照组比拟: tX1X0MS误差(1/n11/n2) (9.2-11.2)/4.36(1/101/10)2/0.932.14=27,查Dunnett-t检验界值表,得P。按α=0.05水准,回绝H0,承受H1,故可认为接种伤寒菌苗组较对照组生存百日咳与对照组比拟: 日数减少。 t百对(8.411.2)/4.36(1/101/10)2.99 =27,查Dunnett-t检验界值表,得P,按α=0.05水准,回绝H0,承受H1,认为接种百日咳菌苗组较对照组生存日3.完全随机设计资料方差分析 H0:三种抗凝剂所作血沉值之间没有差异 H1:三种抗凝剂所作血沉值之间存在差异 数减少。 α=0.05 表5-12 方差分析表 MS 14 2 5 12 变异来源 总变异 组间变异 组内变异 查F界值表,F0.05,2,12SS 40 10 30 F 2 3.88, 所以P>0.05,按α=0.05水准,不能回绝H0。即尚不能认为三种抗凝剂所作血沉值之 2间有差异。 4.首先计算误差均方 SS误差(ni1)si12.3086(81)0.432(51)0.682(51)0.662(81)0.752(91)0.662 误差N-k35-530 MS误差SS误差/误差12.3086/300.4103 〔1〕 损伤后小时与对照组比 H0:损伤后小时与对照组组织含水量相等 H1:损伤后小时与对照组组织含水量不等 α=0.05 t79.6578.8611 0.4103()852.16以误差30,处理数=4查Dunnett-t界值表,得界值2.25,因t=2.16<2.25, 所以P>。在α=0.05水准上,不回绝H0, 尚不能认为损伤后小时与对照组组织含水量有差异。 〔2〕损伤后3小时与对照组比 H0:损伤后3小时与对照组组织含水量相等 H1:损伤后3小时与对照组组织含水量不等 α=0.05 t79.7778.86110.4103()852.49 因t〔界值〕,故P。在α=0.05水准上,回绝H0,认为损伤后3小时与对照组的组织含水量有差异。 〔3〕损伤后6小时与对照组比 H0:损伤后6小时与对照组组织含水量相等 H1:损伤后6小时与对照组组织含水量不等 α=0.05 t80.9478.86110.4103()886.49 因t〔界值〕,故P。在α=0.05水准上,回绝H0,认为损伤后6小时与对照组的组织含水量有差异。 〔4〕治疗组与对照组比 H0:治疗组与对照组组的织含水量相等 H1:治疗组与对照组的组织含水量不等 α=0.05 t79.6178.86110.4103()2.41 因t〔界值〕,故P。在α=0.05水准上,回绝H0,认为治疗组与对照组的组织含水量有差异。 5.随机去组设计方差分析,总例数N=36,处量组数k=3,区组数n=12。 计算:SS区组SS总SS饲料SS误差162811044 v总N136135 v饲料k1312 v区组n112111 v误差Nkn136312122 根据计算结果填写方差分析表,见表5-11。 表5-13 方差分析表 MS F 2 4 11 4 22 5 35 变异来源 处理间 区组间 误差 总变异 SS 8 44 110 162 P 6.解:这两组资料用随机区组的方差分析为宜。 〔1〕处理组间比拟 H0:不同治疗组血小板升高值一样 H1:不同治疗组血小板升高值不全一样 α=0.05 〔2〕年龄组间比拟 H0:不同年龄组血小板升高值一样 H1:不同年龄组血小板升高值不全一样 α=0.05 〔3〕计算,列方差分析表 变异来源 总变异 组间 区组间 误差 表5-14 方差分析表 SS MS 17 2 5 10 F 查F界值表,F0.05,2,104.10,F0.05,4,103.48, 因此,组间及区组间均为P。按α=0.05水准,回绝H0,可认为不同治疗组间血小板升高值不一样,不同年龄组患者血小板升高值也不一样。 7.设A因素为染毒〔2程度〕, B因素为药物〔2程度〕,做22表析因设计方差分析。结果见表5-15。 变异来源 总变异 染毒 药物 染毒 * 药物 误差 查F界值表,F0.01,1,168.68, 因此,药物组间P1。按α=0.01水准,认为给药组和不给药组吞噬指数不一样。 〔赵清波 张玉海〕 表5-15 方差分析表 SS MS 19 9 1 9 1 1 14 0.148 16 9 F 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务