y平均变化b个单位。 70、残差平方和/剩余平方和:指除x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分变异,用以表示考虑回归关系后,y的随机误差。 71、直线相关:用于双变量正态分布资料,有正、负、零相关。是用来描述具有直线关系的两变量x,y间的相互关系。 72、零相关:指两个变量间没有直线相关关系。 73、直线相关系数:也称Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。以符号r表示样本相关系数,ρ表示总体相关系数。
74、决定系数:即相关系数的平方,用R表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公
式为R= 。 75、医学统计学:应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门科学。 76、正常人:不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。 1、标准差和标准误有何区别与联系?它们各有什么用途? ①区别:标准差,是描述资料离散程度的指标;标准误,是说明均数抽样误差的大小的指标,它反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异。②联系: 均数的标准误与标准差成正比,而与样本例数n的平方根成反比,若标准差固定不变,可通过增加样本含量来减少抽样误差。③用途:标准差,用于描述一组资料的离散程度,还可用于估计正常参考值范围;标准误,用于描述资料的抽样误差的大小,还可用于估计资料的可信区间。 2、为什么要进行抽样研究?抽样时为什么会产生抽样误差? 抽样研究就是从总体中随机抽取一个样本,用样本的信息推断总体特征。因为个体变异的存在,随机抽样就会引起样本统计量与总体参数间的差异,就产生了抽样误差。在抽样研究中,抽样误差是不可避免的。 3、为什么要作r和b的假设检验? r和b与其它统计量一样,即使从总体回归系数β和总体相关系数ρ中做随机抽样,由于抽样误差的存在,其样本回归系数b和样本相关系数r也不全为0,故求得一个样本回归系数和相关系数后,仍需进行回归系数β和相关系数ρ为0的假设检验。 4、两个样本率的u检验和四格表的x检验有何异同? 区别:①两个样本率的u检验主要是通过在两个总体中分别进行抽样所得的样本率P和P来推断总体率л和
л是否相等。②四格表x检验是推断两个总体率或构成比是否有差别,两个分类变量间有无相关关系。③x
检验可用于2×2列联表资料有无关联的检验。相同点:①两个样本率的u检验和四格表的x检验关系:u=x
即凡是能使用u检验进行两个率比较检验的资料,都可使用x检验,两者是等价的。②二者都存在连续性校正的问题。 四格表的u检验和x检验有何关系?当样本例数足够大时,x检验的结论与产检验等效。 5、在进行直线回归分析时,应按哪些步骤进行,才不易犯统计学方向的错误?(直线回归分析中应注意的问题?) ①作回归分析一定要有实际意义;②回归分析之前首先应绘制散点图;③考虑建立线性回归模型的基本假定:理论上讲,按最小二乘估计回归模型应满足:线性、、正态和方差齐性(LINE)等条件;④取值范围,避免外延;⑤两变量间的直线关系不一定是因果关系,也可能是伴随关系。 6、什么叫抽样误差?如何度量抽样误差的大小?怎样减少抽样误差? ①由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。②抽样误差由标准误来表示, , 越大,表明抽样误差越大; 越小,抽样误差越小。③由标准误的公式可知,要减少抽样误差,只有增加样本含量。 7、LSD-t检验和Duncan检验和SNK-q检验都可用于均数间的多重比较,它们有何不同? ①q检验:用于多个样本均数间每两个作比较,公式为 ;②最小有意义差异法(LSD法):用于对照组与各处理组的比较,公式为 ;③新复极差法(Duncan新法):用于对照组与各处理组比较,公式为 。 8、均数的可信区间和参考值范围有何不同? 区别点:均数的可信区间 参考值范围 意义:按预先给定的概率确定的未知参数 “正常人”的解剖、生理、生化 的可能范围,实际上一次抽样获得 某项指标的波动范围。 的可信区间要么包括可信区间,要 么不包括。 计算公式: σ未知: 正态分布: σ已知或σ未知,n﹥50: 偏态分布: 用途: 估计总体均数。 判断观察对象的某项指标正常与否。
9、X检验的应用条件有哪些? X检验用来推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。 10、参数检验与非参数检验的区别在何处?优缺点?(秩和检验的优缺点是什么?) 区别:①参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。②非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。 优、缺点:①参数检验:优点是符合条件时,检验效率高;缺点是对资料要求严格,如等效数据、非确定数据(如﹥50mg),不能使用参数检验,而且要求资料的分布型已知和总体方差相等。 ②非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检
验效率底于参数检验。如无效假设是正确的,非参数检验与参数检验等同,但如果无效假设是错误的,则非参
数检验效果差,如需检验出同样大小的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一分布,检验的界值表也是近似的(如配对秩和检验),因此其结果有一定近似性。
11、秩相关适用条件? 不服从双变量正态分布,不宜从而得知只矩相关分析的资料;总体分布型未知;原始数据用等级表示的资料。
12、均数、几何均数和中位数的适用范围是什么? ①均数:描述一组同质计量资料的平均水平,其分布特征为正态分布或近似正态分布,图形为单峰对称图型;②几何均数:描述原始观察值呈偏态分布,但经对数变换后呈正态分布或近似正态分布的资料或等比资料;③中位数:适用于偏态分布、分布不明的资料。 13、值变量资料频数表的组段是否越细越好? 不是。制作频数表是为了简化资料,显示出数据的分布规律,故组段不宜过多。组段过多,计算较繁,组段太少,则误差较大,会掩盖数据的分布规律,适宜的组段与观察值个数n有关,一般以10-15为宜。 14、怎样正确使用单侧检验和双侧检验? 一种检验方法是用单侧还是双侧检验,若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果,拟用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验,一般认为双侧检验较保守和稳定。 15、直条图、圆图、普通线图各适用于何种资料? 直条图(条图):适用于比较分析的或离散变量的多个组或多个类别的统计指标。圆图和百分比条图:适用于描述分类变量的各类别所占的构成比。普通线图(线图):适合于描述统计量随另一连续性数值变量变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。直方图:数值变量的频数分布。散点图:相关,双变量。箱式图:偏态分布的资料。统计地图:研究指标的地理分布。 16、对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准? 既不能一律宣称参数检验的结论可信轻易拒绝非参数检验的结果;也不能依哪个有显著性就选哪个;更不能随研究者主观愿望取舍检验的结果。要根据被处理资料是否满足该种检验方法的应用条件,在符合参数检验条件时,若两法检验结果不一致时,可接受参数检验的结论。以t检验为例,如总体分布为极度偏态或其它非正态形状,或者根本不知总体分布形状,此时若使用t检验,有关总体的基本假定得不到满足,故任何根据这些假定所进行的推断亦难达到准确,再用参数检验的界值判断检验假设就不适宜了。此时参数检验与非参数检验结果不一致,可接受非参数检验的结论。 17、1978年秋,某大学考生录取情况如下表。有人据此批评说:“该大学考生录取百分率男生明显高于女生。”校方不同意此看法,但找不到依据。你能用统计学方法协助解决以上争议吗?(不必计算) 是由于6个专业考生男女构成比不同。应先将6个专业的男女生选定统一标准进行标化,标化之后再求录取率才具有可比性。 18、贝努利试验序列的条件/特点是什么?(服从二项分布的条件是什么?) ①每次试验的结果只能是两种互斥结果中的一种(A或者非A);②各次试验的结果互不影响,即各次试验;③在相同试验条件下,各次试验中出现某一结果A具有相同的概率л(非A的概率为1-л)。 二项分布的应用:样本率及其概率分布列;总体率的区间估计;单个总体率的假设检验;两个总体率的假设检验。 19、相关系数和回归系数有什么区别和联系? 区别:①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。②应用上:说明两变量间依存变化的数量关系用回归;说明变量间的相关关系用相关。③意义上: b表示X第增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间相关关系的密切程度与相关方向。④计算上:b= ,r= 。⑤取值范围: ; 。⑥单位:b有单位,r没有单位。 联系:①对一组数据若同时计算b和r,它们的正负号一致。②b和r的假设检验是等价的。③用回归解释相
关,回归平方和越接近总平方和,则r越接近1,说明引入相关的效果越好。
20、多个样本均数间的比较为什么不能用t检验?(有人说,多个样本均数间的比较无非就是做若干次的t检验,您的看法如何?) 多个样本均数间的比较如果用t检验,会增加犯第一类错误的概率,即可能把本来无差别的两个总体均数判为有差别。 21、t检验要求什么基本条件? σ未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。 u检验的应用条件:σ未知但n足够大(如n﹥100)或σ已知。 22、同一资料的标准差是否一定小于均数? 不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。 23、极差、四分位间距、标准差、变异系数的适用范围有何异同? 相同点:四者都是描述资料的离散趋势的指标。 不同点:极差是最简单又较粗略的指标,可以用于各种分布的资料,常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料的变异程度。四分们间距常用于描述偏态分布资料,两端无确切值或分布不明确资料的离散程度。标准差描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数,为标准差与均数之比,用于比较计量单位不同的几组资料的离散程度或均数相差悬殊的几组资料的离散程度。 24、用什么方法考察回归直线图示是否正确? ①直线必须通过点( , )。②若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵从标必等于截距α。③直线是否在自变量X的实测范围内。 25、r与rs的应用条件有何不同? 积差相关系数r用于描述双变量正态分布资料的相关关系。
等级相关系数rs适用于下列资料:①不服从双变量正态分布而不宜作积差相关分析的资料。②总体分布型未知的资料。③原始数据是用等级表示的资料。 26、直线回归分析时怎样确定因变量和自变量? Ⅰ型回归中,X为精密测定和严格控制的变量,Y为正态变量;Ⅱ型回归中,X、Y均服从正态分布。何者为X,误,可取较大的а值,常用а=0.10,а=0.20。 41、检验假设中а和P的区别何在? 以t检验为例,а和P都是用t分布尾部面积大小表示,所不同的是:а值,即检验水准,是指在统计推断时,预先设定的一个小概率值,就是说如果H0是真的,允许它错误地被拒绝的概率。P值是由实际样本规定的,它给人的概念是实际资料怎样与H0相矛盾,P值是指在H0成立的前提下,出现等于或大于现有检验统计量的概率。
根据P与а的关系来决定对H0的取舍,做出统计推断的结论。 42、配对比较的t检验与配伍组比较的方差分析之间的关系如何?两样本均数比较的t检验与成组设计多个样本均数比较的方差分析之间的关系如何? 配伍组比较的方差分析是配对比较t检验的推广,它们的基本原理相同。成组设计多个样本均数比较的方差分析是两样本均数比较的t检验的推广,当两组比较时,它们是等价的。不管配伍组还是成组设计,当对比样本为两组,可用t检验或方差分析,当对比样本在两组以上,只能用方差分析,而不能用t检验。 43、要使直线回归方程稳定性好,应当怎样做? 回归方程的稳定程度决定于b的波动大小,即S的大小,S的大小不仅取决于表示随机因素对Y影响程度的S,而且取决于观测数据中X的波动范围及样本含量n的大小,S越小,建立方程时X的取值范围越大,样本含量n越大,则b越稳定,从而此回归方程也越稳定。 44、相关分析应用中应注意的问题? ①相关分析资料要求x,y都应是来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图。只有散点图有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。欲解释两变量间依存变化的数量关系,只能采用回归分析。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两变量间相关的程度,
样本含量必须足够大。尤应注意,若两变量间相关系数r具有统计学意义,但r较小时,下结论要慎重。 45、直线回归的应用? ①直线回归方程可用来描述两分析变量间依存变化的数量关系②利用回归方程进行预测预报③用容易测量的指标估计不易测量的指标④利用回归方程获得精度更高的医学参考值范围⑤利用回归方程进行统计控制。 46、等效检验应注意的问题? 何者为Y,根据研究目的确定。 27、中位数与百分位数在意义上、计算和应用上有何区别与联系? ①意义:中位数是百分位数中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位数是P即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。②计算:中位数和百分位数均可用同一公式计算,可根据研究目的选择不同的百分位数代入公式进行计算分析。③应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可用来描述变量值的离散趋势(四分位数间距)。 28、测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? ①样本含量的大小,样本含量大,标准差越稳定。②分组的多少。③分布形状的影响,偏态分布的标准差较近似正态分布大。④随机测量误差大小的影响。⑤研究总体中观察值之间变异程度的大小。 29、正态分布、标准正态分布与对数正态分布在概念上和应用上有何异同? ①概念上:相同点:三者都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。相异点:表示方向不同,正态分布用N(μ,б)表示,标准正态分布用N(0,1)表示,对数正态分布用N( )表示。②应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布。相异点:标准正态分布是标准正态变量μ的分布,标准正态曲线下的面积唯一的由μ决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。 30、医学中参考值范围的含义是什么?确定的原则和方法是什么? ①含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等各种数据绝大多数人的波动范围。②原则:⑴抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。⑵对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。⑶判定是否要分组(如男女、年龄、地区等),确定正常值范围。⑷决定取双侧范围值还是单侧范围值。⑸选择适当的百分范围。⑹确定可疑范围。⑺估计界值。③方法:⑴百分位数法: ⑵正态分布法(对数正态分布法):双侧
单侧 百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。 31、对称分布资料在 “均数 1.96倍标准差“的范围内,也包括95%的观察值吗? 不一定。均数 1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。 32、常用的相对数指标有哪些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。 常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:①率又称频率指标,它说明某现象发生的频率和强度。常用百分率、千分率、万分率或十万人率等表示,公式为:率=某时间内实际发生某现象的观察单位数/同时期可能发生某现象的观察单位总数×K。例如,某病患病率常用百分率或千分率,婴儿死亡率常用千分率,死因别死亡率常用十万分率等。②构成比说明事物内部各部分所占的比重。常用百分数表示,公式为:构成比=某一组成部分的观察单位数?同一事物各组成部分的观察单位总数×100%。例如脑血管疾病在某地5咱慢性疾病的构成比为(3805/76)×100%=48.19%,心血管疾病占该5种慢性病总数的比重为(1365/76)×100%=17.29%。③相对比说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数、相对数或平均数;可以性质相同,例如不同年份某地某病死亡率之比,也可以性质不同,例如某医院医护人员数与病床数之比。公式为:相对比=甲指标/乙指标(或×100%)
构成比与率所说明的问题是不同的,构成比说明事物内部各部分所占的比重,不能说明某再象的发生强度或频率大小。因此,在分析时不能用构成比代替率。 33、应用相对数的注意事项? ①计算相对数尤其是率时应有足够数量的观察单位数或观察次数②分析时不能以构成比代替率③应分别将分子和分母合计求合计率或平均率④相对数的比较应注意其可比性⑤样本率或构成比比较时应作假设检验。⑥两个总体率进行比较时,要注意使用率的标准化法。 34、非参数检验适用哪些情况? ①等级顺序资料。②偏态分布。当观察资料呈偏态或极偏态分布而又未经变量变换,或虽经变量变换但仍未达到正态分布或近似正态分布时,宜用非参数检验。③未知分布型资料。④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析,有些医学资料由于统计工作量过大,可采用非参数统计方法时行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容。⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。 35、可信区间和参考值范围有何不同? 参考值范围是指同质总体中个体变量值的分布范围。而可信区间是指在可信度为(1—α)时,估计总体参数可能存在的范围。 36、假设检验和区间估计有何联系? 二者都属于统计推断的内容,假设检验推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有二者有机结合起来,互相补充,才是完整的分析。 37、假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么? 其理论依据是:在H0成立的条件下,出于大于、等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次抽样中得到这么小概率的事件是不大可能发生的,因而拒绝它。由此可见,假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。 38、t检验和方差分析应用条件有何异同? ①相同点:在均数比较中, t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机本间相互,尤其在小样本时更需注意。②不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。 39、第一类错误与第二类错误的区别及联系何在?了解两类错误的实际意义? 区别:①Ⅰ型错误:指拒绝了实际上成立的H0,即“弃真”的错误。Ⅰ型错误的概率用а表示。统计推断时,根据研究者的要求来确定。②Ⅱ型错误:指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。β值的大小很难确切估计,只有在已知样本含量n、两总体参数差值δ以及所规定的检验水准а的条件下,才能估算出β值的大小。
联系:①当抽样例数一定时а越大,β越小;反之,а越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,n一定时,可通过确定а水平来控制β的大小。
意义:①可用于样本含量的估计。②可用来计算可信度(1—а),表明统计推断可靠性的大小。③可用于计算把握度(1—β),来评价检验方法的效能等。④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。 40、如何合理设置检验水准? 根据研究目的,结合专业知识和研究设计要求,在未获得样本信息之前决定,而不应受到样本结果的影响。一般在差别的假设检验中,若重点减小Ⅰ型错误,可取较小的а值,常用а=0.05,а=0.01;若重点减小Ⅱ型错
①等效检验目的在于推断两总体率是否等效,须在试验设计时规定检验水准а②两样本率比较的等效检验,两样本率差值必须小于等效界值Δ,Δ值最大不应超过对照组样本率的20%。 47、Poisson分布的性质? Poisson分布的方差等于均数,即б=µ;Poisson分布的可加性。 48、Poisson分布的应用条件? 凡具有同努利试验序列3个特点且л很小,n很大时,其相应的变量一般可认为服从Poisson分布。
49、行×列表X检验注意事项? ①计算X值时,必须用绝对数,不能用相对数。②X检验要求理论频数不宜太小。对于理论频数太小的处理方法:⑴最好增大样本容量,以达到增大理论频数的目的⑵删去理论频数太小的格子所对应的行或列,但这样会损失信息,损害样本的随机性⑶将理论频数太小的行或列与性质相近的邻行或列中的实际频数合并,使重新计算的理论频数增大。(损失的信息比第2种方法小一些)。③关于单向有序行列表,应用秩和检验或Ridit检验。
④当多个样本率(或构成比)比较的X检验,结论为拒绝检验假设,只能认为各总体率之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。 50、应用标准化法的注意事项? ①标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性。但标准化率不代表真正的死亡(或患病、发病)率水平。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需要做假设检验。③一般情况下,在已知被标化组各年龄组死亡率时,宜采且直接法计算标准化率。④当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法。
目的:在于控制混杂因素对研究结果的影响。 51、假设检验的步骤? ①建立检验假设,确定检验水准②计算检验统计量③确定P值,作出统计推断。 1、 同一资料的标准差是否一定小于均数?
答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。
2、 极差、四分位间距、标准差、变异系数的适用范围有何异同?
答:这四个指标的相同点在于均用于描述计量资料的离散程度。不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,则不宜用极差来比较资料的离散程度。四分位间距:适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
3、 x检验用于什么?
答:x检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。
4、四格表的U检验和x检验有何联系? 答:(1)相同点:四格表的u检验的根据是正态近似原理(n足够大,∏和1-∏均不太小)。能用四格表的u
检验进行两个率比较检验的资料,都可以用x检验。四格表的双侧u检验与x检验是完全等价的,两个统计
量的关系为u= x,u= uu检验和卡方检验都存在连续性矫正问题(2)不同点:①正态分布可以确定单、双侧检验界值,满足正态近似条件时,可以使用四格表的单侧u检验。②满足四格表u检验的资料,计
算两率之间的95%可信区间,尚可分析两率之差有无实际意义。③x检验还可以用于配对设计四格表,但这时
推断∏,∏是否有差别的x公式不同。
5.参数检验和非参数检验的区别何在?各有何优缺点?
答:区别:参数检验,其应用条件是已知总体的分布类型,对总体参数进行估计或检验。非参数检验,不依赖总体分布的具体形式,目的在于检验总体分布是否不同。(2)参数检验优点是符合应用条件时,检验效能较高。缺点是对资料要求严格,不能用于等级数据、一端或两端有不确切数据,此外,还要求资料的分布类型已知和总体方差齐等条件。非参数检验优点是应用范围广,计算简便,对资料的要求不高;缺点是若对符合参数检验条件的资料用非参数检验,则会降低检验效能。如需检验出同样大小的差异,非参数检验往往需要更大的样本含量。
6.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得不一致时,宜以何者为准?答:两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择。在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳。如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果。 7.非参数检验适用于哪些情况?
答:①等级资料②偏态资料。当观察资料成偏态或极度偏态而又未经任何变量变换,或虽经变量变换但仍未达到正态或近似正态分布时③总体分布类型未知的资料④要比较的各组资料方差不齐⑤一端或两端有不确定数据。
8.两样本比较的秩和检验,当n>n>10时采用u检验,这时检验是属于参数检验还是非参数检验?为什么?答:两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行u检验,此时利用的并非原始数据,而是经秩变换后的数据,故仍属非参数检验。 9.直线回归分析中应注意哪些问题?
答:做回归分析一定要有专业意义,不能将毫无联系的两个变量作直线回归分析;回归分析之前首先应绘制散点图,考查x与y之间有无直线趋势以及是否存在异常点;考虑是否满足建立线性回归模型的基本假定;直线回归方程的应用与图示一般以自变量x的取值范围为限;两变量的直线关系不一定是因果关系,也可能是伴随关系。
10.简述直线回归与直线相关的区别与联系。
答:区别:①资料要求不同:直线回归中因变量y是来自正态总体的随机变量,而r既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量,②分析目的不同:直线回归用于说明两变量间依存变化的数量关系;直线相关用于说明变量间的直线相关关系。联系:①方向一致:对一组数据计算,r与b,它们的正负号是一致的。②假设检验等价:对同一样本r
和b的假设检验得到的t值相等。③用回归解释相关:由r=SS/SS可知,若回归平方和越接近总平方和,则r越接近于1。
11.简述直线相关、秩相关的区别与联系。
答:区别:①资料要求不同:直线相关要求x、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。②相关意义不同:直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系。联系:相关系数的取值范围相同;秩相关是将原始数据进行秩变换,以秩次计算直线相关系数。
12.均数的可信区间和参考值范围有何不同?
答:均数的可信区间:按一定的概率100(1-α)%(即可信度)估计总体均数所在的范围,得到的范围亦称可信区间。参考值范围:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在着个体差异,生物医学数据并非常数,而是一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。 13秩和检验的优缺点是什么?
答:①不受总体分布,适用面广②适用于等级资料及两端无确定值的资料③易于理解,易于计算。缺点:是对分布类型的广泛适应性,使其很难充分利用资料提供的信息,有时会导致检验效能降低。 14在t检验和u检验时,何种情况下采用单侧检验?
答:单侧检验的备择假设带有方向性,如:m>m0,实际中只可能出现一种情况。双侧检验的备择假设中包含不等号(如:m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。 15.均数、几何均数和中位数的适用范围是什么?
答:均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。(由于均数易受到极端值的影响,故不适用于描述偏态分布资料的集中趋势,只是需采用几何均数或中位数。)几何均数对于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,易用几何均数描述其集中趋势。常用于等比级资料或对数正态分布资料。中位数可用于各种分布的资料。对于正态分布资料,中位数等于均数;对于对数正态分布资料,中位数等于几何均数。由于中位数不受极端值的影响,主要用于偏态分布资料,两端无确切值或分布不明确的资料。
16.标准差和标准误有何区别与联系,他们的用途是什么?
答:标准差:是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。总体标准差用δ表示,样本标准差用s表示。标准误:样本均数的标准差称为标准误。样本均数⊙的总体均数为H,各⊙围绕H的离散程度,可以用样本均数的标准差来描述。用途:标准差用途:①表示变量分布的离散程度②结合均数计算变异系数③结合样本含量计算标准误④结合均数描述分布特征。标准误用途:表示每个样本均数间的变异程度,描述样本均数的抽样误差,即样本均数与总体均数的接近程度,也可称为样本均数的标准差。 A有价值的部分 B有意义的部分 C有代表性的部分 D任意一部分 E典型部分
7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计 B收集资料 C整理资料 D分析资料 E以上均不对 8.统计工作的步骤正确的是 C
A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断
9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对 10.以下何者不是实验设计应遵循的原则 D
A对照的原则 B随机原则 C重复原则 D交叉的原则 E以上都不对 第八章 数值变量资料的统计描述
11.表示血清学滴度资料平均水平最常计算 B
17.统计图制作的一般原则?
答:首先,根据资料性质和分析目的正确选用适当的统计图。其次,除圆图外,一般用直角坐标系的第一象限的位置表示。最后,绘制图形应注意准确、美观,给人以清晰的印象。 18.各种统计图适合于何种资料?
答:描述某连续变量的频数分布宜选用直方图;分析、比较的或不连续的多个组或多个类别的统计量宜选用条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述或比较不同事物内部构成时用圆图或百分比条图等。
19.为什么要做r和b的假设检验?
答:b:即使从总体回归系数β等于零的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为零。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数β是否为零的检验。以推断自变量x与应变量y见是否有直线关系存在。 r:假定从总体相关系数þ=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为零。故此,求得一个样本相关系数r值后,仍需进行总体相关系数þ是否为零的假设检验。 20.服从二项分布的条件是什么?
答:凡具有贝努力试验序列3个特点的变量,一般可认为服从二项分布①每次试验的结果只能是两种互斥的结果中的一种(A或者非A)②各次试验的结果互不影响,即各次试验③在相同试验条件下,各次试验中出现某一结果A具有相同的概率∏(非A的概率1-∏)。 21.相关系数和回归系数有什么区别和联系?
答:直线的斜率称为回归系数,直线相关系数也称积距相关系数,说明具有直线关系的两变量间的相关方向与密切程度。它们的联系——方向一致即r与b正负一致,假设检验等价。区别:资料要求不同,回归系数方程要求服从正态分布,x精确测量严格控制Ⅰ型回归,相关方程要求x,y双重复正态Ⅱ型回归。 22多个样本均数间的比较为什么不能用t检验?
答:多个样本均数的两两比较又称多重比较,其目的是推断究竟哪些总体均数之间存在差别,由于涉及的对比组数大于2,若仍用前述的t检验对两个对比组做比较,会使犯第Ⅰ类错误的概率增大,即可能吧本来无差别的两个总体均数判为有差别,因此,多重比较不宜用t检验分别作两两比较。
23对同一资料,有出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?答:参数检验要求其总体分布为正态分布,总体方差齐性,非参数检验常用解决那些总体分布未知的统计问题,对于同一资料,又出自同一研究目的,采用参数研究还是非参数检验取决于资料的类型。 24.为什么要进行抽样研究?抽样时为什么会产生抽样误差?
答:计量资料的总体中所含的样本数量巨大,要获取资料的总体均数、标准差等数据十分困难,因此医学科学研究中通常采用的抽样研究方法,是指从总体中随机抽取一个样本,用样本信息推断总体特征,这种分析方法称为统计推断。但通常情况下,样本均数(x拔)不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。 25.相关系数的意义?
答:相关系数r没有单位,取值范围为-1≤r≤1。两变量相关的方向用r的正负号表示,即r>0表示正相关;r<0表示负相关。相关系数r的大小表示密切程度,r绝对值越接近1,表示两变量间相关关系密切程度越高。∣r∣=1表示完全相关,∣r∣=0表示无直线相关。 26.方差分析的应用条件?
答:①各样本是相互的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。 27.χ2检验要注意的问题(注意事项)?
答:① 计算χ2 值时必须用绝对数。而不能用相对数,因为χ2 值的大小与频数大小有关。②χ2 检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论频数小于5,或一个格子的理论频数小于1。对理论频数太小有三种处理方法:A 增大样本例数 B 删除理论数太小的行或列 C 合并③当多个样本率(或构成比)比较的χ2 检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说它们彼此间都有差别。或某两者间有差别。 28.非参数检验适用哪些情况?
答:①等级顺序资料。②偏态资料。当观察资料成偏态或极度偏态分布而又未经变量变换未达到正态或近似正态分布时,宜用非参数检验。③未知分布类型资料④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
答:因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。
30.怎样正确使用单侧检验和双侧检验?
答:根据专业知识推断两个总体是否有差别时,是甲高于乙,还是以高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,对结果的考虑以思路较宽为好,也用双侧检验。单侧检验,应以专业知识为依据,他充分利用了另一侧的不可能性,故检出效率高,但应慎用。
31.回归系数:直线的斜率b,也称回归系数。统计学意义是自变量x改变一个单位时,应变量y平均变化b个单位。
32.相关系数:也称pearson积距相关系数,说明具有直线相关的两变量间相关方向与密切程度。 33.直线回归分析中应注意的问题?
答:①做直线回归一定要有实际意义②回归分析之前首先应绘制散点图。③考虑建立线性模型的基本假定④取值范围,避免外延。⑤两变量间有直线关系不一定是因果关系。 34.相关分析应用中应注意的问题?
答:①资料要求x、y都应来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图,有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切
程度。要推断两样本间相关的程度,样本含量必须足够大,当r有统计学意义时,但r较小时,下结论要慎重。 35.方差分析的应用条件?
答:①各样本是相互的随机样本②各样本来自正态分布③各样本方差相等,即方差齐。 36.二项分布:贝努力试验序列中结果A出现次数的概率分布就是~。
37.率的标准化法:为解决因内部构成不同而导致分组率比较的结果与和纪律比较结果的矛盾,选定一个共同的标准人口或标准人口构成,分别计算两组的标准化率,这种方法称~。
38.抽样误差:由个体变异产生的,随机抽样引起的样本统计量与总体参考数间的差异称~ 选择题
l.统计中所说的总体是指:A
A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B
A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小 D某事件发生的可能性很大 E以上均不对
3.抽签的方法属于 D
A分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样 4.测量身高、体重等指标的原始资料叫:B
A计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料 5.某种新疗法治疗某病患者41人,治疗结果如下:
治疗结果 治愈 显效 好转 恶化 死亡
治疗人数 8 23 6 3 1 该资料的类型是: D
A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料 6.样本是总体的 C
A算术均数 B几何均数 C中位数 D全距 E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B
A均数不变,标准差改变 B均数改变,标准差不变
C两者均不变 D两者均改变 E以上均不对
14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时? C
A 5 B 5.5 C 6 D lO E 12
15.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差 16.下列哪个公式可用于估计医学95%正常值范围 A
A X±1.96S B X±1.96SX C μ±1.96SX D μ±t0.05,υSX E X±2.58S 17.标准差越大的意义,下列认识中错误的是 B
A观察个体之间变异越大 B观察个体之间变异越小 C样本的抽样误差可能越大 D样本对总体的代表性可能越差 E以上均不对
18.正态分布是以 E
A t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布 D 观察例数为中心的频数分布E均数为中心的频数分布
19.确定正常人的某项指标的正常范围时,调查对象是 B
A从未患过病的人 B排除影响研究指标的疾病和因素的人
C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是
20.均数与标准差之间的关系是 E
A标准差越大,均数代表性越大 B标准差越小,均数代表性越小
C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大 21.从一个总体中抽取样本,产生抽样误差的原因是 A
A总体中个体之间存在变异 B抽样未遵循随机化原则C被抽取的个体不同质 D组成样本的个体较少 E分组不合理
22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则 E A 说明两样本均数差别愈大 B 说明两总体均数差别愈大 C 说明样本均数与总体均数差别愈大 D 愈有理由认为两样本均数不同 E 愈有理由认为两总体均数不同
23.由10对(20个)数据组成的资料作配对t检验,其自由度等于C A 10 B 20 C 9 D 18 E 19 24.t检验结果,P>0.05,可以认为 B
A两总体均数差别无显著性B两样本均数差别无显著性C两总体均数差别有显著 D两样本均数差别有显著性 E以上都不对
25.下列哪项不是t检验的注意事项 D
A资料应具备可比性 B下结论切忌绝对化 C根据资料选择适宜的检验方法 D分母不宜过小 E资料应服从正态分布 26.在一项抽样研究中,当样本量逐渐增大时 B
A 标准差逐渐减少 B 标准误逐渐减少 C 标准差逐渐增大 D 标准误逐渐增大 E 标准差和标准误都逐渐增大 27.t<t0.05(v),统计上可认为 C
A两总体均数,差别无显著性 B两总体均数,差别有显著性 C两样本均数,差别无显著性 D两样本均数,差别有显著性 E以上均不是
28.两样本均数的t检验中,检验假设(H0)是 B
A μ1≠μ2 B μ1=μ2 C X1≠X2 D X1=X2 E X1=X2 29.同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A. Sx B .S C .x D .CV E S2 30.标准差与标准误的关系是:C
A两者相等 B后者大于前者 C前者大于后者 D不一定 E 随样本例数不同 31.在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内C A均数加减1.96倍的标准差 B均数加减2.58倍的标准差 C均数加减1.96倍的标准误 D均数加减2.58倍的标准误 E以上都不对
32.同一自由度下,P值增大 C
A t值不变 B t值增大 C t值减小 D t值与P值相等 E t值增大或减小 33.两样本作均数差别的t检验,要求资料分布近似正态,还要求 D A两样本均数相近,方差相等 B两样本均数相近
C两样本方差相等 D两样本总体方差相等 E两样本例数相等 第十章 分类变量资料的统计描述与推断
34.构成比的重要特点是各组成部分的百分比之和 C
A一定大于1 B一定小于l C一定等于1 D一定等于0 E随资料而异 35.计算相对数的目的是C
A为了进行显著性检验 B为了表示绝对水平
C为了便于比较 D为了表示实际水平 E为了表示相对水平 36.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是B A率 B构成比 C相对比 D绝对数 E标化率 37.四个样本率作比较,x2>x20.01(3),可以认为 A
A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同 D各样本率不同或不全相同 E样本率与总体率均不相同 38.卡方检验中自由度的计算公式是 D
A行数×列数 B n-1 C N-k D(行数-1)(列数-1) E行数×列数-1 39.作四格表卡方检验,当N>40,且__________时,应该使用校正公式 E A T<5 B T>5 C T<1 D T>5 E 1 C 不要把构成比当率分析 D 二者之间的可比性 E 分母不宜过小 42.反映某一事件发生强度的指标应选用 D A 构成比 B 相对比 C 绝对数 D 率 E变异系数 43.反映事物内部组成部分的比重大小应选用 A A构成比 B 相对比 C绝对数 D率 E变异系数 44.计算标化率的目的是 D A使大的率变小, B使小的率变大 C使率能更好的代表实际水平 D消除资料内部构成不同的影响,使率具有可比性 E起加权平均的作用 45.在两样本率比较的X2检验中,无效假设(H0)的正确表达应为 C A μ1≠μ2 B μ1=μ2 c π1=π2 D π1≠π2 E B=C 46.四格表中四个格子基本数字是 D A两个样本率的分子和分母 B两个构成比的分子和分母 C两对实测数和理论数 D两对实测阳性绝对数和阴性 绝对数 E两对理论数 第十二章 统计表与统计图 47.比较某地1990~1997年肝炎发病率宜绘制 C A直条图 B构成图 C普通线图 D直方图 E统计地图 48.关于统计资料的列表原则,错误的是 B A.横标目是研究对象,列在表的左侧;纵题目是分析指标,列在表的右侧 B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面E.标题在表的上端,简要说明表的内容 49.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用 A A直条图 B 线图 C 直方图 D 圆形图 E 百分条图 50.描述某地某地210名健康成人发汞含量的分布,宜绘制 B A直条图 B直方图 C线图 D百分条图 E散点图 l、统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体。 B随意想象的研究对象的全体。 C根据地区划分的研究对象的全体。 D根据时间划分的研究对象的全体。 E根据人群划分的研究对象的全体。 2、从一个总体中抽取样本,产生抽样误差的原因是:A A、总体中个体之间存在变异 B、抽样未遵循随机化原则 C、被抽取的个体不同质 D、组成样本的个体较少 E、分组不合理 3、概率P=1,则表示:B A、某事件必然不发生 B、某事件必然发生 C、某事件发生的可能性很小 D、某事件发生的可能性很大 E、以上均不对 4、将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A、统计设计 B、收集资料 C、整理资料 D、分析资料 E、以上均不对 5、统计学上通常认为P小于等于多少的事件,在一次观察中不会发生: B A、0.01 B、O.05 C、0.1 D、0.5 E、1.O 6、抽样调查的目的是:E A、研究样本统计量B、研究总体统计量 C、研究典型案例D、研究误差E、样本推断总体参数 7、抽签的方法属于: D A、分层抽样 B、系统抽样 C、整群抽样 D、单纯随机抽样 E、二级抽样 8、样本是总体中:D A、任意一部分 B、典型部分C、有意义的部分 D、有代表性的部分 E、有价值的部分 9、用某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果 治愈 显效 好转 恶化 死亡 治疗人数 8 23 6 3 1 该资料的类型是: D A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 10、某地区抽样调查1000名成年人的血压值,此资料属于: B A、集中型资料 B、数值变量资料 C、无序分类资料D、有序分类资料 E、离散型资料 11、常用平均数如下,除了:E A、均数 B、几何均数 C、中位数 D、众数 E、全距 12、变异指标如下,除了:E A、全距 B、标准差 C、变异系数 D、四分位数间距 E、中位数 13、某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:C A、X B、G C、M D、S E、CV 14、各观察值均加(或减)同一数后:B A、均数不变标准差改变B、均数改变标准差不变C、两者均不变 D、两者均改E、以上均不对 15、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时:C A、5 B、5.5 C、6 D、lO E、12 16、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A、全距 B、标准差 C、方差 D、变异系数 E、极差 17、表示血清学滴度资料平均水平最常计算: B A、算术均数 B、几何均数 C、中位数 D、全距 E、率 18、标准差越大的意义,下列认识中错误的是:B A、观察个体之间变异越大B、观察个体之间变异越小C、样本的抽样误差可能越大D、样本对总体的代表性可能越差E、以上均不对 19、均数与标准差适用于:A A、正态分布的资料 B、偏态分布 C、正偏态分布 D、负偏态分布 E、不对称分布 20、正态分布是以:E A.t值为中心的频数分布B.参数为中心的频数分布C.变量为中心的频数分布 D.观察例数为中心的频数分布E.均数为中心的频数分布 21、反映均数抽样误差的统计指标是: B A、标准差 B、标准误 C、变异系数 D、全距 E、方差 22、下列哪个公式可用于估计总体均数95%可信区间:D A、 ±1.96S B、 ±1.96S C、μ±t0.01,υS D、μ±t0.05,υS E、 ±t0.05,υS 23、当自由度v→∞时,tO.05值:C A、≠l.96 B、<1.96 C、=1.96 D、>1.96 E、=2.58 24、α=0.05, t>t0.05,ν,统计上可认为(D ) A、两总体均数差别无显著意义 B、两样本均数差别无显著意义 C、两总体均数差别有显著意义D、两样本均数差别有显著意义E、以上均不对 25、作单侧检验的前提是:D A、已知新药优于旧药 B、已知新药差于旧药 C、不知新药好还是旧药好 D、已知新药不比旧药差 E、已知新旧药差不多好 26、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用:A A、配对设计t检验B、成组设计两样本均数比较的t检验C、成组设计两样本几何均数比较t检验D、两样本均数比较u检验E、x2检验 27、对两组大样本率的比较,可选用:E A、u检验 B、x2检验 C、四格表确切计算概率法D、以上都不对 E、A,B都可以 28、在两样本均数比较的t检验中,无效假设(H0)的正确表达应为:B 与45区别下 A、μ1≠μ2 B、μl=μ2 c、 1≠ 2 D、 1= 2 E、π1=π2 29、在t检验中,当t>to.o5 v时,则结论为:C A、P>O.05 B、P≥O.05 C、P A、资料不具备可比性 B、身高资料不呈正态分布 C、体重资料不呈正态分布 D、样本含量较小 32、由10对(20个)数据组成的资料作配对t检验,其自由度等于:C A、10 B、20 C、9 D、18 33、对两样本均数作t检验,n1=20,n2=20,其自由度等于:C A、19 B、20 C、38 D、40 E、39 34、计算相对数的目的是:E A、为了进行显著性检验 B、为了表示绝对水平 C、为了便于比较 D、为了表示实际水平 E、为了表示相对水平 35、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是:B A、率 B、构成比 C、相对比 D、绝对数 E、标化率 36、相对数使用时要注意以下几点,其中哪一项是不正确的:B A、比较时应做假设检验 B、注意离散程度的影响 C、不要把构成比当率分析 D、二者之间的可比性 E、分母不宜过小 37、反映某一事件发生强度的指标应选用:D A、构成比 B、 相对比 C、绝对数 D、率 E、变异系数 38、反映事物内部组成部分的比重大小应选用:A A、构成比 B、 相对比 C、绝对数 D、率 E、变异系数 39、计算标化率的目的是:D A、使大的率变小, B、使小的率变大 C、使率能更好的代表实际水平 D、消除资料内部构成不同的影响,使率具有可比性 E、起加权平均的作用 40、在两样本率比较的X2检验中,无效假设(H0)的正确表达应为:C A、μ1≠μ2 B、μ1=μ2 c、π1=π2 D、π1≠π2 E、B=C 41、卡方检验中自由度的计算公式是:D A、行数×列数 B、 n-1 C、 N-k D、(行数-1)(列数-1) E、行数×列数-1 42、作四格表卡方检验,当N>40,且__________时,应该使用校正公式。E A、T<5 B、T>5 C、TA、P≤0.05 B、P≥0.05 C、P<0.05 D、P=0.05 E、P>0.05 44、四个样本率作比较,x2>x20.01(3),可以认为:A A、各总体率不同或不全相同 B、各总体率均不相同 C、各样本率均不相同 D、各样本率不同或不全相同 E、样本率与总体率均不相同 45、构成比的重要特点是各构成部分的总和为B A、>100% B、=100% C、<100% D、=0 E、随资料不同而变化 46、从统计学的角度看,下列指标属于绝对数的是D A、甲区的急性传染病人数为乙区的1.25倍 B、甲区某年急性传染病的发病率为382/10万 C、甲区占某市急性传染病的比重为18% D、某区某男身高168厘米 E、甲区某年急性传染病的死亡率为52.2/10万 五、统计表与统计图 47、比较某地1990~1997年肝炎发病率宜绘制:C A、直条图 B、构成图 C、普通线图 D、直方图 E、统计地图 48、下列关于统计表的要求,叙述错误的是:E A、 标题位于表的上方 B、不宜有竖线及斜线 C、备注不必列入表内 D、线条要求三线式或四线式 E、无数字时可以不填 49、比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用:A A、条图 B、线图 C、直方图 D、圆形图 E、直条构成图 50、描述某地某地210名健康成人发汞含量的分布,宜绘制:B A、条图 B、直方图 C、线图 D、百分条图 E、统计地图 1.某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:C A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 2.医学统计的研究内容是 E A.研究样本 B.研究个体 C.研究变量之间的相关关系 D.研究总体 E.研究资料或信息的收集.整理和分析 3.总体应该由 D A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.个体组成 4. 在统计学中,参数的含义是 D A.变量 B.参与研究的数目 C.研究样本的统计指标 D.总体的统计指标 E.与统计研究有关的变量 5.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于 A A.计数资料 B.计量资料 C.总体 D.个体 E.样本 6.统计学中的小概率事件,下面说法正确的是:B A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 7、统计上所说的样本是指:D A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 8、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属( B )资料。 A、计算 B、计数 C、计量 D、等级 E、都对 9、红细胞数(1012L-1)是:B A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 10、疗效是:D A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 1.标准正态分布曲线的特征是:B =0 =0 B.=0 A. =0 =1 =1 C. =不确定=1 =不确定 E.=0 D. 2.描述计量资料的主要统计指标是 :A A.平均数 B.相对数 C.t值 D.标准误 E.概率 3、一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:D A、身高变异大于体重 B、身高变异小于体重 C、身高变异等于体重 D、无法比较 E、身高变异不等于体重 4、随机抽取某市12名男孩,测得其体重均值为3.2公斤,标准差为0.5公斤,则总体均数95%可信区间的公式是:C A、3.2±t0.05.11 ×0.5 B、3.2 ±t0.05.12 ×0.5/ C、3.2 ±t0.05.11 ×0.5/ D、3.2±1.96×0.5/ E、3.2 ±2.58×0.5/ X=30,X2=190, 5. 某组资料共5例, 则均数和标准差分别是 D A.6 和 1.29 B.6.33 和 2.5C.38 和 6.78D.6 和 1.58 E 6和2.5 6.以下指标中那一项可用来描述计量资料离散程度。D A.算术均数 B.几何均数 C.中位数 D.极差 E.第50百分位数 7.偏态分布资料宜用下面那一项描述其分布的集中趋势。C A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.方差 8.下面那一项可用于比较身高和体重的变异度 C A.方差 B.标准差 C.变异系数 D.全距 E.四分位数间距 9.正态曲线下.横轴上,从均数 到+∞的面积为。C A.97.5% B.95% C.50% D.5% E.不能确定 10.下面那一项分布的资料,均数等于中位数。E A.对数正态 B.左偏态 C.右偏态 D.偏态 E.正态 11.对于正态分布资料的95%正常值范围,宜选用(B ) A. ±2.58s B. ±1.96s C. ±2.58 D. ±1.96 E. ±1.5 12.做频数表时,以组距为5,下列哪项组段划分正确 A A.0一,5一,10一,… B.0—5,5一10,10一,… C.一5,一10,一15,… D.0—4,5—9,10一,… E.5一,7一,9一,… 13.均数与标准差之间的关系是 A A.标准差越小,均数代表性越大 B.标准差越小,均数代表性越小 C.均数越大,标准差越小 D.均数越大,标准差越大 E.标准差越大,均数代表性越大 1.抽样研究中,S为定值,若逐渐增大样本含量,则样本:A A.标准误减小 B.标准误增大 C.标准误不改变 D.标准误的变化与样本含量无关 E.以上都对 2、12名妇女分别用两种测量肺活量的仪器测最大呼气率(l/min),比较两种方法检测结果有无差别,可进行:D A、成组设计u检验 B、成组设计t检验 C、配对设计u检验 D、配对设计t检验 E、X2检验 3.比较两种药物疗效时,对于下列哪项可作单侧检验( )。C A.已知A药与B药均有效 B.不知A药好还是B药好 C.已知A药不会优于B药 D.不知A药与B药是否均有效 E.已知A药与B药均无效 4.两个大样本均数比较的u检验, |u|=1.98,则统计结论是 D A.P <0.05 B.P <0.01 C.P >0.05 D.P =0.05 E、P <0.005 5.配对计量资料比较的t检验公式中,分母是 C A. B. C. D. d2 E、 6.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验 C A、t值符号相反,结论相反 B、t值符号相同,结论相同 C、t值符号相反,但结论相同 D、t值符号相同,但大小不同,结论相反 E、t值符号与结论无关 7.下面那一项小,表示用该样本均数估计总体均数的可靠性大。C A.CV B.S C.S D.R E.四分位数间距 8.两个小样本数值变量资料比较的假设,首先应考虑。E A.t检验 B.u检验 C.秩和检验 D.t检验和秩和检验均可 E.资料符合t检验还是秩和检验 9.抽样误差是指 D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 10、 ,统计上可接受( B )的假设。 A、 B、 C、 D、 E、以上都错 11、统计推断的内容: D A.是用样本指标估计相应的总体指标 B.是检验统计上的“假设” C.a、b均不是 D.a、b均是 E、以上都错 12、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:C A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.样本均数与总体均数不同 13. 表示均数的抽样误差大小的统计指标是 C A.标准差 B.方差 C.均数标准误 D.变异系数 E.极差 1.描述分类变量资料的主要统计指标是:B A.平均数 B.相对数 C.变异系数 D.相关系数 E.百分位数 2.男性人口数/女性人口数,这一指标为:C A、率 B、构成比 C、相对比 D、动态数列 E、不是相对数 3、构成比有个重要特点是 ( )。A A、百分比总和必等于100% B、百分比总和必小于100% C、百分比总和必大于100% D、以上均不对 E、以上都错 4.标化后的总死亡率( )。A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 5.关于相对数,下列哪一个说法是错误的 D A.相对数是两个有联系的指标之比 B.常用相对数包括相对比,率与构成比 C.计算相对数时要求分母要足够大 D.率与构成比虽然意义不同,但性质相近, 经常可以混用 E.计算相对数时不要求分母要足够大 6. 随机选取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为_____C_____ A.35% B.16.7% C.18.3% D.无法计算 E、30% 7. 对两地的结核病死亡率比较时作率的标准化,其目的是:D A.为了能更好地反映人群实际死亡水平 B.消除两地总人数不同的影响 C.消除各年龄组死亡率不同的影响 D.消除两地人口年龄构成不同的影响 E、以上都不对 8.四格表资料的卡方检验时无需校正,应满足的条件是( D )。 A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 9.计算相对数的目的是 C A. 为了进行显著性检验 B.为了表示绝对水平 C.为了便于比较 D.为了表示实际水平 E.为了表示相对水平 10.相对数使用时要注意以下几点,其中哪一项是不正确的 B A.比较时应做假设检验 B.离散程度和变异程度 C.不要把构成比当率分析 D.二者之间的可比性 E.分母不宜过小 11、四个样本率作比较,χ2>χ20.01(3),可认为:A A、各总体率不同或不全相同 B、各总体率均不相同 C、各样本率均不相同 D、各样本率不同或不全相同 E. 各总体率和各样本率均不同或不全相同 12、 检验适用于比较:D A、两个率差别的显著性 B、多个率差别的显著性 C、两个或多个构成比差别的显著性 D、以上都可以 E、以上都错 13、某研究者对50份痰液标本,每份分别接种在甲乙培养基上,观察结核杆菌的生长情况并想比较两种培养基的培养效果是否一致,资料见下表。问应该选择的统计方法是:C A.确切概率法 B.四格表资料的 检验 C.配对计数资料的 检验 D.行乘列表资料的 检验 E.配对计量资料的t检验 甲培养基 乙 培 养 基 合计 ﹢ ﹣ ﹢ 23 12 35 ﹣ 7 8 15 合计 30 20 50 1、 样本是总体中:D A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、 参数是指:C A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、 抽样的目的是:E A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: B A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: D A、 观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、抽签的方法属于 D A分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样 7、统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 8、实验设计中要求严格遵守四个基本原则,其目的是为了:D A便于统计处理 B严格控制随机误差的影响 C便于进行试验 D减少和抵消非实验因素的干扰 E以上都不对 9、对照组不给予任何处理,属 E A、相互对照 B、标准对照 C、实验对照 D、自身对照 E、空白对照 10、统计学常将P≤0.05或P≤0.01的事件称 D A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件 数值变量资料的统计描述 1、编制频数表的步骤如下,除了:E A、 找全距 B、定组距 C、分组段 D、划记 E、制分布图 2、变异指标如下,除了:E A、 全距 B、标准差 C、变异系数 D、四分位数间距 E、中位数 3、一组变量值,其大小分别为10,12,9,7,11,39,其中位数是:C A.9 B.7 C.10.5 D.11 E、12 4、描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是B A.极差 B.标准差 C.均数 D.变异系数 E、标准误 5、比较身高与体重的变异程度,适宜的指标: D A.极差 B.标准差 C.方差 D.变异系数 E、标准误 6、计算某血清血凝抑制抗体滴度的平均水平,宜用:B A.均数 B.几何均数 C.中位数 D. 四分位数 E.相对数 7、横轴上,标准正态曲线下从0到1.96的面积为: D A.95% B.45% C.97.5% D.47.5% E.49.5% 8、下列哪个公式可用于估计医学正常值范围(95%): A A、X±1.96S B、X±1.96SX C、μ±1.96SX D、μ±t0.05,υSX E、X±2.58S 9、一份考卷有3个问题,每个问题1分,班级中20%得3分,60%得2分,10%得1分,10%得0分,则平均得分 C? A、1.5 B、1.9 C、2.1 D、2 E、不知道班级中有多少人,所以不能算出平均得分 10、标准差越大的意义,下列认识中错误的是:A A、观察个体之间变异越大 B、观察个体之间变异越小 C、样本的抽样误差可能越大 D、样本对总体的代表性可能越差E、以上均不对 数值变量资料的统计推断 1、表示均数的抽样误差大小的统计指标是: C A标准差 B方差 C均数标准误 D 变异系数 E、全距 2、完全随机设计的两样本均数比较,其无效假设可以是:A 2 12 B C 1=A D E.μd=0 3、统计推断的内容 。 D a . 是用样本指标估计相应的总体指标 b .是检验统计上的“假设” c . a 、b 均不是 d . a 、b 均是 E. 以上都错 4、下面( )是错误的: B A.标准误大,说明用样本均数代表总体均数可靠性大 B.标准误小,说明用样本均数代表总体均数可靠性大 C.标准差大,标准误也大 D.样本含量大,标准误则小 E.标准误常用来估计总计均数可信区间 5、两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则:E A、说明两样本均数差别愈大 B、说明两总体均数差别愈大 C、说明样本均数与总体均数差别愈大 D愈有理由认为两样本均数不同 E、愈有理由认为两总体均数不同 6、下列哪项不是t检验的注意事项:D A、资料应具备可比性 B、下结论切忌绝对化 C、根据资料选择适宜的检验方法D、分母不宜过小 E、资料应服从正态分布 7、t<t0.05(v),统计上可认为:B A、两总体均数,差别无显著性 B、两总体均数,差别有显著性 B、两样本均数,差别无显著性 D、两样本均数,差别有显著性 E、以上均不是 8、要评价某市一名8岁男孩的身高是否偏高或偏矮,应选用的统计方法是:A A.用该市8岁男孩身高的95%或99%正常值范围来评价 B.作身高差别的假设检验来评价 C.用身高均数的95%或99%可信区间来评价 D.不能作评价 E以上都不对 9、来自同一总体中的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.x D.CV E S2 10、造成均数抽样误差的原因是 A A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 E以上都不对 11、同一自由度下,P值增大 C A t值不变 B t值增大 C t值减小 D t值与P值相等 E t值增大或减小 12、确定假设检验的检验水准后,同一资料 B A. 单侧t检验显著,则双侧t检验必然显著 B.双侧t检验显著,则单侧t检验必然显著 C.双侧t检验不显著,则单侧t检验也不显著 D.单、双t检验结果没有联系 E以上都不对 13、两样本均数比较时,分别取以下检验水准,以 所犯第二类错误最小A A、α=0.05 B、α=0.01 C、α=0.10 D、α=0.02 E、α=0.15 1、相对数使用时应注意以下各点,除了:E A、分母不宜过小 B、不要把构成比当率分析 C、可比性 D、比较时应作假设检验 E、平均水平与变异程度 2、某种职业病检出率为:D 100/100 100/100 B、检出病人数/在册人数A、 实有病人数/受检人数 100/100 100/100 D、检出人数/受检人数C、实存病人数/在册人数 E、以上全不对 3、说明一个地区死亡水平的指标主要是:D A.病死率 B.死因构成比 C.死因顺位 D.死亡率 E.上述都不对 4、相对数中的构成指标是说明: B A.反映事物发生的严重程度 B.事物内部构成比重 C.两个有关指标的比 D.动态变化 E.以上都不是 5、X2四格表中四个格子基本数字是:C A.两个样本率的分子与分母 B.两个构成比的分子与分母 C.两对实测阳性绝对数和阴性绝对数 D.两对实测数和理论数 E.以上都不对 6、四格表X2 检验的自由度是___。B A.0 B.1 C.2 D.4 E.5 7、某地某年肝炎病人数占同年传染病人数的10.1%,这是一种什么指标:B A.时点患病率 B.构成比 C.发病率 D.集中趋势 E.相对比 8、一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列情况:A A.该病患病率将增加 B.该病患病率将减少 C.该病发病率将增加 D.该病发病率将减少 E.该病的生存率增加 9、四个样本率作比较,x2>x20.01(3),可以认为:A A、各总体率不同或不全相同B、各总体率均不相同C、各样本率均不相同 D、各样本率不同或不全相同 E、样本率与总体率均不相同 10、计算标化率的目的是:D A、使大的率变小, B、使小的率变大 C、使率能更好的代表实际水平 D、消除资料内部构成不同的影响,使率具有可比性 E、起加权平均的作用 11、出生率习惯上用:B A.百分率 B.千分率 C.万分率 D.十万分率 E无所谓 12、百分率作比较,有1个理论数小于5,大于1,其它都大于5,C A只能作校正卡方检验 B不能作卡方检验 C作卡方检验不必校正 D必须先作合理的合并 E可作四格表精确概率法 13、四格表卡方检验中,X2 C、被抽取的个体不同质 D、组成样本的个体较少 E、分组不合理 5、概率P=0,则表示:A A、某事件必然不发生 B、某事件必然发生 C、某事件发生的可能性很小 D、某事件发生的可能性很大 E、以上均不对 6、某地区抽样调查1000名成年人的血压值并制作成频数表,此资料属于: A A、计量资料 B、计数资料 C、等级资料 D、半定量资料 E、离散型资料 7、某计量资料的分布性质未明,要计算集中趋势指标,下列__C______适宜 A、X B、G C、M D、S E、CV 8、构成比的重要特点是各组成部分的百分比之和_C________ A、一定大于1 B、一定小于l C、一定等于1 D、一定等于0 E、随资料而异 9、各观察值均加(或减)同一数后:B A、均数不变,标准差改变 B、均数改变,标准差不变 C、两者均不变 D、两者均改变 E、以上均不对 10、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为_____C____(小时) A、5 B、5.5 C、6 D、lO E、12 11、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A、全距 B. 标准差 C. 方差 D. 变异系数 E、极差 12、下列关于统计表的要求,叙述错误的是:E A、 标题位于表的上方 B、不宜有竖线及斜线 C、备注不必列入表内 D、线条要求三线式或四线式 E、无数字时可以不填 13、统计学上通常认为P<____B______的事件,在一次观察中不会发生 A、0.01 B、O.05 C、0.1 D、0.5 E、1.O 14、表示血清学滴度资料平均水平最常计算:B A、算术均数 B、几何均数 C、中位数 D、全距 E、率 15、下列哪个公式可用于估计医学正常值范围(95%): A A、X±1.96S B、X±1.96SX C、μ±1.96SX D、μ±t0.05,υSX E、X±2.58S 16、两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则:E A、说明两样本均数差别愈大 B、说明两总体均数差别愈大 C、说明样本均数与总体均数差别愈大 D愈有理由认为两样本均数不同 E、愈有理由认为两总体均数不同 17、标准差越大的意义,下列认识中错误的是:B A、观察个体之间变异越大 B、观察个体之间变异越小 C、样本的抽样误差可能越大 D、样本对总体的代表性可能越差 E、以上均不对 18、计算相对数的目的是:C A. 为了进行显著性检验 B.为了表示绝对水平 C.为了便于比较 D.为了表示实际水平 E.为了表示相对水平 19、均数与标准差适用于:C A.正偏态分布 B.负偏态分布 C.正态分布 D.偏态分布 E.不对称分布 20、样本是总体的:C A.有价值的部分 B.有意义的部分 C.有代表性的部分 D.任意一部分 E.典型部分 21、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是:B A、率 B、构成比 C、相对比 D、绝对数 E、标化率 22、四个样本率作比较,x2>x20.01(3),可以认为:A A、各总体率不同或不全相同 B、各总体率均不相同 C、各样本率均不相同 D、各样本率不同或不全相同 E、样本率与总体率均不相同 23、由10对(20个)数据组成的资料作配对t检验,其自由度等于:C A、10 B、20 C、9 D、18 E、19 24、对两样本均数作t检验,n1=20,n2=20,其自由度等于:C A、19 B、20 C、38 D、39 E、40 25、下列哪项不是t检验的注意事项:D A、资料应具备可比性 B、下结论切忌绝对化 C、根据资料选择适宜的检验方法, D、分母不宜过小 E、资料应服从正态分布 26、在一项抽样研究中,当样本量逐渐增大时:B A.标准差逐渐减少 B.标准误逐渐减少 C.标准差逐渐增大 D.标准误逐渐增大 E.标准差和标准误都逐渐增大 27、比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用:A A、条图 B、线图 C、直方图 D、圆形图 E、直条构成图 28、描述某地某地210名健康成人发汞含量的分布,宜绘制:B A、条图 B、直方图 C、线图 D、百分条图 E、统计地图 29、卡方检验中自由度的计算公式是:D A、行数×列数 B、 n-1 C、 N-k D、(行数-1)(列数-1) E、行数×列数-1 30、作四格表卡方检验,当N>40,且_____E_____时,应该使用校正公式。 A、T<5 B、T>5 C、TA.P≤0.05 B.P≥0.05 C.P<0.05 D.P=0.05 E.P>0.05 32、正态分布曲线下,横轴上从均数μ到μ+l.96σ的面积为 D A.97.5% B.95% C.48.8% D.47.5% E.45% 33、某医生在进行科室病例资料统计时,拟用算术平均数表示平均水平,应当选用什么样的资料: C A.个体差异较小的变量值 B.个体差异较大的变量值 C.性质相同的变量值 D.性质不同的变量值 E.差异相同的变量值 34、变异系数是表示资料的:D A.变异数 B.对称分布 C.集中趋势 D.相对变异 E.平均水平 35、确定正常人的某项指标的正常范围时,调查对象是:B A.从未患过病的人 B.排除影响研究指标的疾病和因素的人 C.只患过轻微疾病,但不影响被研究指标的人 D.排除了患过某病或接触过某因素的人 E.以上都不是 36、下列是有关参考值范围的说法,其中正确的是 E A.参考值范围应根据正常人范围的95%来制定 B.如果随机测量某人的某项指标,其值在正常人范围的 95%之内,那么应认为此人的此项指标正常 C.如果某项指标超出了参考值范围,那么其应为不正常 D.求正态资料的参考值范围,精确度越高越好 E.所谓的正常和健康都是相对的,在正常人或健康人身上都存在着某种程度的病理状态 37、均数与标准差之间的关系是:E A.标准差越大,均数代表性越大 B.标准差越小,均数代表性越小 C.均数越大,标准差越小 D.均数越大,标准差越大 E.标准差越小,均数代表性越大 38、18.关于统计资料的列表原则,错误的是 B A.横标目是研究对象,列在表的右侧;纵题目是分析指标,列在表的左侧 B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 E.标题在表的上端,简要说明表的内容 39、说明两个有关联的同类指标的比即为 B A.率 B.相对比 C.构成比 D.频率 E.频数 40、抽样误差的定义为:C A.个体值与样本统计量间的差异 B.样本统计量之间的差异 C.样本统计量与总体参数间的差异 D.总体参数间的差异 E.个体值与样本统计量间的差异 41、在统计学中,参数的含义是:D A.变量 B.参与研究的数目 C.研究样本的统计指标 D.总体的统计指标 E.与统计研究有关的变量 42、相对数使用时要注意以下几点,其中哪一项是不正确的:B A.比较时应做假设检验 B.注意离散程度的影响 C.不要把构成比当率分析 D.二者之间的可比性 E.分母不宜过小 43、用变异系数比较变异程度适用于:c A.相同指标,均数相差较大 B.不同指标,均数相差较小 C.不同指标,均数相差较大 D.相同指标,标准差相差较大 E.以上均不是 44、正态分布是以:E A.t值为中心的频数分布B.参数为中心的频数分布C.变量为中心的频数分布D.观察例数为中心的频数分布E.均数为中心的频数分布 45、反映某一事件发生强度的指标应选用:D A、构成比 B、 相对比 C、绝对数 D、率 E、变异系数 46、t<t0.05(v),统计上可认为:C A、两总体均数,差别无显著性 B、两总体均数,差别有显著性 C、两样本均数,差别无显著性 D、两样本均数,差别有显著性 E、以上均不是 47、反映事物内部组成部分的比重大小应选用:A A、构成比 B、 相对比 C、绝对数 D、率 E、变异系数 48、计算标化率的目的是:D A、使大的率变小, B、使小的率变大 C、使率能更好的代表实际水平 D、消除资料内部构成不同的影响,使率具有可比性 E、起加权平均的作用 49、两样本均数的t检验中,检验假设(H0)是:B A、 μ1≠μ2 B、μ1=μ2 C、X1≠X2 D、X1=X2 E、X1=X2 50、在两样本率比较的X2检验中,无效假设(H0)的正确表达应为:C A、μ1≠μ2 B、μ1=μ2 c、π1=π2 D、π1≠π2 E、B=C 2、在统计工作中,整理资料的首要工作是 C A、设计分组 B、拟整理表 C、检查资料 D、归组E、以上都不是 3、概率P=0,则表示A A、某事件必然不发生 B、某事件必然发生 C、某事件发生的可能性很小 D、某事件发生的可能性很大 E、以上均不对 4、比较某地1990~1997年肝炎发病率宜绘制:C A、直条图 B、构成图 C、普通线图 D、直方图 E、统计地图 5、将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A、统计设计 B、收集资料 C、整理资料 D、分析资料 E、以上均不对 6、从一个总体中随机抽取样本,产生抽样误差的原因是: A A、总体中个体之间存在着变异 B、抽样未遵循随机化原则 C、被抽取的个体不同质 D、组成样本的个体较少 E、分组不合理 7、统计学上认为的小概率事件通常是指P<______B____的事件, A、0.01 B、O.05 C、0.1 D、0.5 E、1.O 8、某地区抽样调查1000名成年人的血压值并制作成频数表,此资料属于: A A、计量资料 B、计数资料 C、等级资料 D、半定量资料 E、离散型资料 9、频数分布类型不明的资料,要表示其平均水平,宜计算 C A、X B、G C、M D、S E、CV 10、构成比的重要特点是各组成部分的百分比之和____C____ A、一定大于1 B、一定小于l C、一定等于1 D、一定等于0 E、随资料而异 11、各观察值均加同一数后 E A、均数不变,标准差变B、均数变,标准差不变C、两者均不变 D、两者均变E、均数变大,标准差不变 12、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、>24(小时), 问该食物中毒的平均潜伏期为___C_ ____(小时) A、5 B、5.5 C、6 D、lO E、12 13、比较12岁男孩和18岁男子身高变异程度的大小,宜采用的指标是:D A、全距 B、标准差 C、方差 D、变异系数 E、极差 14、下列关于统计表的要求,叙述错误的是:E A、标题位于表的上方 B、表内不宜有竖线及斜线 C、备注不必列入表内 D、线条要求三线式或四线式 E、无数字时可以不填 15、计量资料编制频数表时,一般分组数目为 B A、5~10组 B、8~15组 C、10~15组D、15~20组 E、随便分几组B 16、表示血清学滴度资料的平均水平最常计算: A、算术均数 B、几何均数 C、中位数 D、全距 E、率 17、下列哪个公式可用于估计医学正常值范围(95%): A A、X±1.96S B、X±1.96SX C、μ±1.96SX D、μ±t0.05,υSX E、X±2.58S 18、计算相对数的目的是:C A、为了进行假设检验B、为了表示绝对水平C、为了便于比较D、为了表示实际水平E、为了表示相对水平 19、均数与标准差适用于 C A、正偏态分布资料 B、负偏态分布资料 C、正态分布资料 D、频数分布类型不明的资料 E.不对称分布的资料 20、样本是从总体中随机抽取的: C A.有价值的部分 B.有意义的部分 C.有代表性的部分 D.任意一部分 E.典型部分 21、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是 B A、率 B、构成比 C、相对比 D、绝对数 E、标化率 22、四个样本率作比较,x2>x20.01(3),可以认为: A A、各总体率不同或不全相同 B、各总体率均不相同C、各样本率均不相同 D、各样本率不同或不全相同E、样本率与总体率均不相同 23、由10对(20个)数据组成的资料作配对t检验,其自由度等于:C A、10 B、20 C、9 D、18 E、19 24、对两样本均数作t检验,n1=20,n2=20,其自由度等于: C A、19 B、20 C、38 D、39 E、40 25、下列哪项不是t检验的注意事项: B A、资料应具备可比性 B、下结论切忌绝对化 C、根据资料选择适宜的检验方法, D、分母不宜过小 E、资料应服从正态分布 26、在一项抽样研究中,当样本含量逐渐增大时: B A.标准差逐渐减少 B.标准误逐渐减少 C.标准差逐渐增大 D.标准误逐渐增大 E.标准差和标准误都逐渐增大 27、比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用: A A、直条图 B、普通线图 C、直方图 D、圆形图 E、百分条图 28、描述某年某地210名健康成人发汞含量的分布,宜绘制: B A、直条图 B、直方图 C、普通线图 D、百分条图E、统计地图 29、卡方检验中自由度的计算公式是: D A、行数×列数 B、n-1 C、N-k D、(行数-1)(列数-1) E、行数×列数-1 30、作四格表卡方检验,当N>40,且____ ___时,应该使用校正公式。E A、T<5 B、T>5 C、TA、P≤0.05 B、P≥0.05 C、P<0.05 D、P=0.05 E、P>0.05 32、正态分布曲线下,横轴上从均数μ到μ+l.96σ的面积为 D A.97.5% B.95% C.48.8% D.47.5% E.45% 33、标准差的大小表示 A A、个体观察值之间的离散程度 B、个体观察值的平均水平 C、样本均数的抽样误差 D、样本均数的离散程度 E、以上都不是 34、变异系数是表示资料的: D A、正态分布 B、对称分布 C、集中趋势 D、相对变异E、平均水平 35、表示大样本资料总体均数95%可信区间可用式 C 36、表示12岁男童的平均身高,最常计算的是 A A.算术均数B.中位数 C.几何均数 D.变异系数E.标准差 37、均数与标准差之间的关系是:E A、标准差越大,均数代表性越大 B、标准差越小,均数代表性越小 C、均数越大,标准差越小 D、均数越大,标准差越大 E、标准差越小,均数代表性越大 38、抽样误差是由于 B A.计算引起 B.抽样引起 C.测量引起D.仪器未校正引起 E.操作不熟练引起 39、说明两个有关指标的比为 B A、率 B、相对比 C、构成比 D、频率 E、频数 40、抽样误差的定义为: C A、个体值与样本指标间的差异B、个体值之间的差异C、样本指标与总体指标间的差异 D、总体指标间的差异E、以上都不是 41、某院医护人员之比,宜计算 C A.率 B.构成比 C.相对比 D.方差 E.中位数 42、相对数使用时要注意以下几点,其中哪一项是不正确的: B A、比较时应做假设检验 B、注意离散程度的影响 C、不要把构成比当率分析 D、二者之间的可比性 E、分母不宜过小 43、用变异系数比较变异程度适用于: C A、单位相同,均数相差较大 B、单位不同,均数相差较小 C、单位不同,均数相差较大 D、单位相同,标准差相差较小 E、以上均不是 44、算术均数适用于 A A.正态分布资料B.偏态分布资料C.对数正态分布资料D.分布类型不明的资料 E.以上都不是 45、反映某一事件发生强度的指标应选用:D A、构成比 B、相对比 C、绝对数 D、率 E、变异系数 46、t<t0.05(v),统计上可认为 B A、两总体均数不同 B、两总体均数相同 C、两样本均数不同 D、两样本均数相同 E、以上均不是 47、反映事物内部组成部分的比重大小应选用 A A、构成比 B、相对比 C、绝对数 D、率 E、变异系数 48、描述一组偏态分布资料的平均水平,最常用的方法是 D A.算术均数 B.百分位数 C.几何均数 D.中位数 E.极差 49、两样本均数比较的t检验,无效假设(H0)是 B A、μ1≠μ2 B、μ1=μ2 C、X1≠X2 D、X1=X2 E、X1=X2 50、在两样本率比较的X2检验中,无效假设(H0)的正确表达应为: C A、μ1≠μ2 B、μ1=μ2 c、π1=π2 D、π1≠π2 E、B=C 一、最佳选择题 1.确定正常人的某项指标的正常范围时,调查对象是B A.从未患过病的人 B.排除影响研究指标的疾病和因素的人 C.只患过轻微疾病,但不影响被研究指标的人 D.排除了患过某病或接触过某因素的人 E.以上都不是 2.中位数与四分位数间距适用于B A.正态分布资料B.偏态分布资料C.正偏态资料D.负偏态资料E.对称分布资料 3.均数与标准差之间的关系是A A.标准差越小,均数代表性越好B.标准差越小,均数代表性越差 C.均数越大,标准差越小D.均数越大,标准差越大E.标准差越大,均数代表性越 4.分析计数资料时,最常用的显著性检验方法是D A.t检验B.正态检验C.U检验D.X2检验法E.以上都不是 5.一组变量值的标准差将E A.随系统误差的增加而减小B.随系统误差的减小而减小 C.随变量值的个数n的增加而增大D.随变量值的个数n的增加而减小 E.随变量值之间的变异增加而增大 6.如样本来自某总体,X2值小于3.84时,样本率来自总体率的概率是D A. 99%B. 95%C.<1.0%D.>5.0%E.<5.0% 7.1980年某地2—4岁儿童急性传染病构成表如下:用上表绘制统计图,应该选E A.直条图B.统计地图C.线图D.半对数线图E.构成图 8.总体应该由D A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 9.在统计学中,参数的含义是D A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 10.在以下基本抽样方法中,哪一种的抽样误差最小B A.系统抽样B.分层抽样C.多阶段抽样D.单纯随机抽样E.整群抽样 11.对含有两个随机变量的同一批资料,既作直线相关分析,又作直线回归分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间的关系是C A. tr>tb B. tr A.0与1 B. 1与0 C. 1与1 D. 0与 0 E. 以上都不是 二、填空题 1.已知一计量资料为正态分布,而且样本含量较大,则该资料95%的变量值所在的范围为 ±1.96S ;总体均数的99%可信区间为 ±2.58S 。 2.为了直观地比较化疗后相同时间点上一组乳癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的变异指标是_变异系数 。 3.在进行回归和相关分析之前,应 绘制散点图 ,当观察点的分布有直线趋势时,才适宜作回归和相关分析。 4. 有些人在表达定量的观测结果时,不考察资料是否服从 正态分布 ,盲目运用 ±S的方式来表达,这是表达统计资料中常见的一种错误。 5.标准化法只是在两组资料 内部构成 不同而影响总率进行比较的情况下使用。 6.直线相关有称简单相关,用于分析双变量 正态分布 的资料。 7、半对数线图表示 事物相对水平 ,即 变化速度 。一般横轴为 算术尺度 ,纵轴为 对数尺度 。 8、在符号秩和检验中,统计量T落在界值范围内,则P值 大于 相应概率。 9、在单因素方差分析中,要求资料来自 正态总体 且 方差齐 。 10、在单因素方差分析中,若处理因素无作用,理论上应有 F=1 。 三、分析应用题 1.从某学校17岁男学生中随机抽查100名,测得身高均数为166.6厘米,标准差4.9厘米,体重均数为53.7公斤,标准差4.5公斤。试回答下列问题:(15分) (1) 选择适当统计指标判断两者变异程度的大小?变异系数 (2) 估计该学校17岁男学生身高的总体均数是多少?(95%)总体均数的可信区间为: ±1.96S = 166.6±1.96 =165.6~167.6(厘米) 从该学校任意抽一名17岁男学生,测得他的体重为70公斤,问能否怀疑他的体重异常?(99%)正常值范围: ±1.96S=53.7±1.96 4.5=44.9~62.5(公斤) 该学生的体重不在此范围内,可认为是异常。 2、某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同大白鼠肝中维生素A的含量有无差别(不用计算)。请回答下列问题: (1)此实验属于哪种实验设计?配对设计 (2)此实验结果应使用哪种统计方法进行分析?配对资料t检验 (3)如何进行假设检验?H0:两种饲料喂养的大白鼠总体的肝中维生素A含量相同,即πμ1=μ2 H1:两种饲料喂养的大白鼠总体的肝中维生素A含量不同,即πμ1 μ2 (4)当计算结果P﹤0.05时,对结果如何解释?两种饲料喂养的大白鼠总体的肝中维生素A含量差别有意义。 3、用两种方法检查已确诊的宫颈癌患者120名。甲法的检出率为60%,乙法的检出率为35%,甲、乙两法一致的检出率为35%,问两种方法的检出率是否有显著性差异? H0:两种方法的检出率相同,即π1=π2 H1:两种方法的检出率不同,即π1 π2 α=0.05 两种方法检查结果比较 乙法 甲法 合计 + — + 42 18 60 — 30 30 60 合计 72 48 120 υ=1 查 界值表得, 〈 0.05,1 P〉0.05,按α=0.05水准接受H0,尚不能认为两法的检出率有差别。 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务