第一节 统计方法在心理学研究中的应用
一、心理统计的定义和性质
统计学最初指的是对一个国家情况的描述。
现代意义上的统计指的是对与随机现象有关的数据资料进行收集、整理、计算和分析的过程。
统计学大致分为理论统计学 和应用统计学 。
理论统计学 研究如何从局部的样本观测数据资料来推断总体的特征,并得出合乎规律的科学
结论的原理和方法。
应用统计学 研究如何运用经理论统计学证明的各种原理和方法解决实际问题。 心理统计学属于应用统计学。
心理统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理活动规律的一门学科。
心理统计学作为一门应用统计学科,与数理统计学既有密切联系,又不完全相同。
心理统计偏重于数理统计方法如何在心理和教育科学研究中的应用,着重介绍各种统计方法在不同的心理学研究中应用的条件和具体方法,及其统计计算结果的解释。 二、心理学研究数据的特点
心理学研究数据与结果多用数字形式呈现。 心理学研究数据具有随机性和变异性。 心理学研究数据具有规律性。
心理学研究的目标:通过部分数据来推测总体特征。
心理统计使我们能以最少的样本含量,达到我们所需要的精确度,对总体的有关参数等作出
判断,同时又给出发生错误的可能性。它保证了科学研究的精确性、可靠性和经济性。 三.学习心理统计的意义
数学化是自然科学成熟的标志。心理学也必然会向数学化的方向发展,而心理统计就是用数
学方法研究心理活动的重要工具。
学习心理专业的课程需要统计学知识。 从事心理学相关工作需要统计学知识。 进行心理学研究需要统计学知识。 科学的思维需要统计学知识。
四、学习心理统计应注意的事项
(一)学习心理统计学要注意的几个问题 必须要克服畏难情绪。
注意重点掌握各种统计方法使用的条件。 要做一定的练习。
(二)应用心理统计方法时要切记的要点
克服“统计无用”与“统计万能”的思想,注意科研道德 正确选用统计方法,防止误用和乱用统计
第二节 心理统计学的内容
一、描述统计
描述统计主要研究如何整理心理学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
目的:将大量零散的、杂乱无序的数字资料进行整理 、归纳 、简缩 、概括 ,使事物的全貌及其分布特征清晰、明确地显现出来。 二、推论统计
推论统计主要研究如何通过局部数据所提供的信息,推论总体的情形。即,根据样本提供的信息,运用概率理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计 、推测。 统计学中较为重要、应用较多的内容。
目的:根据已知的情况,在一定概率的意义上估计、推测未知的情况。 内容:包括总体参数估计和假设检验。 三、实验设计
实验设计主要目的在于研究如何科学地、经济地以及更有效地进行实验。即,实验者为了揭示实验中自变量与因变量之间的关系,在实验之前所制订的实验计划。 是统计学近几十年发展起来的内容。
包括:选择抽样方式;计算样本容量;如何安排实验因素;如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
描述统计
统计图表 差异量数
集中量数 相关分析
统计估计
心理与教育统计 推论统计
假设检验
参数估计 非参数估计 参数检验 非参数检验
点估计 区间估计
实验设计
样本选择与分配 实验误差分析 方差分析 协方差分析 回归分析 因子分析 …………
图1 心理与教育统计研究内容
第三节 心理统计学的发展
最初的统计是统治者用以治国的方法,对于人口、土地、物产、贡赋、士兵与战车等都需要统计。这类统计是记录或描述已经发生的各种现象,可以称为描述性统计。
随着科学进步,近百年来,在概率论基础上逐步形成了推测性的数理统计。19世纪中期奠定了概率论的理论基础。
一、理论统计学的发展历史
统计学的理论基础是概率论与正态分布曲线方程的产生。
一般认为理论统计学的发展经历了两个阶段:描述统计阶段和推论统计阶段。
描述统计阶段
描述统计学产生于20世纪年代之前,在描述统计方面做出重要贡献的是英国的优生学家高尔顿 (F.Galton )和统计学家皮尔逊 (K.pearson )。 推论统计阶段
推论统计的先驱是英国统计学家格赛特 (W.Gosset ),对推断统计做出重要贡献的是英国统计学家费舍尔 (R.A.Fisher ) 。
二次世界大战以后,各种非参数统计方法、小样本理论都得到发展和完善,同时多元统计的
理论和方法也得到了广泛的应用,统计学形成了许多分支应用学科。 二.心理与教育统计的产生和发展
心理与教育统计作为数理统计的一门应用学科,是随着数理统计的发展而发展的。 最初应用统计方法于教育与心理方面研究的是高尔顿 。
对教育统计做出重要贡献的是心理学家斯皮尔曼 (Ch.E.Spearman )。
随着科学研究中心的转移,心理与教育统计的研究也移向美国。为心理与教育统计学做出较大贡献的是美国教育与心理学家桑代克 (Thorndikt )、瑟斯顿 (Thurstone )和卡特尔 (Cattell )。
三.我国心理与教育统计学的发展概况
心理与教育统计学在辛亥以后传到我国。当时心理与教育统计、心理与教育测量都作为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授工作,出版了不少关于教育统计方面的译著、专著。
20世纪年代以后,心理与教育统计学开始复苏。在二十多年中,我国的心理与教育统计学科在教学、研究、培养人才等各方面取得了非常丰硕的成果。
目前,心理与教育统计学的教学和研究进入稳步快速发展时期。
第四节 心理与教育统计基础概念
一、数据类型
(一)从数据的观测方法和来源划分
计数数据:计算个数的数据,一般属性的调查获得的是此类数据,它具有的分类单位,一般都取整数形式。
测量数据:借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平
称名数据:只说明某一事物与其他事物在属性上的不同或类别上的差异,具有的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,只能用具有相同属性的个体数目来统计。
顺序数据:既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
这种数据只能排出一个顺序,不能指出相互间的差别大小。 这类数据不能进行加减乘除运算。
等距数据(interval data)是有相等单位,但无绝对零的数据,只能使用加减运算,不能使用乘除运算。等距数据在某个区间里具有相等单位。 比较时只能用加减法,不能使用乘除法。
比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点。 (三)按照数据是否具有连续性
离散数据:又称为不连续数据,这类数据在任何两个数据点之间所取的数值的个数是有限的。 连续数据:指任意两个数据点之间都可以细分出无限多个大小不同的数值。
二、变量、观测值、随机变量
变量是指心理与教育实验、观察、调查中想要获得的数据。
用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 三、总体、样本与个体
总体,又称全体、全域,指具有某种特征的一类事物的全体。总体是所欲研究的某一类对象的全体,总体的大小随研究的问题而改变。 个体是构成总体的每个基本单元。 样本是从总体中抽取的一部分个体。
一般把容量n ≥30的样本称为大样本; 而n <30的样本称为小样本。 四、次数、比率、频率与概率
次数是指某一事件在某一类别中出现的数目,又称为频数,用f表示。 两个数的比称比率。
频率,又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。通常用比例或百分数表示。
概率又称机率、或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率。 五、参数和统计量
总体的那些特征称为参数又称总体参数,是描述一个总体情况的统计指标。 样本的那些特征值叫做统计量,又称特征值。
参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。
一、数据排序 二、统计分组
第1章 资料收集与整理
第一节 数据的初步整理
数据排序:按照某种标准,对收集到的杂乱无章的数据按照一定顺序进行排列。 统计分组:根据被研究对象的特征,将所得数据划分到各个组别中去。
(一)统计分组前的准备
对数据进行核对和校验
消除记录误差:如写错小数点 谨慎处理极端值 三个标准差原则
(二)统计分组注意的问题
1 、分组以研究对象的本质特性为基础 2 、分类标志要明确
(三)分组的标志——分组的关键 1、性质类别
根据事物的属性不同,形成品质数列; 2、数量类别
以数据的取值大小为分类标志。数量界限必须反映各组质的差异,形成变量数列。 三、统计表
表号
名称 标目 数字 表注
表号 名称 标目 表注 数字 统计表的绘制原则 总原则:
(1)重点突出。不要包罗万象,要使人看过后能明白表格所要表达的主要内容。 (2)层次分明。避免层次过多或结构混乱。 四、统计图
统计图利用点的多少,线的长短,面积的大小,颜色的浓淡,线条的疏密或曲线的变化,来表示数据的大小程度、变动情况、分布状态和相依关系。
以形状为标准,可分为线形图、长条图、面积图、立体图等。 统计图
图号及图题,图目,图尺,图形,图例,图注 统计表和统计图
统计表和统计图是重要的统计描述方法。 优点:
简单明了
易于理解和接受 便于比较和分析 结果一目了然
第二节 次数分布表
一、简单次数分布表
依据每一个数值在一列数据中出现的次数或总计数资料编制成的统计表。 二、分组次数分布表(详细步骤及例题见书52页) (一)编制分组次数分布表的步骤 1、求全距
2、决定组距与组数 3、列出分组区间 4、登记次数 5、计算次数 (二)意义和缺点 三、相对次数分布表 四、累加次数分布表 五、双列次数分布表 六、不等距次数分布表
第三节 次数分布图
一、直方图
二、次数多边形图 三、累加次数分布图 (一)累加直方图 (二)累加曲线
第四节 其他类型的统计图表
一、其他常用的统计表类型 (一)简单表 (二)分组表 (三)复合表
二、其他常用的统计图的类别 (一)条形图 (二)圆形图 (三)线形图 (四)散点图
第二章 集中量数
第一节 算术平均数
算术平均数(arithmetic average),一般简称为平均数(average )或均数、均值(mean)。只有在与其他几种平均数,如几何平均数、调和平均数、加权平均数相区别的时候,才把它叫做算术平均数。平均数一般用M表示。如果平均数是由X变量计算的,就记为 (读作X杠),若由Y变量求得,则记为 。 一、平均数的计算方法
(一)未分组数据计算平均数的方法
当一组数据未进行统计分类时,若想描述其典型情况,找出其代表值,可计算算术平均数,公式为:
XXNiXi表示原始分数的总和,N表示分数式中,的个数。(二)用估计平均数计算平均数(步骤见书66页)
数据的数目以及每个观测数据值(即数字)都很大时,利用估计平均数(an estimated mean)可以简化计算。
XAMx'N式中:x'XiAMAM为估计平均数N为数据个数
二、平均数的特点
1、在一组数据中每个变量与平均数之差(称为离均差)的总和等于0。
2、在一组数据中,每一个数后加上一常数C,则所得的平均数为原来的平均数加常数C,即XiCCX
3、在一组数据中,每一个数后乘以一个常数C所得的平均数为原来的平均数乘以常数C,即
N三、平均数的意义
算术平均数是应用最普遍的一种集中量数。它是“真值”(true score)渐近、最佳的估计值。 四、平均数的优缺点 优点
反应灵敏。观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。
XiC计算严密。计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据,计算的
CX平均数都相同。
N计算简单。计算过程只是应用简单的四则运算。
简明易解。平均数概念简单明了,较少数学抽象容易理解。
适合于进一步用代数方法演算。在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数。
较少受抽样变动的影响。观测样本的大小或个体的变化,对计算平均数影响很小。在来自同一总体逐个样本的集中量数中,平均数的波动通常小于其他量数的波动,因此它总是最可靠、最正确的量数。 缺点
易受极端数据的影响。
若出现模糊不清的数据时,无法计算平均数。 五、计算和应用平均数的原则 1、同质性原则
只有在总体是由同类数据所组成且有足够多的数据单位时,平均数才具有科学价值和认识意义。
同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。
2、平均数与个体数值相结合的原则
平均数反映客观事物的一般水平,但没有反映数据之间的差异,造成某些信息遗失。 在运用平均数做统计分析时,还应与个体数值相结合。 3、平均数与标准差、方差相结合原则
平均数和标准差是用来描述数据总体特征的一对相互联系的统计指标。平均数反映的是总体数
据的集中趋势。但平均数对于总体数据一般水平的代表性如何,要看各个数值之间差异的大小。 各个数值之间差异大小是通过标准差和方差来描述的。标准差和方差反映总体的离中趋势,标准差越大,平均数的代表性就越小。
第二节 中数与众数
一、中数
中数(median),又称中点数、中位数、中值,符号为 Md 或 Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。
(一)未分组数据求中数的方法
根据中数的概念,首先将数据依其取值大小排序,然后找出位于中间的那个数,就是中数。
1、一组数据中无重复值的情况
指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。 (1)数据个数为奇数,则中数为 (N+1)/2 位置的那个数。
(2)数据个数为偶数,则中数为居于中间位置两个数的平均数,即第 N/2 与第 (N/2 +1) 位置的两个数据相加除以2。
2、一组数据中有重复数值的情况(计算重要)
指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。 (1)当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。 (2)当重复数目位于数列中间,数据的个数为奇数的情形。 (3)当重复数目位于数列中间,数据的个数为偶数的情形。 (二)中数的优缺点与应用 优点
中数是根据观测数据计算而来,不能凭主观臆定。 中数计算简单,容易理解,概念简单明白。 缺点
中数的计算不是每个数据都加入,其大小不受制于全体数据。 反应不够灵敏,极端值的变化对中数不产生影响。 受抽样影响较大,不如平均数稳定。 计算时需要对数据先排列大小。
中数乘以总数与数据的总和不相等(中数等于平均数时例外)。 不能作进一步代数运算。
在一些特殊情况下,中数的应用受到重视。 当一组观测结果中出现两个极端数目时。
当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。 当需要快速估计一组数据的代表值时。 二、众数
众数(mode),又称为范数、密集数、通常数等,常用符号Mo表示,是指在次数分布中出现次数最多的那个数的数值。 (一)计算众数的方法 1、直接观察求众数 2、用公式求众数
用公式计算的众数成为数理众数。一般在心理与教育统计中应用较多的是皮尔逊经验法和金氏插补法。 (二)众数的意义与应用 优点
众数的概念简单明了,容易理解。 缺点
众数不稳定,受分组和样本变动影响。
计算时不需每一个数据都加入,因而较少受极端数目的影响,反应不够灵敏。
用观察法得到的众数,不是经过严格计算而来,用公式计算所得众数也只是一个估计值。 不能作进一步代数运算。总数乘以众数与数据的总和不相等。 三、平均数、中数与众数三者之间的关系
在正态分布中,平均数、中数、众数三者相等,在数轴上完全重合,此时只用报告平均数。 在正偏态分布中,M>Md>Mo 在负偏态分布中,M<Md<Mo 皮尔逊认为, 2Mo=3Md- 2M
第三节 其他集中量数(应用问题)
一、加权平均数(MW)(例题见书71页) 计算公式:
小组平均数计算总平均数
WXWX...WnXn Mw二、几何平均数(Mg)(例题见书72 WW1W2页)...n(一)计算公式
MgNX1X2X3X4XiXNlgXlgMgNiWXWiii(二)几何平均数的应用
nX1、直接应用基本公式计算几何平均数
XT 一组实验数据中有少数数据偏大或偏小,数据分布呈偏态。 ni 心理物理学的等距量表实验中,只能用几何平均数。 2、应用几何平均数的变式计算
一组数据彼此之间变异较大,几乎是按一定的比例关系变化。 学习方面的增加率
学生或人口增加率的估计 一些经费的增加率
三、调和平均数(MH)(例题见书73页) (一)计算公式
(二)调和平均数的应用
主要是用来描述学习速度方面的问题。
MH11111111()NXXXNNXiN1Xi第三章 差异量数
引言
•差异量数:对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数。 •主要包括:全距、四分位差、平均差、标准差、方差等。
第一节 全距和百分位差
•一、全距(分组中的其中一步) •又称两极差,符号“R”。 •计算公式:R=Xmax - Xmin
二、百分位差(具体见书81页 对位置量数)
•P10 与P90之间的距离。 •(一)百分位的计算公式:
•(二)百分位数与百分等级
三、四分位差
PLb
b•指一个次数分布中,中间50%的次数的全距的一半。在一组数据中,它的值等于P25 到P75距
NFfP p离的二分之一。
i•计算公式:
Q3Q1Q2100iQ1Lb4fXLbPRFb31NiNFbNFbfQ3Lb4
第二节 平均差、方差与标准差
fi•一、动差体系
•二、平均差(例题见书76页)
•是次数分布中所有原始数据与平均数绝对离差的平均值。 •符号:A.D.或 M.D. •计算公式:
XA.D.iXnxniA.D.fnx
三、方差与标准差
•(一)方差
•也称变异数、均方。是每个数据与该组数据平均数之差平方后的均值,即离均差平方后的平均
数。
•是度量数据分散程度的重要统计量。
符号:样本统计量:S2 总体统计量:σ2
•方差计算公式
•标准差
•即方差的平方根,用符号S和σ表示
•计算公式 •
s22XX N22x三、方差与标准差
2N2•直接使用原始分数计算方差与标准差。公式如下:
XXNXXs22NN2N2sX2N三、方差与标准差
Xs1s222NXXNNN x•(二)计算分组数据的标准差与方差 fXXfxs22cNNfd2fdsNiN2•(三)总标准差的合成
sT2NsNdN2iiii2i
sT
•(四)方差与标准差的性质和意义
NsNdN2iiii2i•1、性质
•方差是对一组数据的各种变异的总和的测量,具有可加性和可分解性。 •标准差是一组数据方差的平方根,不能进行代数运算。具有以下特性: •(1)每一个观测值都加上一个常数后,计算后的标准差等于原标准差。
•(2)每一个观测值都乘上一个常数后,计算后的标准差等于原标准差乘以这个常数。
•(3)以上两点结合,每一个观测值都乘上一个常数A后,再加上一个常数B,计算后的标准
差等于原标准差乘以常数A。 三、方差与标准差
•2、意义
•值越大,说明次数分布的离散程度越大,数据较为分散;值越小,说明次数分布比较集中,离
散度小。
•标准差的特点:
•反应灵敏;计算公式严密确定;容易计算;适合代数运算;受抽样变动较小;简单明了
第三节 标准差的应用
一、差异系数(例题见书79页)
•又称变异系数,相对标准差等,是一种相对差异量。用CV表示,是标准差对平均数的百分比。 •计算公式:
•适用范围: •注意问题:
1、同一团体不同观测值离散程度的比较
2、对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 1、测量的数据要保证是等距尺度;
2、观测工具应具备绝对零,如重量、长度;
s 3、只能用于描述,不同进行推论。CV二、标准分数(例题见书84页M 相对位置量数) 分数在团体中所处位置的相对位置量数。
•标准分数(standard score),又称基分数或Z分数(Z-score),是以标准差为单位表示一个原始•计算公式:
•标准分数的性质
1. Z 分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。 2. 一组原始分数转换得到的Z 分数可以是正值,也可以是负值。 3. 一组原始数据中,各个Z 分数的标准差为1 4. 若原始分数呈正态分布,则转换得到的所有Z 分数值的均值为0 ,标准差为1 的标准正态分布。
•标准分数的优点
可比性,可加性,明确性,稳定性
Zss•标准分数的应用(后文正态分布中有用)
•比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。 •计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。 •表示标准测验分数。
三、异常值的取舍
•三个标准差法则:如果数据值落在平均数加减三个标准差之外,则在整理数据时,可将此数据
作为异常值舍弃。
第四节 差异量数的选用
一、优良差异量数具备的标准 二、各种差异量数优缺点比较 三、各种差异量数之间的关系 四、如何选用差异量数
第四章 概率与概率分布
第一节 概率基本概念
一、随机事件及其概率 确定现象
– 必然现象:日出日落
– 不可能现象:自然条件下,水向上流 随机现象 – 中奖
后验概率(或统计概率)
随机事件的频率
先验概率(古典概率)
古典概率模型要求满足两个条件:
⑴ 试验的所有可能结果是有限的;
⑵ 每一种可能结果出现的可能性相等。 m二、概率的加法定理 p(A)若事件A发生,则事件B就一定不发生,这样的两个事件为互不相容事件。 两互不相容事件和的概率,等于这两个事件概率之和,即
P(AB)PAPBP(A1A2An)PA1PA2PAn(6.3)(6.4)
三、概率的乘法定理
若事件A发生不影响事件B是否发生,这样的两个事件为互相事件。 两个互相事件积的概率,等于这两个事件概率的乘积,即
P(AB)PAPB(9.5)(9.6)P(A1A2An)PA1PA2PAn
例1:某一学生从5个试题中任意抽取一题,进行口试。如果抽到每一题的概率为1/5,则
抽到试题1或试题2的概率是多少? 如果前一个学生把抽过的试题还回后,后一个学生再抽,则4个学生都抽到试题1的概率是多少? 计 算
抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和,即
四个学生都抽到第一题即四个学生同时抽到第一题,其概率应为抽到第一题的概率的乘积,即
例2:从30个白球和20个黑球共50个球中随机抽取两次(放回抽样),问抽出一个黑球和一个白球的概率是多少?
抽出一个白球的概率为3/5,抽出一个黑球的概率为2/5。 抽出一个黑球和一个白球的情况应包括先抽出一个黑球、
11后抽出一个白球和先抽出一个白球、2后抽出一个黑球两种情况。因此:P PABAPB555四、概率分布类型 布函数进行描述。
概率分布(probability distribution)是指对随机变量取不同值时的概率的描述,一般用概率分依不同的标准,对概率分布可作不同的分类。
11111(一)离散型分布与连续型分布 PA1A2A3A45555625依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与教育统计
学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。
(二)经验分布与理论分布
依分布函数的来源,可将概率分布分为经验分布与理论分布。
经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。 3223P0. 理论分布是按某种数学模型计算出的概率分布。
5555(三)基本随机变量分布与抽样分布
依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。
基本随机变量分布是随机变量各种不同取值情况的概率分布 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
第二节 正态分布
一、标准分数
标准分数(standard score),又称为基分数或Z分数(Z-score),是以标准差为单位表示一个
原始分数在团体中所处位置的相对位置量数。
标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。
1.标准分数的计算
标准分数的计算公式为
Z或XXSZX
Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。
把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单
位、以平均数为参照点的分数。 2.标准分数的性质
Z分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。
一组原始分数得到的Z分数既有正值,也有负值,所有原始分数的Z分数之和为零。 一组原始数据中,各个Z分数的标准差为1。 标准正态分布的平均值为0,标准差为1。
二.正态分布
正态分布(normal distribution)也称为常态分布,是连续型随机变量概率分布的一种,是在
数理统计的理论与实际应用中占有最重要地位的一种理论分布。
正态分布于1733年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态
分布为高斯分布。 1.正态分布曲线函数
正态分布曲线函数又称概率密度函数,其一般公式为
2.标准正态分布曲线
将标准分数代入正态曲线函数 并且,令σ=1
则公式变换为标准正态分布函数: X21Ye222
以Z为横坐标,以Y为纵坐标,可绘制标准正态分布曲线。
标准正态分布曲线的纵线高度Y为概率密度,曲线下的面积为概率。
3.标准正态分布曲线的特点
⑴.曲线在Z=0处达到最高点
⑵.曲线以Z=0处为中心,双侧对称
⑶.曲线从最高点向左右缓慢下降,向两侧无限延伸,但永不与基线相交。
Z21⑷.标准正态分布曲线的平均数为0,标准差为1。从Z=-3至Z=+3之间几乎分布着全
Ye部数据。
2⑸.曲线的拐点为正负一个标准差处。
三.正态曲线表的编制 1.正态曲线表
利用积分公式可求出正态曲线下任何区间的面积,但需要计算,非常麻烦。 统计学家已编制好了正态分布表,使其使用非常方便。
正态分布表的特点:
表中仅列有标准正态曲线下的面积,因此,查表前应先将原始变量X转换为Z。
2.已知Z值求概率
⑴.求Z=0至某一Z值之间的概率:直接查表 ⑵.求两个Z值之间的概率
两Z值符号相同:PZ1-Z2=PZ2-PZ1 两Z值符号相反:PZ1-Z2=PZ2+PZ1
⑶.求某一Z值以上的概率
Z>0时,PZ-∞=0.5-PZ Z<0时,PZ-∞=0.5+PZ
⑷.求某一Z值以下的概率
Z>0时,P-∞-Z=0.5+PZ Z<0时,P-∞-Z=0.5-PZ
3.已知面积(概率)求Z值
⑴.求Z=0以上或以下某一面积对应的Z值:直接查表
⑵.求与正态曲线上端或下端某一面积P相对应的Z值:先用0.5-PZ,再查表 ⑶.求与正态曲线下部位某一面积相对应的Z值:先计算P/2,再查表 4.已知概率P或Z值,求概率密度Y
直接查正态分布表就能得到相应的概率密度Y值。
如果由概率P求Y值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分,
才能通过查表求得正确的概率密度。
四.正态分布在测验上的应用(计算重点 例题见书110) (一)化等级评定为测量数据 (二)确定测验题目的难易度
(三)能力分组或等级评定时确定人数
第三节 二项分布
二项分布(bionimal distribution)是一种具有广泛用途的离散型随机变量的概率分布又称为贝
努里分布。
一、二项试验与二项分布 (一)二项试验
满足以下条件的试验称为二项试验:
一次试验只有两种结果 ,即成功和失败;
共有n 次试验,n 是预先给定的任一正整数; 各次试验相互 ,即各次试验之间互不影响; 某一结果出现的概率在任何一次试验中都是固定的。 (二)二项分布
二项分布是指统计变量中只有性质不同的两项群体的概率分布。 两项群体是按两种不同性质划分的统计变量,是二项试验的结果。 各项变量都可归为两个不同性质中的一个,两个观测值是对立的。 (二)二项分布的平均数和标准差
二项分布的平均数为二项分布的标准差为
三、二项分布的应用
二项分布函数除了用来求成功事件恰好出现X次的概率之外,在心理学研究中主要用来判断
试验结果的机遇性与真实性的界限。
例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他是真会而不
是猜测呢?
这种问题需要用累积概率来算。当做对8题或8题以上时,累积概率为0.9,也就是说,猜对9题或10题的概率不足0.05。 一个学生做10个正误题做对不同题数的概率分布(具体见书117页)
例题:一个教师对8个学生的作业成绩进行猜测,如果教师猜对的可能性为1/3,问: ⑴平均能猜对几个学生的成绩?
⑵假如规定猜对95%,才算这个教师有一定的评判能力,那么这个教师至少要猜对几个学
生?
np82.6713XXnXPCpq(X)n08088
82P(0)Cpqq0.0406378!12117P(1)C8pq0.16167!338!12P(2)C82p2q60.28162!6!338!123P(3)C8p3q50.28003!5!33P(4)8!124C8p4q40.15504!4!33442635P(5)8!12Cpq0.06175!3!33
585353P(0)0.0406P(0)P(1)0.2022P(0)P(1)P(2)0.4838
第四节 样本分布(有多个提取的样本的平均数组成的分布)
一、正态分布及渐进正态分布
(一)总体正态分布,方差已知,样本平均数分布为正态分布 平均数
P(0)P(1)P(2)P(3)P(4)0.9188 标准误
(二)总体非正态分布,方差已知,当样本足够大时(n>30),样本平均数分布为渐进正态分布
平均数
X 标准误
t分布是一种随机变量函数的分布,高赛特于1908年推导出来。 t分布峰态比较高狭,分布形状随自由度变化而变化的一族分布。
XXx2tssXnn
t 分布与(n-1)有关。
(n-1)是t分布的自由度,用df表示。
自由度是指任何变量中可以自由变化的数目,代表t分布中随机变量的数目。
Xt分布表(P358)
t分布表由三部分构成: –t值、自由度、显著性水平
左列为自由度,最上一行是不同自由度下t分布两尾端的概率(p值),指某一t值时,t分布两尾部概率之和,即双侧界限。表的最下一行是单侧界限,即从t值以下t分布一侧尾部的概率值。
双侧概率通常写作t(а/2),单侧概率通常写作tа。
当总体分布为正态,方差未知时,样本平均数的分布为t分布。
SXsn2sx总体分布为非正态而方差又未知时,若满足n>30这一条件,样本平均数的分布近似为t分布。
n1
第五章 参数估计
参数估计在统计方法中的地位 统计方法描述统计推断统计参数估计统计推断的过程
假设检验 第一节 点估计
一、点估计的定义
点估计使用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,统计的结果也以一个点的数值表示,所以称为点估计。
当已知一个样本的观测值时,就可得到总体参数的估计值。点估计的优点在于它能够提供总体参数的估计值。 二、良好估计量的标准 1. 无偏性
•用统计量估计总体参数一定会有误差,不可能恰恰相同。一个优秀的总体参数的估计值,应该具备无偏性。
2. 一致性
当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。 3. 有效性
当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效
性低,即方差越小越好。
第二节 区间估计
区间估计的定义
•区间估计:用一个区间去估计未知参数。
•区间估计就是根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段
距离表示未知参数可能落入的范围。 样本统计量置信区间(点估计)置信下限置信区间与显著性水平
置信上限 •置信区间,也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。 •置信区间的上下二端点值称为置信界限。
•置信概率是指估计总体参数落在某一区间时的概率,用符号1-表示。 称为显著性水平,指估计总体参数落在某一区间时的可能犯错误的概率。
区间与置信水平
平均数的抽样分布/2xx1 -/2xx(1 -) % 区间包含了X% 的区间未包含落在总体平均数某一区间内的样本
X = Zx_x-2.58x-1.65 x+1.65x+ 2.58xX-1.96 x+1.96x90%的样本95% 的样本99% 的样本
一、 总体平均数的区间估计
(一)总体正态、方差已知,对总体平均数的估计
当总体分布为正态,总体方差已知时,样本平均数的分布为正态分布。 (二)总体正态、方差未知,对总体平均数的估计
当总体分布为正态,总体方差未知时,样本平均数的分布为t分布。
(三)总体非正态,对总体平均数的估计
1、当总体分布为非正态,总体方差已知时,样本平均数的分布为渐进正态分布。 2、当总体分布为非正态,总体方差未知时,样本平均数的分布为近似t分布。 (四)估计总体平均数的步骤
1、根据样本数据,计算样本平均数与标准差。 2、计算标准误。有两种情况。 –总体方差已知 sn1s–总体方差未知 SXn n3、确定置信水平或显著性水平
4、根据样本平均数的抽样分布,确定查何种统计表。 5、计算置信区间。
6、解释总体平均数的置信区间。 二、总体方差的区间估计
•从正态分布的总体中随机抽取容量为n的样本,其样本方差与总体方差的比值的分布为卡方分
布
假设检验在统计方法中的地位
第六章 假设检验
统计方法 描述统计 22(XX)22 推断统计(n1)S2n1nS2参数估计 第一节 假设检验的原理
•研究假设(科学假设)H1:
进行研究时,根据已有理论和经验事先对研究结果做出一种预想的希望证实的假设。
•虚无假设 H0:
与研究假设相对立,是直接被检验的假设。
(二)什么是假设检验?
–事先对总体参数或分布形式作出某种假设 –然后利用样本信息来判断虚无假设是否成立
特点:
–采用逻辑上的反证法 –依据统计上的小概率原理
假设检验中的小概率原理 什么是小概率?
1. 在一次试验中,一个几乎不可能发生的事件发生的概率
2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝虚无假设 3. 小概率由研究者事先确定
假设检验的步骤
–提出研究假设和虚无假设 –确定适当的检验统计量 –规定显著性水平 –计算检验统计量的值 –作出统计决策
确定适当的检验统计量
检验统计量:用于假设检验问题的统计量 选择统计量的方法与参数估计相同,需考虑
–总体分布正态还是非正态 –总体方差已知还是未知 –是大样本还是小样本
规定显著性水平
显著性水平:是一个概率值
2. 虚无假设为真时,拒绝虚无假设的概率
–被称为抽样分布的拒绝域
3. 表示为
–常用的值有0.01和0.05
4. 由研究者事先确定
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应的临界值Z或Z/2 3. 将检验统计量的值与水平的临界值进行比较 4. 得出接受或拒绝虚无假设的结论
假设检验中的两类错误 第一类错误(弃真错误)
–虚无假设为真时拒绝虚无假设
–第一类错误的概率为
第二类错误(取伪错误)
–虚无假设为假时接受虚无假设 –第二类错误的概率为
错误和 错误的关系
和的关系就像翘翘板,小就大, 大就小 双侧检验与单侧检验 (假设的形式) 假设 H0 H1 研究的问题 双侧检验 m = m0 m ≠m0 左侧检验 m m0 m < m0 右侧检验 m m0 m > m0 双侧检验
(虚无假设与研究假设的确定)
•双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相
应的行动措施。
•例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 •建立的虚无假设与研究假设应为
• H0: = 10 H1: 10
(确定假设的步骤)
例: 检验某零件平均长度是否为4cm 步骤
– 从统计角度陈述问题 (= 4)
– 从统计角度提出相反的问题 ( 4)
• 必需互斥和穷尽
– 提出虚无假设 (4) – 提出研究假设 (= 4)
该企业生产的零件平均长度是4厘米吗?
•提出虚无假设: H0: 4 •提出研究假设: H1: = 4
双侧检验
抽样分布 拒绝域 /2 1 - /2 接受域 置信水平 拒绝域 临界值 H0值 临界值 样本统计量
单侧检验
(虚无假设与研究假设的确定) 将所研究的问题作为研究假设H1
将认为研究结果是无效的说法或理论作为虚无假设H0。或者说,把希望(想要)证明的问题作为研究假设
先确立研究假设H1,后确立H0 。
单侧检验 (例子)
学生中经常上网的人数超过25%吗?
•选择研究假设: H1: 25 •提出虚无假设: H0: ≤ 25
单侧检验
(显著性水平与拒绝域 )
抽样分布 拒绝域 置信水平 1 - 接受域 临界值 H0值 样本统计量
左侧检验
(显著性水平与拒绝域 )
抽样分布 拒绝域
置信水平 1 - 接受域 H0值 样本统计量
临界值 观察到的样本统计量 右侧检验
(显著性水平与拒绝域 )
置信水平 抽样分布 拒绝域
1 - 接受域H0值 观察到的样本统计量
临界值
样本统计量
第二节 平均数的显著性检验
一.总体平均数的显著性检验
•总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检
验的结果差异显著,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存在显著差异的总体。即,该样本与当前的总体不一致。 1.总体平均数显著性检验的原理
检验的思路是:假定研究样本是从平均数为μ的总体随机抽取的,而目标总体的平均数为μ0,检验μ与μ0之间是否存在差异。如果差异显著,可以认为研究样本的总体不是平均数为μ0 的总体,也就是说,研究样本不是来自平均数为μ0 的总体。
2.总体平均数显著性检验的步骤
•一个完整的假设检验过程,一般经过四个主要步骤:
⑴.提出假设
⑵.选择检验统计量并计算统计量的值 ⑶.确定显著性水平 ⑷.做出统计结论 ⑴ 提出假设
•即根据研究假设提出相应的统计检验的假设。 •双侧检验的假设形式为:
X≠ H0:μ= μ0 , H1:μμ00 X0ZXX00•单侧检验的假设形式为:Z X H0 :μ≥ μ0 , H1 :μ< μ0 X(左侧检验)n或者 H0 :μ≤ μ0 , H1 :μ> μ0 (右侧检验) n⑵.选择检验统计量并计算结果
•直接应用原始数据检验假设是有困难的,必须借助于根据样本构造出来的统计量,而且针对不
同的条件,需要选择不同的检验统计量。
•各种检验统计量的计算公式都是针对特定条件的,学习中一定要注意把条件与统计量计算公式
联系起来。
⑶.确定显著性水平
•在假设检验中有可能会犯错误。
•如果虚无假设是正确的,却把它当成错误的加以拒绝,就会犯α
时犯错误的概率,称为显著性水平。
错误。 α表示做出统计结论
•显著性水平一般为0.05和0.01。
⑷.做出统计结论
•根据已确定的显著性水平,查统计量的分布表,找到该显著性水平时统计量的临界值,并以计
算得到的统计量值与查表得到的临界值比较,根据统计决断规则做出拒绝或接受虚无假设的决定。
3.平均数显著性检验的几种情形(计算重点) ⑴ 总体为正态,总体标准差σ已知
•平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:
•例1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。现以同样的试题测
验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样? 检验步骤 ⑴ 提出假设
H0:μ≠μ0 , H1: μ=μ0 或 H0:μ≠66, H1: μ=66 ⑵.选择检验统计量并计算统计量的值
•学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已知,样本统计量的
抽样分布服从正态,以Z为检验统计量
•计算
ZX0n696611.7181.09
⑶.确定显著性水平和检验形式
•显著性水平为α
=0.05,双侧检验
⑷.做出统计结论
•查表得Zα=1.96,而计算得到的Z=1.09 •|Z|<Zα,则概率P>0.05
•差异不显著,应在0.05显著性水平接受虚无假设
•结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。
双侧Z检验统计决断规则 ∣Z∣与临界值比较 P值 ∣Z∣<1.96 1.96≤∣Z∣<2.58 ∣Z∣≥2.58 P>0.05 0.05≥P>0.01 P≤0.01 显著性 不显著 显著* 检验结果 保留H0, 拒绝H1 在0.05显著性水平拒绝H0,接受H1 极其显著在0.01显著性水平** 拒绝H0,接受H1 单侧Z检验统计决断规则 ∣Z∣与临界值比较 P值 ∣Z∣<1.65 1.65≤∣Z∣<2.33 P>0.05 显著性 不显著 检验结果 保留H0,拒绝H1 在0.05显著性水平拒绝H0,接受H1 0.05≥P>0.01 显著* ∣Z∣≥2.33 P≤0.01 极其显著*在0.01显著性水平* 拒绝H0,接受H1 例2:某市高中入学考试数学平均分数为68分,标准差为8.6。其中某所中学参加此次考试的46名学生的平均分数为63。过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市的平均分数? Z=-3.94
⑵总体为正态,总体标准差σ未知,样本容量小于30
•平均数的抽样分布服从t分布,以t为检验统计量,计算公式为:
tX0XX0Sn1dfn1
显著性 不显著 检验结果 保留H0,拒绝H1 双侧t检验统计决断规则 ∣t∣与临界值比较 P值 ∣t∣<t(df)0.05/2 P>0.05 t(df)0.05/2≤∣t∣<0.05≥P>0.01 显著* t(df)0.01/2 ∣t∣≥t(df)0.01/2 P≤0.01 在0.05显著性水平拒绝H0,接受H1 在0.01显著性水极其显著*平拒绝H0,接受* H1 单侧t检验统计决断规则 ∣t∣与临界值比较 P值 ∣t∣<t(df)0.05 P>0.05 显著性 不显著 检验结果 保留H0,拒绝H1 在0.05显著性水平拒绝H0,接受H1 在0.01显著性水极其显著*∣t∣≥t(df)0.01 P≤0.01 平拒绝H0,接受* H1 例3:某区初三英语统一测验平均分数为65,该区某校20份试卷的平均分数为69.8,标准差为9.234。问该校初三年级英语平均分数与全区是否一样?t=2.266
例4:某校上一届初一学生自学能力平均分数为38,这一届初一24个学生自学能力平均分数为42,标准差为5.7,假定这一届初一学生的学习条件与上一届相同,试问这一届初一学生的自学能力是否高于上一届?t=3.365 ⑶总体标准差σ未知,样本容量大于30 t(df)0.05≤∣t∣<0.05≥P>0.01 显著* t(df)0.01 •平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因
此可以用Z代替t近似处理,计算公式为:
例5:某年高考某市数学平均分数为60,现从参加此次考试的文科学生中,随机抽取94份试卷,
算得平均分数为58,标准差为9.2,问文科学生的数学成绩与全市考生是否相同?Z=-2.11 ⑷ 总体非正态,小样本
不能对总体平均数进行显著性检验。
第三节 平均数差异的显著性检验
一、平均数差异显著性检验的统计量及计算公式
•平均数差异的显著性检验时,统计量的基本计算公式为:
统计量X1X212SEDXH0:μ1=μ2统计量X1X2SEDX1.两总体正态,总体方差已知 为:
•总体方差已知条件下,平均数之差的抽样分布服从正态分布,以Z作为检验统计量,计算公式
⑴.两样本相关
⑵.两样本
Z两样本相关的判断
X1X221222r12•两个样本的数据之间存在着一一对应的关系时,称两样本为相关样本。常见的情形主要包括三
种: 12–同一组被试在前后两次在同一类测验上的结果; –同一组被试分别接受两种不同实验的测验结果; D–按条件相同的原则选择的配对实验结果。
•例6:某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(σ=16),结果平均智商为106。一年后再对同组被试施测,结果平均智商分数为110。已知两次测验结果的相关系数为r=0.74,问能否说随着年龄的增长和一年的教育,儿童智商有了显著提高? X1X2Z解题过程 22XXZSE•提出假设:
1n1 H0:μ1≥μ2 H1: μ1<μ2
2n•选择检验统计量并计算
•正常儿童的智力测验结果,可以认为是从正态总体中随机抽出的样本。总体方差已知,而同一
组被试前后两次的测验成绩属于相关样本。因此平均数之差的抽样分布服从正态分布,应选用Z作检验统计量,并选择相关样本、总体方差已知的计算公式。 计 算
ZX1X221222r12n10611016216220.741619
•提示:
σ1=σ2=16
确定显著性水平 α=0.05 做出统计结论
• 单侧检验时Z0.05=1.65, Z0.01=2.33 • 而计算得到的Z=1.71
•Z0.05 <|Z|<Z0.01 ,则概率0.05 >P >0.01
• 在0.05 显著性水平差异显著
• 结论:可以说随着年龄的增长和一年的教育,儿童智商有了显著提高。
2.两总体正态,标准差未知, 方差齐性,n1或n2小于30
•总体标准差未知条件下,平均数之差的抽样分布服从t分布,以t作为检验统计量,计算公式
为:
⑴.两样本相关
tX1X22S12S22rS1S2n1dfn1
•还可以计算为
tX1X22X2n1d2d/ntX1dfSEDnn1
⑵.两样本
tX1X22n1S12n2S2nn21n1n22n1n2
•例7 :为了揭示小学二年级的两种识字教学法是否有显著性差异,根据学生的智力水平、努力程度、识字量多少、家庭辅导力量等条件基本相同的原则,选择了10对学生,然后把每对学生随机地分入实验组和对照组。
dfn1n22•实验组施以分散识字教学法,而对照组施以集中识字教学法。后期统一测验结果实验组平均成
绩为79.5,标准差为9.124;对照组平均成绩为71.0,标准差为9.940,两个组成绩的相关系数为0.704。问两种识字教学法的教学效果是否有显著差异? 解题过程:
•1.提出假设
H0:μ1=μ2 H1: μ1≠μ2
•2.选择检验统计量并计算
两种识字教学法的测验得分假定是从两个正态总体中随机抽出的样本,它们差数的总体也呈正态分布。两总体标准差未知,因此平均数之差的抽样分布服从t分布,应以t为检验统计量。
•两样本为配对实验结果,属于相关样本。
tX1X22n1S12n2S2nn21n1n22n1n2
两种识字教学法教学效果差异检验计算表 序号 1 2 3 4 5 6 7 8 9 10 总和 实验组 X1 93 72 91 65 81 77 84 73 70 795 对照组 X2 76 74 80 52 63 62 82 85 72 710 d=X1-X2 17 -2 11 13 18 15 7 -1 9 -2 85 2 4 121 169 324 225 49 1 81 4 1267 dfn1n22•还可计算为
tX1X2d2d/nnn1279.5711267852/1010101
•例8:从高二年级随机抽取两个小组,在化学教学中实验组采用启发探究法,对照组采用传统讲授法教学。后期统一测试,结果为:实验组10人平均成绩为59.9,标准差为6.0;对照组9人平均成绩为50.3,标准差为7.272。问两种教学方法是否有显著性差异?(根据已有的经验,启发探究法优于传统讲授法) 解题过程:
3.456•1.提出假设
H0:μ1≤μ2 H1: μ1>μ2
•2.选择检验统计量并计算
两组化学测验分数假定是从两个正态总体中随机抽出的样本, 两总体标准差未知,经方差齐性检验两总体方差齐性,两样本容量小于30。因此平均数之差的抽样分布服从t分布,应以t为检验统计量。 计 算
tX1X22n1S12n2S2nn21n1n22n1n259.950.3106.0297.27221091092109
3.两总体非正态,n1和n2大于30(或50)
2.835•总体标准差未知条件下,平均数之差的抽样分布服从t分布,但样本容量较大,t分布接近于
正态分布,可以以Z近似处理,因此以Z′作为检验统计量,计算公式为:
⑴. 两样本相关
ZX1X221222r12nZX1X22S12S22rS1S2n
⑵.两样本
ZX1X212n122n2ZX1X22S12S2n1n2
•例9:32人的射击小组经过三天集中训练,训练后与训练前测验分数分别为:训练前平均成绩为44.156,标准差为13.650;训练后平均成绩为46.594,标准差为13.795。两组成绩相关系数为0.884,问三天集中训练有无显著效果?(根据过去的资料得知,三天集中射击训练有显著效果) 解题过程:
•1.提出假设
H0:μ1≥μ2 H1: μ1<μ2
•2.选择检验统计量并计算
训练前后的射击成绩假定是从两个正态总体中随机抽出的相关样本, 两总体标准差未知,平均数之差的抽样分布服从t分布,但两样本容量大于30,因此可以Z代替t为近似处理。 计 算
ZX1X22S12S22rS1S2n44.15646.59413.650213.795220.88413.65013.79532
2.0534.总体非正态,小样本
•不能对平均数差异进行显著性检验。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务