您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页心理统计学

心理统计学

来源:化拓教育网


第四章重点知识本章核心概念:

1、差异量数分为:绝对差异量数和相对差异量数

2、绝对差异量数:

标准差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。

方差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数

四分差:四分差通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。

3、相对差异量数:

差异系数:差异系数,又称变异系数、相对标准差等,使一组数据标准差与平均数的比率。通常用符号CV表示 。

4、另外,本章还讲到相对地位量数:标准分数,百分等级。

标准分数:它是一个数与平均数之差除以标准差所得的商数,它无实际单位。

百分等级:指任意分数在整个分数分布中所处的百分位置。

本章重点难点:

差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。

知识要点详情:

一、标准差

1、概念及计算公式

方差的平方根,用s或SD表示,若用σ表示,是指总体的标准差。

方差与标准差是最常用的描述次数分布离散程度的差异量数。

2、标准差的适用条件

(1)与算术平均数配合使用,与算术平均数的适用条件相同。即一组数据的一般水平适合(2)用算术平均数描述时,其离散程度宜用标准差描述;

(3)计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;

(4)在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。

3、标准差的计算方法

(1)基本公式法

(2)原始数据法

(3)分组资料标准差的计算方法

(4)由各部分的标准差合成总标准差的计算方法

4、方差和标准差的意义

方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。

它基本具备一个良好的差异量数应具备的条件:①反应灵敏;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小;⑥简单明了。

二、四分差

1、概念及计算公式

2、适用条件

(1)通常与中位数配合使用。即一组数据的集中趋势适宜用中位数描述时,差异情况要用四分差描述。

(2)一组数据中有极端数据出现时;

(3)一组数据的两端有个别数据模糊不清或分组资料有不确定组限时。

3、四分差的计算

(1)未分组资料的计算方法

首先将一组数据从大到小排序,然后用数据个数N除以4。

(2)分组资料的计算方法

三、差异系数

1、差异系数的概念

2、差异系数的应用时机

(1)同一团体不同观测值离散程度的比较;

(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。

3、计算差异系数的例子

四、相对地位量数

1、标准分数的概念

标准分数又称基分数或Z分数,是以标准差为单位表示一个分数在团体中所处位置的相对位置量数。

2、标准分数的性质

在一组数据中所有的原分数转换得出的Z分数之和为零,其Z分数的平均数亦为零。

一组数据中各Z分数的标准差为1

3、标准分数的应用

(1)在教育上,常用来确定各分数在团体中的相对位置。

(2)Z分数可用于比较分属性质不同的观测值在各自数据分布中相对位置的高低。

(3)当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总和或平均值,以示在团体中的相对位置。

第五章重点知识本章的核心概念:

1、关系

1)因果关系

一种现象是另一种现象的因,而另一种现象则是果。

2)共变关系

表面看来有联系的两种事物都与第三种现象有关。

3)相关关系

即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。

2、相关系数

相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。

3、 积差相关

积矩相关,一种计算相关的方法。

4、斯皮尔曼等级相关

另一种计算相关的方法。

学习本章内容应该注意的是相关的适用的条件。根据数据类型选择恰当的方法。

本章具体知识点如下:

一、概述

1、相关的种类

1)从其变化方向来看,相关可以分为:

正相关

负相关

零相关

2)若从变量的个数来划分,可以将相关分为:

简单相关

复相关

3)从相关关系的程度上划分,可以划分为:

高相关

中等程度相关

低相关

2、相关散点图

相关散点图的用途

判断相关是直线型的;

判断相关密切程度高低;

判断相关变化方向。

3、相关系数

作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用ρ表示,并且是指线性相关而言。

二、积差相关

1、积差相关的适用条件

1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。

2)两列变量之间的关系应是直线性的,非直线性的双列变量,不能计算线性相关。

3)两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算相关,即使计算,得到的相关也没有意义。

2、积差相关计算方法

1)基本公式计算法

2)原始数据计算法

三、其他相关

(一)斯皮尔曼等级相关

1、斯皮尔曼等级相关

两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,计算这样两变量的相关,称为等级相关。

2、适用条件

1)两变量的资料为等级测量数据,且具有线性关系;

2)连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算;

3)不要求总体呈正态分布。

3、计算方法

(二)肯德尔和谐系数

1、肯德尔和谐系数概念

又称为肯德尔W系数。当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数。

2、适用条件

适用于两列以上的等级变量

3、计算方法

(三)点二列相关

1、点二列相关的概念

两列变量一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。

2、适用条件:一列变量为正态连续变量,而另一列为二分变量。

3、计算方法

另外,还有两个变量都是分类变量时候的相关,参考书上相关内容。

第六章重点知识(1)本章的核心概念

1、概率(两种定义)

(1)一种是指在对随机事件进行n次观测时,其中某一事件A出现的次数m与n的比值。

(2)当观测次数n无限增大,计算出的概率估计值越接近真实的概率值。因这种概率是由事件A出现的次数决定,故又称为后验概率或统计概率。

2、不相容事件

所谓互不相容事件是指在一次实验或调查中,若事件A发生则事件B就一定不发生,否则二者为相容事件。

3、二项分布

是指统计变量中只有性质不同的两项群体的概率分布。

本章前两节的主要内容:

1、概率

1.1随机现象与必然现象

1.2复合事件与基本事件

1.3必然事件与随机事件

1.4频率

指事件发生的频次,是事件发生次数与实验总次数的比值,任何随机事件的频率介于0和1之间。

1.5 概率的定义

(1)先验概率

(2)后验概率

通俗地说,概率就是描述随机事件发生可能性大小的数。

1.6概率的性质

(1)任何一个随机事件A的概率都是非负的。

(2)必然事件的概率为1,必然事件是指在一定条件下必然发生的事件。

(3)不可能事件的概率为0,不可能事件是指在一定条件下必然不发生的事件。

1.7 概率的两个基本法则

(1)概率的加法定理

加法定理是指两个互不相容事件A、B之和的概率,等于两个事件概率之和。

不相容事件与对立事件的区别

(2)概率的乘法定理

两事件同时出现的概率等于该两事件概率的乘积,即P(AB)=P(A)P(B)。

2、二项分布

2.1 二项试验

(1)任何一次试验恰好有两个结果,成功与失败,或A与(读作非A)

(2)共有n次试验,并且n是预先给定的任一正整数。

(3)各次试验相互,即各次试验之间无相互影响。

(4)任何一次试验中成功或失败的概率保持相同。

2.2 二项分布

二项分布是指统计变量中只有性质不同的两项群体的概率分布。所谓两项群体是按两种不同性质划分的统计变量,是二项试验的结果。即各个变量都可归为两个不同性质中的一个,两个观测值是对立的。因而两项分布又可说是两个对立事件的概率分布。

2.3 二项分布的平均数与标准差

2.4 二项分布的应用

二项分布在心理与教育研究中,主要用于解决含有机遇性质的问题。

第六章重点知识(2)本小节的重要概念

1、正态分布的界定

本小节的具体知识点

三、正态分布

正态分布也称常态分布或常态分配,是连续随机变量概率分布的一种,是在数理统计的理论与实际应用中占有重要地位的一种理论分布。

(一)正态分布的函数(又称密度函数)

(二)标准正态分布曲线的特点

1、标准正态分布曲线在Z=0处Y取值最大,曲线下的总面积即概率的总合为1,对称轴左右各0.5。

2、曲线是以过Z=0(平均数)的纵线为对称轴呈钟形的轴对称图形。

3、标准正态分布的平均数、中数、众数三点重合在Z=0这一点上。

4、曲线向两侧先快后慢地下降,在Z等于正负1处有两个拐点;横轴是曲线的水平渐近线。

(三) 正态分布表

依据正态分布的密度函数,可用积分计算当Z为不同值时,正态曲线下的面积与密度函数值(y值)。

(四)正态分布表的结构

第一栏表明Z分数单位,即横坐标上某一点与平均数的差度,以标准差为单位,一般标以Z。

第二栏为y(即密度函数或比率数)值,即某一Z分数点上的曲线纵坐标的高度,标准正态曲线下y0=0.39,它是Z=0这一点上曲线纵坐标具有的最大值或说概率密度值。

第三栏为概率值(常标以P),即不同Z分数点与平均数之间的面积与总面积之比。

(五)正态分布表的使用

1、依据Z分数求概率P。

2、从概率P求Z分数,即从面积求差度值。

(六)正态曲线下面积的应用

1、推求考试成绩中特定区间的人数

2、推求考试成绩中某一特定人数比率的分数界限

(七)应用正态曲线时应注意的问题

1、 正态分布只是一个理论状态。以这个理论算出来的人数并不一定完全等于实际人数,它 只是一个推论值;同样的,如果样本实际人数分布与理论值有出入,也不能断定该分布就不是正态的,只有差异特别大的时候才可以说该分布不是正态的。

2、在分数线的确定中应该注意:正态分布可能只是一个理想的假设状态,如果实际上样本分布并不是正态的,那么就不可以按照正态分布来确定分数线。

3、对于正态分布,应该清楚什么时候可以用,什么时候不适宜使用。

4、标准正态分布可以同任一个正态分布建立起一一对应的关系。因此,我们可以通过标准正态分布来计算任一正态分布的概率值。

5、注意在使用了标准正态分布表之后,需要有一个向原始分数的逆转换,即:

原始分数=原始平均数+标准差×标准分数

第七章重点知识本章前两节的核心概念

1、样本分布

2、参数估计

本章前两节的主要知识点

1、样本分布:是样本统计量的分布,是统计推论的重要依据。常用的样本分布有平均数及方差的分布。

正态分布以及渐进正态分布

①样本平均数的分布:总体分布为正态,方差已知,样本平均数的分布是正态分布,平均数分布的方差为总体的方差除以样本数n,称之为变异误,平均数分布的标准差被称作标准误。总体分布非正态,但方差已知,样本容量足够大时(n≥30),样本平均数的分布为渐进正态分布。

②方差与标准差的分布:自正态总体中抽取容量为n的样本,当n足够大时(n≥30),样本方差及标准差的分布,渐趋于正态分布。

t分布:

①t分布的特点:平均值为0;以平均值0左右对称的分布,左侧t为负值,右侧t为正值;变量取值在正无穷和负无穷之间;当样本容量趋于无穷大时,t分布为正态分布,方差为1;当n-1>30以上时,t分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;当n-1<30时,t分布于正态分布相差较大,随n-1的减少,离散程度越大,分布图的中间变低但尾部变高。

②样本平均数的分布:总体为正态分布,方差未知时,样本平均数的分布为t分布;

当总体分布为非正态而方差又未知时,若满足n>30这一条件,则样本平均数的分布近似为t分布。

卡方分布:

卡方分布为正偏态分布;卡方值都为正值;卡方分布的和也是卡方分布,即卡方分布具有可加性;卡方分布是连续型分布,但有些离散型的分布也近似卡方分布。

F分布:用于分析任意两样本方差是否取自同一整体。F分布为正偏态分布,F值总为正值,因为F两个方差的比率;当分子自由度为1,分母自由度为任意值时,F值与分母自由度相同概率的t值得平方相等。

2、参数估计:

(1)点估计、区间估计与标准误

点估计:是用样本统计量来估计总体参数。样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以成为点估计。

良好估计量的标准:无偏性、有效性、一致性、充分性。

区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,能指出未知总体参数落入某一区间的概率有多大。

置信区间:也称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长

度。置信区间的上下二端点值称为置信界限。

显著性水平:是指估计总体参数落在某一区间时,可能犯错误的概率,用符号 表示。1- 为置信度或置信水平。

区间估计的原理与标准误:区间估计是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。样本分布可提供概率解释,标准误的大小决定区间估计的长度。

(2)总体平均数估计:

估计总体平均数的步骤:①根据实得样本的数据,计算样本平均数与标准误;②计算标准误,有两种情况,当总体方差已知时和当总体方差未知时;③确定置信水平或显著性水平,统计学上一般规定显著性水平为0.05;④根据样本平均数的抽样分布,确定查何种统计表,一般总体方差已知时,查正态表,当样本方差未知时,查t值表。⑤计算置信区间。

第七章第三节学习指导

三、抽样设计

(一)抽样方法

1、简单随机抽样

简单随机抽样是最基本的抽样方法,适用范周广,最能体现随机性原则且原理简单。

常用的具体抽取方式有抽签法和随机数字表法

2、机械抽样

机械抽样又称等距抽样。这种方法简便易行,将已编好号码的个体排列成顺序,然后每隔若干个抽取一个。

3、分层抽样

分层随机抽样简称分层抽样。具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。

分层的原则:各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。

4、整群抽样

从总体中抽出来的研究对象,不是一个体为单位,而是以整群为单位的抽样方法,称为整群抽样。整群抽样往往与分层抽样结合,适合于大规模的调查研究。

(二)样本容量的确定

一个合理、可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜的抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。

第八章重点知识(1)假设检验是通过样本统计量得出的差异作出一般性结论,判断总

体参数之间是否存在差异,包括参数检验和非参数检验。

1、假设:是根据已知理论与事实对研究对象所作的假定性说明。

2、假设检验:假设检验的基本思想是“反证法”式的推理,通过检验虚无假设 的真伪来反证研究真实假设 的真伪,若 为真,则 为假,而 为假, 为真,而且无论作出 是真还是假,其结论都带有概率性质。

3、假设检中的两类错误:I型错误和II型错误。当虚无假设H0本来为正确的,但拒绝了H0,这类错误成为弃真假设,即I型错误,其发生的概率以α表示,古又常常称为α型错误;当虚无假设H0本来不正确但却接受了H0,这类错误为取伪假设,即II型错误,发生的概率以β表示,因而又叫β型错误。α与β是在两个前提下的概率,α是拒绝H0时犯错误的概率(这时前提是“H0”为真);β是接受时H0犯错误的概率(这时“H0为假”是前提),所以α+β不一定等于1。在其他条件不变的情况下,两者不可能同时减小或增大,一般情况下,α减小时,β一定增大,这时可以通过增大样本容量,在规定α的同时,来尽量减小β。统计检验力1-β是一个很重要的统计概念。

4、假设检验的步骤:建立虚无假设和备择假设,选择适当的检验统计量,规定显著性水平,计算检验统计量的值,做出决断。具体的检验方法因检验所使用的统计量及样本总体分布而有不同的类型。

5、假设检验处理的两类问题:一类是样本统计量与相应总体参数的差异检验,如平均数与总体平均数之间的检验,属于一个单样本的平均数检验;另一类是两个样本统计量之间差异的检验,如两个平均数、两个方差相互间的差异,属于两个样本组的统计量之间的差异。

第八章重点知识(2)第八章“假设检验”重点内容(续)

后三节的主要学习目标是:

1、均值的假设检验及几种检验方法前提条件的比较与应用;

2、平均数均值差异的显著性检验及几种检验方法前提条件的比较与应用;

本章节的主要知识点

一、回顾关于样本均值抽样分布的一些结论:

1、总体分布正态,总体方差已知时,无论样本容量大小,样本平均数的抽样分布为正态分布;

2、总体分布为正态,总体方差未知时,只要样本容量大于30,样本平均数的分布近似正态分布;

3、总体分布为非正态,但总体方差已知,若样本容量n足够大,样本平均数为渐近正态分布。

4、当总体方差未知,且样本量小于30时,这时平均数的抽样分布为t分布。

二、总体平均数的显著性检验

1、总体服从正态分布,总体标准差已知

2、总体正态分布,总体标准差未知

1)当样本小于30,其中标准误中的总体标准差要用样本标准差代替。

2)当样本大于30时,大样本时,检验样本平均数与总体平均数间的差异可用Z检验。

3、总体非正态分布

若总体服从正态分布,可根据条件选用Z检验或t检验;如果不服从正态分布,则应采用非参数检验方法。

三、两个平均数间差异的假设检验

1、两个样本平均数间差异的检验

1)总体方差已知时,两样本平均数间差异的检验。

当总体正态,总体方差已知时,无论样本大小,均可采用Z检验。

2)总体方差未知时,大样本平均数间差异的检验

3)总体方差未知,小样本平均数间差异的检验:T检验

2、两个相关样本平均数间差异的检验

相关样本是指两样本数据间存在一一对应的关系。

主要有两种情况:

一是同一组被试在不同条件下(两种实验方法或实验前后)形成的两组样本间存在相关;

二是在成堆匹配的条件下两组杯时形成的样本存在相关。

1)总体方差已知,Z检验

2)总体方差未知,样本大于30.仍用Z检验。

3)总体方差未知,样本小于30,采用T检验。

四、其他统计量的假设检验

1、积差相关系数的假设检验

1)样本相关系数与总体相关系数间差异的显著性检验

2)两样本相关系数间差异的显著性检验。

2、其它相关系数的假设检验

3、比率的假设检验

4、方差间差异的假设检验

第九章重点内容(1)本章前两节的内容

一、方差分析的基本原理

二、单因素完全随机设计的方差分析

一、方差分析的基本原理

(一)方差分析的逻辑思想

1、如果把实验获得的多个平行样本的全部数据视为一个整体,则数据间存在着变异,即数据不完全相同。造成变异的因素是多方面的,有些可能是由被控制的样本组间变异产生的,有些可能是由于随机抽样误差及其他未知因素造成的。

2、方差分析就是将总体变异分解为样本组间的变异和由抽样误差等其他原因产生的组内差异,并分析变异的各部分间的关系。

3、方差分析是在变异分解的基础上,通过方差之比(即F值),实现对多个平均数间差异的显著性检验的。

4、方差的可加性是方差分析的基本理论依据。

5、方差分析是把总平方和分解为组间平方和和组内平方和

6、在方差分析中,研究者关心的是组间均方是否显著地大于组内均方(如果组间均方小于组内均方,则无需检验),所以在求F值时,总是把组间均方放在分子的位置上,采取

单尾检验。

二、单因素完全随机设计的方差分析

1、什么叫单因素完全随机设计

在实验中如果仅有一个实验因素,这个因素又分成k种不同水平(k>2)或k种不同处理;将N名被试随机分成k个实验组,每个实验组又被随机指定接收一种实验处理,这种实验设计就叫做单因素完全随机化设计。

此时,k组不同处理间是相互的。

2、逻辑假设

由于被试是被随机选取又被随机分配到各组中,因此在理论上认为各组被试在实验前其水平是相当的。如果接受实验后,各组间的实验结果上存在显著差异,则可认为这种差异是由于实验处理造成的。

3、单因素完全随机设计方差分析方法

1)依照原始数据

建立假设

求平方和与自由度

求均方

进行F检验

列方差分析表

2)根据已知样本统计量进行方差分析

三、课后练习

讲义后面“思考和练习”中:

四、计算题

1、2、3和4等四道题。

第九章重点内容(2)第九章 方差分析(续)

三、单因素随机区组设计的方差分析

1、在完全随机设计中,组内变异包括实验误差和被试间个别差异两部分。因为每个样本组中的被试之间并不能保证水平完全相当,存在个别差异。

2、如果能把被试间个别差异从组内变异中分离出去,就会降低实验误差,提升F值,从而增加实验数据的有效性。

3、随机区组设计就是从这个角度出发进行的实验设计。

4、随机区组设计的做法是把同一总体中随机抽取的被试,按照条件相同的原则分成n个组(区组),使每个区组内的被试性质、水平尽量相同。在实验时,要求做到:

(1)每个区组都接受所有k个实验处理;

(2)取组内的每个被试随机地分别接受实验处理中的某一种;

(3)每种实验处理在不同区组中重复次数相同。

5、每一区组内的人数分配大致有以下三种方式:

第一种,每个被试作为一个区组,即每个被试接受全部k个实验处理。

第二种,每一区组内的人数是处理个数的整数倍。

第三种,区组内的被试以团体为单位,而不是以个体为单位。

6、单因素随机区组设计方差分析方法

四、平均数间的多重比较

方差分析在综合检验多组平均数间的差异时,如果被比较的多个平均数间差异显著。并不意味着每一对平均数间差异都显著,只是说明至少有一对平均数间差异显著。

若想知道到底哪一对或哪几对平均数间差异显著,这就要对各个平均数间逐对进行比较,统计上称为平均数的多重比较。

(一)多重比较的T检验法

(二)多重比较的Q检验法

第十章重点内容(1)重要概念

1、卡方检验

它是检验计数或次数资料的实际观测次数分布理论次数分布之间的差异是否显著的方法。具体地说,卡方检验可用于按照一个标志分组的资料中,检验每一组实际观测次数与理论次数是否吻合,用于同一个资料按两个分类标志各分成若干组的资料中,检验两种分类标志下的现象间是相互关联还是彼此的问题。

本章第一节的重要内容知识点

一、吻合性检验

1、吻合性检验概念

吻合性检验就是检验按一个标志分组的实得分布与理论分布是否吻合,也就是检验按一个标志分组的实际观测所得的分布与原有经验分布或原始总体分布是否一致的问题。

2、实得分布与多项分布的吻合检验

实得分布与多项分布吻合性检验是检验实际观测次数的分布是否与某理论上的多项分布一致的问题,或者说两者是否存在差异的问题。

例 从高中入学新生中随机抽取114名学生,进行了关于取消文、理分班的测验。结果赞成取消的有56名,不赞成取消的有30名,不表态的有28名,试问这个结果能否说明在新生中对取消文、理分班明显存在意见分歧?

3、实得分布与正态分布的吻合性检验

实得分布与正态分布的吻合性检验是检验样本来自的总体是否服从正态分布,或者说两者是否存在显著差异的问题。

对实得分布与正态分布是否吻合进行卡方检验,关键在于按正态分布的理论求出各组的理论次数。求理论次数的步骤如下:

1)求出已分组数据的平均数和标准差。

2)求每一组的实上限。

3)求出每组的实上限与平均数离差。

4)用每组的离差除以标准差求得Z值。

5)根据Z值查正态分布表,查出每一Z值以下的总面积。

6)求出每组内所包含的面积,即该组实上限以下面积减去其下一组实上限以下面积。

7)将次数分布表的总次数分别乘以每组内所包含的面积比例。即得到各组的理论次数。

二、性检验

1、性检验概念

性检验是对研究资料按两种分类标志分类,检验两种分类标志下的现象间是否相互的问题。

2、在进行性检验时,通常都要把资料整理成列联表。

3、步骤

1)统计假设

2)理论次数的计算

3)自由度的确定

4)统计方法的选择

5)结果及解释

第十章重点知识(2)二、其他非参数检验法

1、符号检验法

(1)定义 符号检验法是以成对数据之差值的正负号多少为依据的统计检验方法。

(2)适用条件

符号检验法适用于配对资料差异的显著性检验。假设两对数据分别用X和Y来表示,比较X与Y的大小,如果X大于Y,则记为“+”,如果X小于Y,则记为“-”,如果X等于Y,则记为“0”。

(3)检验方法

A 小样本的检验方法

B 大样本的检验方法

(4)评价

无论是大样本还是小样本,也无论样本来自的总体分布形态如何,只要是配对资料,都可以用符号检验法来检验其差异情况。

但是由于符号检验法在检验中只注意差异的方向,不管差异量的大小,所以会失去存在于样本之中的许多信息。

对于大样本的符号检验法通常都用Z检验,也可以使用查表的方法。但两种方法的结果有可能出现矛盾,此时,建议使用查表法。

2、符号秩和检验法

检验步骤:

(1)计算各队数据的差数,取其绝对值。

(2)把所有差数的绝对值有小到大排成等级,称为秩。

(3)计算正差等级之和,计算负差等级之和。等级之和称为秩和。

(4)将T值与符号秩和检验表所列临界值相比较,来判断差异是否显著。

检验方法

A 小样本的检验方法

B 大样本的检验方法

3、秩和检验法

检验步骤

(1)把两个样本的数据混在一起由小到大排成等级,最小的列为1等,其次列为2等,以此类推。当遇到相同数据时,把相同数据所占的等级相加除以相同数据的个数,用平均等级表示。

(2)计算容量较小的样本数据等级之和,即秩和,用T表示。当两样本容量相等时,以较小的秩和为T。

(3)将计算的T值与之和检验表中某a水平下的界限值比较,判断两样本的差异是否显著。

检验方法

A 小样本的检验方法

B 大样本的检验方法

4、中位数检验法

(1)定义和基本思想

中位数检验法是通过对来自两个总体的两个样本数据在联合中位数上、下分布的情况,来推断两个样本是否来自同一个总体。

中位数检验法的基本思想是假设两个样本来自的总体分布相同,这样,每个样本中在联合中位数上下出现的数据个数应大体相同。若两个样本在中位数上下出现的数据个数差异较大,则有理由否定两个样本来自同一个总体的假设。

(2)中位数检验法的具体步骤:

首先将各样本的数据混合后排序,求出混合后数据的联合中位数;然后分别统计每个样本中数值大于和小于中位数的数据个数,列成2×k列联表,并计算卡方值;最后将计算的卡方值与某显著性水平下的临界值进行比较,来推断两样本是否来自同一个总体。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务