非 参 数 统 计 学
(Nonparamatric Statistics)
一、课程说明 课程编号:046301
课程性质:专业必修课
适用专业:财经类统计学专业开设。 开课学期:一般可在第四学期开设
学时与学分:总课时:40学时。其中讲授32学时,实验8学时。学分:2.5学分。 先修课程:概率论与数理统计学、描述统计学。
二、开课目的
非参数统计是与参数统计相比较而存在的统计学一个年轻、活跃而前沿的分支,含有丰富的统计思想并在实践中有着广泛的应用。非参数统计方法不依赖于总体分布及其参数,适用于多种类型的数据,进行统计推断时仅需要一些非常一般性的假设,因而具有良好的稳健性,在总体分布未知的情况下往往比参数统计方法有效。对统计学专业来说,非参数统计学课程直接构成了其学科体系的一个不可或缺的部分。
通过本课程的学习,要求学生掌握本学科的基本知识、基本概念、基本原理和基本方法;培养统计思维能力和工作能力,培养重视原始资料的完整、准确,对数据处理持严肃认真的科学态度。
设置本课程的总体目标是:
1.使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。
2.使学生系统地掌握各种非参数统计方法及其基本思想。
3.掌握各种方法的应用条件和适用场合,以便根据具体情况正确选用非参数统计方法,正确运用非参数统计方法处理实际数据资料。
4.把所学的统计专业知识与所处理的实际问题紧密结合起来,对计算结果给出合理的解释,从而作出科学的定论。
5.为进一步学习其他专业课程打好基础。
三、教学要求
(一)教学方法与手段
本课程注重实践,着重培养学生的实际动手能力、对基础资料的综合分析能力。课堂讲授通过大量实例来介绍非参数统计的基本方法;充分利用多媒体等现代化教学手段,使用SPSS进行理论与实践教学;选取实际经济生活中大量实例,要求学生用所学的非参数统计方法进行定量分析,以激发学生学习本课程的兴趣,进而培养学生分析问题与解决问题的能力。教学方法上,将案例分析教学、启发式教学、讨论式教学等结合使用。
(二)考核方式
1.考核内容。考核内容应包括所有知识点,重点是非参数统计方法在社会科学研究中的应用。考核基本知识、基本理论的掌握程度以及分析应用能力。
2. 考核方式与成绩评定。考核方式以笔试、闭卷为主。成绩评定以期末考核与学生平时作业成绩、考勤记录、课堂表现、上机实验报告等作出综合评价,具体做法:平时成绩占20%,期末笔试占80%。
四、教学中应注意的问题
1.非参数统计是一门专业性很强的课程,要求学生有扎实的数理统计基础。开课时间较早,学生对于专业知识的领悟能力和融会贯通的程度还不足,在讲授过程中要密切关注学生的接受情况,必要时需要抽出一定时间补习之前学过的相关知识,以利于对本课程的理解和掌握。
2.非参数统计也是一门应用性很强的课程,在讲授过程中要引入大量的实例和案例,让学生体会到如何用所学方法解决实际问题。并且要充分利用上机实验的时间强化学生的动手能力,督促学生利用课外时间收集合适的数据做好实验报告,亲手体验非参数统计方法的应用。
五、课程教学内容
1
第一章 导论
教学目的与要求:本章主要讲述非参数统计的提出、非参数统计与参数统计的比较,非参数统计的基本概念、常用的数据变换。通过学习,使学生①了解非参数统计的基本思想;②理解非参数统计与参数统计的区别、非参数统计的优缺点;③掌握非参数统计的几个基本概念;④掌握数据特征识别的方法以及数据变换的基本方法。
重点、难点:非参数统计与参数统计的比较、非参数统计的几个基本概念:顺序统计量、秩统计量、线性秩统计量、渐近相对效率。
第一节 非参数统计简介
一、非参数统计的提出
典型的统计推断是从假定分布族开始,但关于分布的假定是不能随便做出的,一旦假定不满足,可能得出错误的结论。而非参数统计不对总体分布做出假定,是不依赖于分布的方法。
二、非参数统计与参数统计的不同点 三、非参数统计的优缺点
第二节 非参数统计的几个基本概念
一、顺序统计量
顺序统计量的定义、基于顺序统计量的统计量、顺序统计量的分布。 二、秩统计量
秩统计量的定义、秩统计量的分布、秩统计量的性质、有结数据的秩。 三、线性秩统计量
线性符号秩统计量的定义、分布、特例;线性秩统计量的定义、分布、特例。 四、渐近相对效率
渐近相对效率的定义、不同分布下各检验方法的渐近相对效率。
第三节 数据特征和数据变换
一、数据的特征
观察单样本数据和多样本数据分布形状(对称性、尾部、群点)和分布形式的统计图。 二、数据处理
2
连续性修正和数据变换。
第二章 单样本非参数检验
教学目的与要求:本章主要讲授单样本数据的四种非参数检验方法:通过学习,使学生①掌握符号检验、Wilcoxon符号秩检验、Cox-Staut趋势检验、游程检验的基本思想和方法;②熟练掌握符号检验与Wilcoxon符号秩检验法,能正确运用这两种方法解决位置参数的推断问题;通过与t检验的比较,了解Wilcoxon符号秩检验在非参数检验中的重要地位。
重点、难点:符号检验、Wilcoxon符号秩检验
第一节 符号检验
一、符号检验的应用背景和基本思想
应用背景:二分型数据(如果是高层次数据,可转化为二分型数据)。
基本思想:分别用+,-号代表两个类别,如果两个类别差异不大,则样本中正负号的个数也应差异不大,可基于正负号的个数进行检验。 二、符号检验的步骤
检验的原假设、备择假设;统计量及其分布;检验的P值及判别。 三、符号检验的推广:位置的符号检验
先介绍中位数的符号检验,再介绍更一般的分位数的符号检验。 四、基于符号检验的置信区间
基于符号检验的中位数及分位点的置信区间。
第二节 Wilcoxon符号秩检验
一、Wilcoxon符号秩检验的应用背景和基本思想
应用背景:检验总体中位数是否等于某个特定数值,适用于定序以上尺度的数据。 假定:样本来自连续、对称的总体。
基本思想:若总体中位数等于某特定值,则样本数据应该比较均匀地分布在该值两侧,检验时不但应关注差值的符号,还应关注差值的大小。
3
二、Wilcoxon符号秩检验的步骤
检验的原假设、备择假设;统计量及其分布;检验的P值及判别。 三、基于Wilcoxon符号秩检验的置信区间
walsh平均与对称中心的H-L估计;基于Wilcoxon符号秩检验的置信区间。
第三节 Cox-Stuart趋势检验
一、Cox-Stuart趋势检验的应用背景和基本思想
应用背景:用于检验数据是否存在趋势,适用于定距及以上尺度的数据。 基本思想:如果数据存在上升趋势,则后面的数据应该普遍比前面的数据大,反之亦然。
二、Cox-Stuart趋势检验的步骤
检验的原假设、备择假设;统计量及其分布;检验的P值及判别。
第四节 游程检验
一、游程检验的应用背景和基本思想 用于检验数据的随机性。
基本思想:如果数据是随机的,游程数不应过多也不应过少。 二、游程检验的步骤
检验的原假设、备择假设;统计量及其分布;检验的P值及判别。
第三章 双样本非参数检验
教学目的与要求:本章主要讲授双样本位置参数检验。包括两样本位置参数检验和两相关样本位置参数检验。通过学习,使学生①理解两样本和两相关样本的不同,掌握相应的非参数推断方法;②熟练掌握两样本位置参数检验的方法。
重点、难点:Brown-Mood中位数检验、Wilcoxon(Mann-Whitney)秩和检验。
第一节 两样本非参数检验
一、样本和相关样本
样本和相关样本的定义,抽取样本和相关样本的方法。 二、Brown-Mood中位数检验
4
应用背景:对两个总体的中位数进行比较,适用于定序及以上尺度的数据。 基本思想:如果两个总体中位数相等,则两个样本数据应该比较均匀地分布在混合样本中位数的两侧。
检验的步骤:假设、统计量、P值及判别。 三、Wilcoxon(Mann-Whitney)秩和检验
应用背景:对两个总体的中位数进行比较,适用于定序及以上尺度的数据。 假定:两个总体具有相似的形状,但不必对称。
基本思想:如果两个总体中位数相等,则混合样本的升序排列中,两样本的数据应交替出现。
检验步骤:假设、统计量、P值及判别。
第二节 两相关样本非参数检验
一、符号检验
应用背景:检验两个配对样本所来自的总体中位数是否相等。适用于定序及以上尺度的数据。
基本思想:若两个相关样本来自一个总体,其总体中位数应该相等,配对差值的正负号个数应该相近。
检验步骤:假设、检验统计量、P值及判别。 二、Wilcoxon符号秩检验
应用背景:检验两个配对样本所来自的总体中位数是否相等。 假定:两样本均来自连续总体,且均具有对称的分布。
第四章 多样本非参数检验
教学目的与要求:本章主要学习多样本位置参数的非参数检验方法,包括多个样本位置参数检验和多个相关样本位置参数检验。通过学习,使学生①了解试验设计的基本概念,能根据数据背景选用合适的推断方法;②熟练掌握多样本位置参数的主要检验方法,并能应用于实际。
重点、难点:Kruskal-Wallis秩和检验、Jonckheere-Terpstra检验、Friedman秩和检验、
5
Cochran检验。
第一节 试验设计的基本概念回顾
一、试验设计及试验设计的分类
试验设计的概念。试验设计分为完全随机设计和区组设计两大类。前者生成样本,后者生成相关样本。 二、完全随机设计
完全随机设计的概念、特点、适用条件。 三、区组设计
区组设计的概念及分类。完全随机区组设计的概念、特点。不完全随机区组设计的概念、均衡的不完全随机区组设计(BIB)的概念、特点。
第二节 多个样本的位置参数检验
一、Kruskal-Wallis秩和检验
应用背景:检验多个总体的位置参数是否相等,适用于定序及以上尺度的数据。 假定:各样本所代表的总体具有相似的连续分布,而且所有观测值在样本内和样本间相互。
基本思想:如果多个总体位置参数相等,各样本数据应该比较均匀地分布在混合样本中。因此,各样本在混合样本中的平均秩应该差异不大。 步骤:假设、检验统计量、P值及判别 二、Jonckheere-Terpstra检验
应用背景:检验多个总体的位置参数是否存在上升或下降的趋势,适用于定序及以上尺度的数据。
假定:各样本所代表的总体具有相似的连续分布,而且所有观测值在样本内和样本间相互。
基本思想:如果各总体的位置参数存在上升趋势,前面的样本观测值小于后面样本观测值的个数应该较多。
步骤:假设、检验统计量、P值及判别。
第三节 多个相关样本的位置参数检验
一、Friedman秩和检验
应用背景:比较多个相关样本所代表的总体位置参数是否相等。适用于完全区组设
6
计生成的定序及以上尺度的相关样本数据。
基本思想:与Kruskal-Wallis相似,如果各样本所代表的总体位置参数相等,则各样本的平均秩应该差异不大。只是由于存在区组的影响,不同区组间的秩没有可比性。因此只在区组内排秩,并在此基础上计算各样本的平均秩。
步骤:假设、检验统计量、P值及判别。 二、Cochran检验
应用背景:检验多个相关样本所代表的总体是否存在差异。适用于完全区组设计生成的二元相关样本数据。
基本思想:如果多个相关样本所代表的总体不存在差异,则各样本中1的个数应该相近。
步骤:假设、检验统计量、P值及判别。 三、Page检验
应用背景:检验多个相关样本所代表的总体位置参数是否存在上升或下降的趋势。适用于完全区组设计生成的定距及以上尺度的数据。
步骤:假设、检验统计量、P值及判别。 四、Durbin检验
应用背景:检验多个相关样本所代表的总体位置参数是否存在差异。适用于均衡的不完全区组设计生成的定序及以上尺度的相关样本数据。
基本思想:与Friedman秩和检验相似。 步骤:假设、检验统计量、P值及判别。
第五章 相关分析
教学目的与要求:本章主要讲授变量间相关关系的非参数方法。包括两样本的秩相关分析、多样本的协同关系、定性变量相关性的列联分析。通过学习,使学生①了解线性相关性与秩相关性的不同;②掌握两样本的秩相关分析、多样本的协同系数、列联分析。
重点、难点:Spearman秩相关系数、Kendall 相关分析、Kendall协同系数;二维
7
2列联表的检验。
第一节 基于秩的相关分析
一、Spearman秩相关检验
Spearman秩相关系数的思想、计算方法、取值、结的处理、大样本近似、检验。 二、Kendall 相关检验
Kendall 相关系数的思想、计算方法、结的处理、检验。 三、Kendall协同系数
Kendall协同系数的思想、计算方法、结的处理、检验、与Friedman秩和检验的关系。
第二节 列联分析
一、列联表
列联表的概念、分类、频数及百分比分析。 二、二维列联表的性检验
基本思想:如果两个变量相互,则二者的联合分布等于各自的边缘分布的乘积。
22检验统计量:统计量,服从自由度为 (r-1)×(c-1)的分布。
三、二维列联表的齐性检验
基本思想:检验自变量对因变量是否有影响。如果没有影响,则自变量取值不同的情况下,因变量的分布应该是相同的。
22检验统计量:统计量,服从自由度为 (r-1)×(c-1)的分布。 2三、基于的相关性度量
Φ相关系数、列联相关系数、Cramer V相关系数。
第六章 分布检验
教学目的与要求:本章主要讲授分布检验的基本方法:包括Kolmogorov-Smirnov检验和2拟合优度检验。通过学习,使学生①熟练掌握Kolmogorov-Smirnov单样本分布检验和Kolmogorov-Smirnov双样本分布检验。②熟练掌握2拟合优度检验。
8
重点、难点:Kolmogorov-Smirnov检验和2拟合优度检验。
第一节 Kolmogorov-Smirnov检验
一、Kolmogorov-Smirnov单样本分布检验
基本思想:检验样本是否来自某种特定的分布,以样本数据的累积频数分布与特定理论分布的累积概率比较,若两者差异不大,则推论样本取自该分布。 二、Kolmogorov-Smirnov双样本分布检验
基本思想:检验两个样本是否来自同一分布,将两个样本的经验分布做比较,如果差异不大,则推论二者取自同一分布。
第二节 2拟合优度检验
2一、单样本拟合优度检验
基本思想:一个变量,不论是哪种测度尺度,都可将其样本空间划分为互不相交的k个部分。如果变量服从假设的分布,则变量在k个部分的观测频数和期望频数应该差异不大。
二、双样本2拟合优度检验
基本思想:两个样本如果来自同一分布,二者的经验分布应该差异不大。 三、多样本2拟合优度检验
基本思想:多个样本如果来自同一分布,其经验分布应该差异不大。
六、教学学时分配
非参数统计学教学课时分配表
内 容 第一章 导论 第一节 非参数统计简介 第二节 非参数统计的几个基本概念 第三节 数据特征和数据变换 第二章 单样本非参数检验 第一节 符号检验
授课学时 上机学时 6 - 6 2 9
第二节 Wilcoxon符号秩检验 第三节 Cox-Stuart趋势检验 第四节 游程检验 第三章 双样本非参数检验 第一节 两样本非参数检验 第二节 两相关样本非参数检验 第四章 多样本非参数检验 第一节 试验设计的基本概念回顾 第二节 多样本的位置参数检验 第三节 多相关样本的位置参数检验 第五章 相关分析 第一节 基于秩的相关分析 第二节 列联分析 第六章 分布检验 第一节 Kolmogorov-Smirnov检验 第二节 2拟合优度检验 总 计 32 8 4 1 6 1 6 2 4 2 七、推荐教材与参考书目: 推荐教材
吴喜之、赵博娟编著,《非参数统计》,中国统计出版社2011年版。
参考书目
(1) 王星编著,《非参数统计》,清华大学出版社2009年版。
(2)易丹辉、董寒青编著,《非参数统计:方法与应用》,中国统计出版社2009年版。
(3)王静龙、梁小筠编著,《非参数统计分析》,高等教育出版社2006年版。 (4)刘顺忠、荣丽敏、景丽芳编著,《非参数统计与SPSS软件应用》,武汉大学出版社2008年版。
(5) 孙山泽编著,《非参数统计讲义》,北京大学出版社2000年版。
10
(6) 薛留根编著,《应用非参数统计》,科学出版社2013年版。
(7) 陈希儒、方兆本、李国英、陶波编著,《非参数统计》,中国科学技术大学出版社2012年版。
(8) 李裕奇、赵联文、王沁、唐家银编著,《非参数统计方法》,西安交通大学出版社2010年版。
11