您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页统计学上机实验报告

统计学上机实验报告

来源:化拓教育网
福 建 工 程 学 院

实 习 报 告

专业 国际经济与贸易 班级 国贸1002 座号 3100509209

姓名 蔡小强 日期 2012年4月20日

《统计学》实验一

一、实验名称:数据的图表处理 二、实验日期:2012年03月27日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生处理数据的基本能力。通过本实验,熟练掌握利用Excel,完成对数据进行输入、定义、数据的分类与整理。

要求:就本专业相关问题收集一定数量的数据(30),利用EXCEL进行如下操作:

1. 进行数据排序 2. 进行数据分组

3. 制作频数分布图、直方图和帕累托图,并进行简要解释 4. 制作饼图和雷达图,并进行简要解释

五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据

下面是一种金属零件重量的误差数据

单位:g

61.4 63.9 73.4 57.3 54.8 56.8 76.4 32.1 53.3 46.8 54.6 87.0 60.5 60.1 46.8 54.9 39.1 26.4 65.1 71.1 32.5 52.9 19.9 32.7 37.4 19.1 53.3 61.7 60.5 27.3 40.1 30.4 81.6 71.6 48.9 55.1 77.4 52.7 47.5 47.9 58.6 60.2 48.2 38.1 58.1 27.3 67.9 74.1 表1-1

55.6 32.5 (二)实验步骤

1、将上表数据复制到EXCEL中; 2、将上述数据调整成一列的形式;

3、选择“数据-排序“得到由小到大的一列数据。 4、选择“插入-函数(fx)-数学与三角函数-LOG10”

图1-1

计算lg50/lg2=5.,从而确定组数为K=1+ lg100/lg2=6. 这里为了方便取为10组;确定组距为:(max-min)/K=(87.8-19.1)/10=6.87 取为7; 5、确定接受界限为 24.0 31.0 38.0 45.0 52.0 59.0 66.0 73.0 80.0 87.0 分别键入EXCEL 表格中,形成一列接受区域 ;

6、选“工具——数据分析——直方图”得到如下频数分布和直方图

金属零件重量误差的频数分布

表1-2

金属零件重量误差的直方图

图1-2

7、将其他这行删除,将表格调整为:

表1-3

8、选择“插入——图表——柱图——子图标类型1”,在数据区域选入接收与频率两列,在图表标题中输入频率。做出的图形如下图所示:

图1-3

9、双击上述直方图的任一根柱子,将分类间距改为0,得到新的

图.

图1-4

10、选择“插入——图表——饼图”,得到金属零件重量的误差饼图:

图1-5

11、选择“插入——图表——雷达图”,得到金属零件重量的误差雷达图

图1-6

(三)实验结果分析:从以上直方图可以发现,金属零件的重量误差大致呈对称分布,其中54.0—60.0出现的频次最多,从饼图和雷达图也能够比较清晰地看出这样的结果。

写出心得与体会:我进行了系统的统计学操作实验,加深了对统计学各方面以及对

EXCEL操作软件的应用了解,同时能更好的把实践与理论相结合。首先进行的就是对统计数据的输入与分析。这个输入过程并不轻松,既要细心也要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配输入数据。因此,输入正确的数据也就成了整个统计学实验的基础。

《统计学》实验二

一、实验名称:描述统计量计算 二、实验日期: 2012年03月27日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生处理数据的基本能力。通过本实验,熟练掌握利用Excel,完成对数据描述统计量的计算。

要求:就本专业相关问题收集一定数量的数据(30)用EXCEL计算描述统计量:

1、用函数计算描述统计量

2、利用描述统计分析工具计算描述统计量

五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据

一种袋装食品用生产线自动装填,每袋约50g,由于某种原因,不会每袋都刚

好都是50g,随机抽取100袋食品,测得数据如下:

单位:g

表2-1

(二)实验步骤

1、将上表数据复制到EXCEL中; 2、将上述数据调整成一列的形式;

3、选择“工具——数据分析——描述统计”得到如下结果

描述统计量 平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数

置信度(95.0%)

结果 50.67

0.460578249 51 53

4.605782488 21.21323232 -0.532882193 0.099133145 21 40 61 5067 100

0.913887169

函数计算公式

AVERAGE(A2:A101)

STDEV(A2:A101)/SQRT(100) MEDIAN(A2:A101) MODE(A2:A101) STDEV(A2:A101) VAR(A2:A101) KURT(A2:A101) SKEW(A2:A101)

MAX(A2:A101)-MIN(A2:A101) MIN(A2:A101) MAX(A2:A101) SUM(A2:A101) COUNT(A2:A101)

CONFIDENCE.NORM

4、利用函数计算各个描述统计量的数值,如上表所示。

(三)实验结果分析

写出心得与体会:实验二主要是对描述统计量的计算,像众数,中位数,标

准误差,方差,峰度,偏度,置信度等等,主要是进行正确的计算,通过实验二让我进一步熟悉了这些描述统计量的计算公式,懂得了该怎么算这些描述统计量。

《统计学》实验三

一、实验名称:参数估计 二、实验日期: 2012年4月10日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握利用EXCEL对总体均值、比例、方差进行估计。掌握利用EXCEL系统处理估计理论相关的实际问题。

要求:就本专业相关问题收集一定数量的数据,用EXCEL进行参数区间估计 1、总体均值在95%置信水平下的置信区间,并进行简要解释

2、两个总体均值之差(匹配样本或样本)在95%置信水平下的置信区

间,并进行简要解释

五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程

(一)问题与数据

某大学为了解学生每天上网的时间,在全校7600名学生中采取重复抽样方法随机抽取24名,调查他们每天上网的时间,得到一下的数据:(单位:小时) 3.3 4.4 2.1 4.7 3.1 2.0

1.9 1.4 6.2 5.4 1.2 1.2 5.8 2.6 5.1 2.9 2.3 6.4 4.3 3.5 4.1 1.8 4.2 2.4

假定学生每天上网时间服从正态分布,估计该校学生平均每天上网时间的95%的置信区间。

(二)实验步骤

1、将上表数据复制到EXCEL中; 2、将上述数据调整成一列的形式;

3、在EXCEL中通过函数计算得到如下结果

上网时间 计算指标 3.3 样本数据个数 4.4 样本均值 2.1

样本标准差

4.7 样本平均值的标准

3.1 置信水平 2.0 自由度 1.9 t 值 1.4 误差范围 6.2 置信下限 5.4 置信上限 1.2

1.2

5.8

2.6

5.1

2.9

2.3

6.4

计算公式 COUNT(A2:A25) AVERAGE(A2:A25) STDEV(A2:A25) D4/SQRT(24)

0.95

D2-1

TINV(1-C6,17) D8*D5 D3-D9 D3+D9

计算结果 24 3.4 1.607720278 0.328174528

0.95 23

2.109815578 0.69238773

2.7 4.1

4.3 3.5 4.1 1.8 4.2 2.4

(三)实验结果分析: 从上表中我们有 95%把握认为该校的学生平均每天上网

时间为2.7小时到4.1小时。 (四)数据与问题

为估计两种组装方法组装产品所需的时间的差异,分别让12名工人用两种方法进行组装,所需的时间如下表;

方法(u1) 方法2(u2) 28.3 27.6 30.1 22.2 29.0 31.0 37.6 33.8 32.1 20.0 28.8 30.2 36.0 31.7 37.2 26.0 38.5 32.0 34.4 31.2 28.0 33.4 30.0 26.5

试构建两种组装方法的时间之差d=u1-u2 的95%的置信区间. (五)实验步骤

1、将上表数据复制到EXCEL中;

2、由题设可知该问题所收集数据为匹配样本数据,计算差值d 方法1 方法2 (u1) (u2) d 计算指标 公式 28.3 27.6 0.7 样本数据个数 COUNT(C2:C13)

30.1 22.2 7.9 样本均值 AVERAGE(C2:C13) 29.0 31.0 -2.0 样本标准差 STDEV(C2:C13) 37.6 33.8 3.8 样本平均值的标准差

F4/SQRT(12)

32.1 20.0 12.1 置信水平 0.95 28.8 30.2 -1.4 自由度 F2-1

36.0 31.7 4.3 t 值 TINV(1-E6,11)

37.2 26.0 11.2 误差范围 F8*F5 38.5

32.0

6.5

置信下限

F3-F9

计算结果 12

3.7

5.250627668 1.5157259 0.95 11

2.20098516 3.336066 0.4

34.4 28.0 30.0

31.2 33.4 26.5 3.2 -5.4 3.5

置信上限

F3+F9 7.0

3、根据函数求得各统计量值如上表所示

(六)实验结果分析:从上表中我们有95%把握认为两种组装方法的时间之差d=u1-u2置信区间为0.4小时到7.0小时。

写出心得与体会:实验三主要是对样本的总体均值、比例和方差进行估计,有了试验一和实验二的基础,实验三做起来更加上手,在本实验中有个公式就是误差范围等于样本平均值的标准差乘上t值。做这个实验,很重要的一点就是要把计算指标和计算公式对齐,以便于进行准确的计算,而不会导致计算错误。

《统计学》实验四

一、实验名称:假设检验

二、实验日期: 2012年04月10日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握利用EXCEL对正态总体均值、比例、方差的假设检验。掌握利用EXCEL处理假设检验理论相关的实际问题。

要求:就本专业相关问题收集一定数量的数据,用EXCEL进行假设检验 1、一个总体比例的检验(α=0.05),并进行简要解释

2、两个总体均值之差的检验(α=0.05),并进行简要解释(可以选择样本或匹配样本)

五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程

(一)问题与数据

根据统计资料估计,西部某一贫困地区12岁以下的儿童中,营养不良的儿童所占比例不超过20%,然而有一家儿童福利机构认为这个比例还要高。现随机抽取100名12岁以下的儿童,发现有30人营养不良,在显著性水平 试问:这家儿童福利机构是否推翻了原来的估计。 (二)实验步骤 1、进行假设

2、计算p值为30/100=0.3

3、计算Z=2.5(计算过程要详细一点,通过EXECL进行计算) 4、比较:Z临界值为1.5

5、P值检验:选择“函数—统计—NORMSDIST”

下,

P值=(1-0.993790335)=0.006209665<0.05 (三)实验结果分析:拒绝原假设说明在 儿童中,营养不良的儿童所占比例超过20%。

(四)问题与数据

一个以减肥为主要目标的健美俱乐部声称,参加它们的训练班至少可以使减肥者平均体重减轻8.5KG以上,为了验证该声称是否可信,调查人员随机抽取了10名参加者,得到他们体重记录如下表所示。 训练前

94.5

101

110

103.5

97 88.5

96.5

101

104

116.5

下,该贫困地区12岁以下的

训练后 85 .5 101.5 96 86 80.5 87 93.5 93 102

在α=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?

(五)实验步骤 1、进行假设

2、将上述数据复制到EXCEL,调整成2列的形式,列1为训练前,列2为训练后。由题设可知该问题收集数据为匹配样本。

3、选择“工具——数据分析——t-检验: 成对双样本均值分析”,得到如下结果:

t-检验: 成对双样本均值分析

(六)实验结果分析:由题设可知,本问题为右单侧检验,t Stat>t 单尾临界=1.859548033,或者P(T<=t) 单尾=0.0420632<0.05,因此拒绝原假设,即认为该俱乐部的声称是可信的

写出心得与体会:实验四是对正态整体的均值,比例和方差进行假设检验,在六.实验过程(二)实验步骤中,z值的求解让我卡住了,后来通过与老师的交流得知了z值的计算方法,才知道是课本知识掌握的不够好,其实也不会很难,后面就比较容易了。

《统计学》实验五

一、实验名称:方差分析

二、实验日期: 2012年04月17日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握利用EXCEL进行方差分析,对方差分析结果进行分析

要求:就本专业相关问题收集一定数量的数据,用EXCEL进行方差分析 五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据

一种产品需要人工组装,先有三种可供选择的组装方法,为了检验哪种组装方法更好,现抽取15名工人,让他们分别用三种方法组装,下面是15位工人分别用三种方法在相同的时间内组装的产品数量。 方法A 1 167 168 165 170 165 1 168

方法B 129 130 129 130 131 130 129 127

方法C 125 126 126 127 126 128 127 126

1 162 163 166 167 166 165 128 128 127 128 128 125 132 127 127 125 126 116 126 125

问:在显著性水平α=0.05,三种组装方法有没有显著差异? (二)实验步骤

1、进行假设

2、将数据拷贝到EXCEL表格中

3、选择“工具——数据分析——单因素方差分析”,得到如下结果 方差分析:单因素方差分析

SUMMARY

组 列 1 列 2 列 3

观测数

15 15 15

求和 平均 方差

2484 165.6 4.542857

1931 128.7333 3.066667

1883 125.5333 7.695238

54.1396

方差分析

差异源 SS df MS F P-value F crit 组间 14873. 2 7436.822 1457.747 1.58E-39 3.219942 组内 214.2667 42 5.101587

总计

15087.91

44

(三)实验结果分析:由以上结果可知:F >F crit=3.219942或 P-value=1.58E-39<0.05,所以拒绝原假设,表明组装产品的三种方法之间有显著差异。

写出心得与体会:实验五和实验四、六差不多,都是用到数据分析这个工具,主要的工作量集中在数据的输入和数据的分析方面,比较难的就是准确进行数据

的分析,就是在根据输入的数据作出数据表,然后要进行数据分析。

《统计学》实验六

一、实验名称:相关分析与回归分析 二、实验日期: 2012年04月17日 三、实验地点:经济管理系实验室 四、实验目的和要求

目的:培养学生利用EXCEL进行数据处理的能力,熟练掌握EXCEL绘制散点图,计算相关系数,拟合线性回归方程,拟合简单的非线性回归方程,利用回归方程进行预测。

要求:就本专业相关问题收集一定数量的数据,用EXCEL进行相关回归分析(计算相关系数,一元线性回归分析,一元线性回归预测) 五、实验仪器、设备和材料:个人电脑(人/台),EXCEL 软件 六、实验过程 (一)问题与数据

随机抽取10家航空公司,对其最近一年的航空正点率和顾客投诉次数进行了调查,所得数据如下:

航空公司编号 航班正点率(%) 投诉次数(次)

1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72

8 9 10 70.8 91.4 68.5 122 18 125

(1)绘制散点图,判断二者之间的关系形态。

(2)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义

(3)检验回归系数的显著性(a=0.05) (二)实验步骤

1、将数据拷贝到EXCEL表格中

2、选择“插入——图表——散点图”,得到如下结果

从上图可知两者存在线性相关关系

3、选择“插入——fx函数——CORREL”,如下图所示: 得到航班正点率和投诉次数之间的相关系数是-0.8682626

3、选择“工具——数据分析——回归”,

SUMMARY OUTPUT

回归统计

Multiple R R Square Adjusted R Square

标准误差 观测值

方差分析

回归分析 残差 总计 Intercept X Variable 1

0.8683 0.75454 0.723858 18.88722 10

df 1 8 9 Coefficients 430.12 -4.70062

SS 8772.583994 2853.816006 11626.4

MS 8772.583994 356.7270008

F 24.5918699

Significance F 0.001108261

P-value 0.000337402 0.001108261

Lower 95% 263.79915 -6.8869294

标准误差 72.15483219 0.94734

t Stat 5.962029428 -4.959019047

Upper 95% 下限 95.0% 上限 95.0% 596.578574 263.79915 596.5785743 -2.514776 -6.8869294 -2.51477597

得到回归方程为:Y=430.12-4.70062X,回归系数a=-4.70062 表示航空正点率没增加1%, 顾客投诉次数平均下降4.70062次

(3)因为P-value=0.001108261〈0.05,拒绝原假设,回归系数显著。

写出心得和体会:回顾整个实验过程,数据输入就是统计数据的描述与分析,这是整个统计实验关键中的关键,对统计数据的众数,中位数,均值的描述可以让我们队其有一个初步的印象和大体的了解,在此基础上的概率分析,方差分析,回归问题等则更具体和深刻的向我们解释了统计数据的内在规律性。在对数据进行描述和分析过程中,excel软件的数据处理功能得到了极大地发挥,工具栏中的工具和数据功能对数据的处理时问题解决起来时事半功倍。

这次为期不长的统计学实验课是我大学生活中不可或缺的重要经历,它对我的学习以及以后的工作生活中都有很大的帮助。其一,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中理论知识得到了巩固与加强,解决问题的能力也受到了锻炼得以提升;其次,本次试验开阔了我的视野,是我对统计在现实中的运作有所了解,对于在课堂上所学的统计学知识有了进一步的掌握。再次,我能比较熟练地应用EXCEL进行数据的分析,让我能够把知识学活,用统计学的知识分析我们生活中的现象。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务