您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页沈阳建筑大学统计学实验报告超级完整版

沈阳建筑大学统计学实验报告超级完整版

来源:化拓教育网
学号:

课程名称:实验学时:实验人姓名:

实验报告

统计学 学年、学期: 2014年秋季 16 实验项目数: 四 专业班级: 实验一:统计软件Spss、Excel介绍;数据的图表展示 实验日期: 2014 年 11 月 20 日 主要实验内容 统计软件Spss、Excel的应用介绍;利用软件进行统计数据的整理和绘制各种统计图表。作业:练习题2.1、2.2、2.3、2.4 实验操作记录: 2.1(1)用Excel绘制频数分布表:选择【插入】菜单中的【数据透视表或数据透视图】 (2)用Excel绘制条形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【条形图】 (3)用Excel绘制帕累托图:绘制好条形图,然后将条形图中的数据按升序或降序顺序重新排列 (4)用Spass绘制饼图:【Graphs】—>【Interactive-Pie-Clustered】,第2步将某个分类变量选入【Slice】点击【Pies】 2.2(1)用Excel生成定量数据的频数分布表:【数据】——>【数据分析】——>【直方图】,选择【图表输出】单击【确定】 (2)用Excel绘制直方图:输入输出区域,然后选择【数据】——>【数据分析】——>【直方图】 (3)用Spass绘制茎叶图:【Analyze】——>【Descriptive statistics-Explore】第2步:将变量选入【Variables】 2.3(1)用Excel绘制环形图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【环形图】再选【环形图】 (2)用Excel绘制雷达图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【雷达图】 2.4 用Excel绘制箱线图:绘制好频数分布表,选择表中数据,然后选择【插入】中的【其他图表】再选【箱线图】 第 十三 教学周 实验总结:通过此次试验,加深了我对Excel和Spass操作软件的应用了解,同时能更好的把实践与理论相结合。首先进行的就是对统计数据的输入与分析。这个输入过程,既要细心也要用心。画图时,不仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配输入数据。 教师评语: 项目 预习 实验过程 作业 报告书写 出勤和课堂纪律 其他 本次实验成绩 得分 成绩合计: 教师签字: 批改日期:

2.1

为评价家电行业售后服务的质量,随机抽取由100个家庭构成的一个样

本。质量服务的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。调查结果如下:(数据略) (1)制作一张频数分布表。

家电行业售后服务质量评价等级频数表

评价等级 A B C D E 总计 频数 14 21 32 18 15 100 频率 14% 21% 32% 18% 15% 1 (2)制作一张条形图,反映评价等级的分布。

(3)绘制评价等级的帕累托图。

(4)制作一张饼图,反映评价等级的构成。

家电行业售后服务质量评价等级饼形图15%14%ABCDE18%21%32%

2.2为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进

行测试,所得数据如下:(数据略)

(1)以组距为10进行分组,整理成频数分布表。

灯泡使用寿命频数分布表

按销售额分组(万元)

650-660 660-670 670-680 680-690 690-700 700-710 710-720 720-730 730-740 740-750 合计

频数 2 5 6 14 26 18 13 10 3 3 100

频率 0.02 0.05 0.06 0.14 0.26 0.18 0.13 0.10 0.03 0.03 1.00

答:从直方图可以直观地看出,灯泡使用寿命的分布基本上是对称的,右边的尾部稍长一些,灯泡使用寿命接近正态分布。 (3)制作茎叶图,并与直方图作比较。

使用寿命 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 Extremes (=<651)

1.00 65 . 8 2.00 66 . 14 3.00 66 . 568 3.00 67 . 134 3.00 67 . 679

7.00 68 . 1123334 7.00 68 . 555

13.00 69 . 0011112223344 13.00 69 . 556667788 8.00 70 . 00112234 10.00 70 . 56667788 6.00 71 . 002233 7.00 71 . 56778 4.00 72 . 0122 6.00 72 . 5679 1.00 73 . 3 2.00 73 . 56 1.00 74 . 1 1.00 74 . 7

1.00 Extremes (>=749) Stem width: 10

Each leaf: 1 case(s)

答:比较直方图与茎叶图:直方图的数据分布很方便,但原始数据看不到了,茎叶图则不同,不仅可以看出数据的分布,还能保留原始数据的信息。

2.3甲、乙两班有40名学生,期末统计学考试成绩的分布如下:

(1)画出两个班考试成绩的环形图,比较它们的构成。

甲、乙两班考试成绩环形图5%20%23%10%8%15%15%优良中及格23%44%37%不及格

(2)画出雷达图,比较两个班考试成绩的分布是否相似。

甲、乙两班考试成绩雷达图201510不及格50良人数 甲班人数 乙班优及格中

答:从图中可以看出甲、乙两班的成绩分布不相似,没有相似性。

2.4 下表是我国10个城市2006年各月份的气温(°C)数据:(数据略)

绘制各城市月气温的箱线图,并比较各城市气温分布的特点

答:从箱线图可看出,这10个城市的月气温存在较大差异,离散程度高的城市为沈阳、北京、郑州、武汉;离散程度低的为海口、昆明、广州。月气温较高的城市主要为中位数较大的海口、广州,月气温较低的为城市中位数较小的沈阳;月气温分布较对称的城市主要有北京、沈阳;月气温分布不对称的城市主要有:海口;月气温存在极值的城市有沈阳、北京、重庆。

实验二:用统计量描述数据;概率分布;参数估计 实验日期: 2014 年 11 月 27 日 主要实验内容 利用Spss、Excel软件对数据进行概括性度量、计算概率分布的概率及概率值,进行参数估计。作业:练习题3.5、4.4、5.3、5.7 实验操作记录: 3.5 用Excel计算描述统计量: 【工具】——>【数据分析】——> 【描述统计】——>【确定】——>【输入区域】——>【输出选项】——>【汇总统计】 4.4 用Spass绘制正态概率图:第1步:【Analyze】——>【Descrictive Statistics】——>【P-P Plot】或【Q-Q Plot】 5.3 用Spass求置信区间:第1步:选择【Analyze】然后选择 【Descriptive statistics-Explore】选项进入主对话框 5.7 用Spass求两个总体均值之差的区间估计:【Analyze】——>【Compare Means—Paired- Samples T Test】将两个样本同时选入【Paired Variables】 第 十四 教学周 实验总结:实验二主要是对描述统计量的计算,像众数,中位数,标准误差,方差,峰度,偏度,置信度等等。通过这次试验,我进一步熟悉了这些描述统计量的计算公式,懂得了该怎么算这些描述统计量,此外,我还掌握了一些数据统计方面的技能:利用EXCEL进行数据处理、描述性统计及区间估计。在具体的操作过程中,我感受到,合理并充分利用EXCEL对我们进行数据统计具有很大的作用,能够使我们更加直观地看到数据,一目了然。 教师评语: 出勤和实验纪律 本次实验绩 成 项目 得分 成绩合计: 预习 实验过程 练习题 报告书写 其他 批改日期: 教师签字:

3.5

一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方

法更好,随机抽取15个工人,让他们分别用3种方法组装。

列1 平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数

165.6 0.550325

165 1 2.131398 4.542857 -0.1345 0.351371

8 162 170 2484 15

列2 平均 标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数

128.7333 0.452155

129 128 1.75119 3.066667 0.454621 -0.17448

7 125 132 1931 15

列3 平均

标准误差 中位数 众数 标准差 方差 峰度 偏度 区域 最小值 最大值 求和 观测数

125.5333 0.716251

126 126 2.774029 7.695238 11.66308 -3.23793

12 116 128 1883 15

答:(1)从集中度,离散度和分布形状三个角度统计量来评价。从集中度看,方法A的平均水平最高,方法C最低;从离散程度看,方法A离散系数最小方法C最大;从分布形状看,方法A和方法B偏斜程度都不大,方法C则较大。 (2)综合来看,应选择方法A,因为平均水平较高且离散程度小。

4.4由30辆汽车构成的一个随机样本,绘制正态概率图。

答:由正态概率图可以看出,汽车耗油量基本服从正态分布。

5.3某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他

们每天上网的时间(单位:小时),得到数据如下:(数据略)

求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。

One-Sample Statistics 加班时间 N 18 Mean 13.56 Std. Deviation 7.801 Std. Error Mean 1.839 One-Sample Test 加班时间 t 7.373 df 17 Sig. (2-tailed) Test Value = 0 95% Confidence Interval of the Difference Mean Difference 13.556 Lower 9.68 Upper 17.43 .000

平均数 3.32

方差 2.59

标准差 1.61

置信水平 90% 95% 99% 置信下限 2.88 2.79 2.63 置信上限 3.76 3.84 4.01

5.7一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自

信心测试,得到自信心测试分数如下:(数据略)

构建两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间。

Paired Samples Statistics

Pair 1

方法1 方法2

Mean

72.60 61.60 N

10 10 Std. Deviation

14.073 14.759 Std. Error Mean

4.450 4.667

Paired Samples Correlations

Pair 1

方法1 & 方法2

N

10 Correlation

.8 Sig.

.000 Paired Samples Test Std. Paired Differences 95% Confidence Interval of Std. Error Mean 2.066 the Difference Lower 6.327 Upper 15.673 t 5.325 df 9 Sig. (2-tailed) .000 法2 Mean 11.000 Deviation 6.532 Pair 1 方法1 - 方

答:从表中可以看出两种方法平均自信心得分之差μd=μ1-μ2的95%的置信区间为(6.327,15.673)

实验三:假设检验; 分类变量的推断;方差分析与实验设计 实验日期: 2014 年 12 月 4 日 主要实验内容 利用Spss、Excel软件对数据进行假设检验、分类变量的推断、方差分析与实验设计。作业:练习题6.9、7.2、7.4、8.3、8.6 实验操作记录: 6.9(1)1)用Excelt-检验:双样本等方差假设:第1步:将原始数据输入到Excel工作表格中, 选【工具】——>【数据分析】——>【t-检验:双样本等方差假设】 2) 用Excelt-检验:双样本异方差假设:第1步:将原始数据输入到Excel工作表格中, 选【工具】——>【数据分析】——>【t-检验:双样本异方差假设】 (2)用Excelt-检验:F-检验 双样本方差:第1步::【工具】——> 【数据分析】——>【F-检验 双样本方差】 7.2 Spass—期望频数不等拟合优度:先指定“频数”变量,【Analyze】→【NonparametricTest】→【Chi Square】将频数变量选入【Test Variable List】 7.4 Spass性检验:将列联表中的数据转换为原始数据形式,【Analyze】→【Descriptive Statistics-Crosstabs】,行变量【Row(s)】,列选入【Column(s)】 8.3 Excel单因素方差分析:选择“工具 ”下拉菜单,【数据分析】,然后选择【单因素方差分析】选择【确定】,出现 对话框 8.6 Excel: 可重复双因子分析:选择“工具”下拉菜单,并选择【数据分析】选项,在分析工具中选择【方差分析:可重复双因子分析】 Spass:可重复双因子分析:选择【Analyze】,并选择【General Linear Model-Univaiate】进入主对话框。 第 十五 教学周 实验总结:实验三是对正态整体的均值,比例和方差进行假设检验,在实验过程中,许多地方让我卡住了,后来通过与老师的交流得知了正确的方法,这才知道是课本知识掌握的不够好。除此之外,实验三还进行了方差分析, 这与之前的实验比较相似,都是用到数据分析这个工具,主要的工作量集中在数据的输入和数据的分析方面,比较难的就是就是在根据输入的数据作出数据表,然后要进行数据分析。 教师评语: 项目 预习 实验过程 练习题 报告书写 本次实得分 出勤和实验纪律 其他 验成 绩 成绩合计: 批改日期: 教师签字: 6.9

为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者

选择了面积、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:(数据略)去显著性水平α=0.05,检验:

(1)新肥料获得的平均产量是否显著地高于旧肥料?假设条件为: 1)两种肥料产量的方差未知但相等,即σ1²=σ2²。 2)两种肥料产量的方差未知且不相等,即σ1²≠σ2²。

解:(1)设μ1=新肥料,μ2=旧肥料。H0: μ1-μ2≥0;H1: μ1-μ2<0。

t-检验: 双样本等方差假设

平均 方差 观测值 合并方差 假设平均差 df t Stat

P(T<=t) 单尾 t 单尾临界 P(T<=t) 双尾 t 双尾临界

变量 1 100.7

24.115747

20

28.73684211

0 38

-5.427106029 1.73712E-06 1.68595446 3.47424E-06 2.0243941

变量 2 109.9 33.357474

20

1)t=-5.427,P=1.73712E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料。

t-检验: 双样本异方差假设

平均 方差 观测值 假设平均差 df t Stat

变量 1

100.7

24.115747

20 0 37

-5.427106029

变量 2

109.9 33.357474

20

P(T<=t) 单尾 t 单尾临界 P(T<=t) 双尾 t 双尾临界 1.87355E-06 1.68709362 3.74709E-06 2.026192463

2)P=1.87355E-06,拒绝原假设,新肥料获得的平均产量显著地高于旧肥料 F-检验 双样本方差分析

平均 方差 观测值 df F

P(F<=f) 单尾 F 单尾临界

变量 1

100.7

24.115747

20 19

0.722940991 0.243109655 0.4612010

变量 2

109.9 33.357474

20 19

(2)提出假设:H0:σ1²/σ2²=1;H1: σ1²/σ2²=1

由于P=0.243109655>0.025,不拒绝原假设,没有证据表明两种肥料的方差有显著差异。

7.2

一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男

女观众进行了调查。

男性 5 6 12 16 25 Total Observed N 5 6 12 16 25 Test Statistics Expected N 7.0 28.1 13.2 10.5 5.3 Residual -2.0 -22.1 -1.2 5.5 19.7 Chi-Square df 男性 94.942a 4 Asymp. Sig. a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.3. .000 解:提出假设:H0:男性观众喜欢该档娱乐节目的比例和女性一致;H1:男性观众喜欢该档娱乐节目的比例和女性不一致 由于P=0.858>0.05,不拒绝原假设,表明男性观众喜欢该档娱乐节目的比例和女性一致。 7.4

为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业

的销售部门对东部地区、中部地区和西部地区的四百个消费者做抽样调查,检查地区与 所购买的汽车价格是否有关。

Case Processing Summary 汽车价格 * 地区 N 400 Valid Percent 100.0% N Cases Missing Percent 0 .0% N 400 Total Percent 100.0%

Pearson Chi-Square Likelihood Ratio N of Valid Cases

Value

29.991a 30.683 400 df

6 6 Asymp. Sig. (2-sided)

.000 .000

a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 21.00.

汽车价格 * 地区 Crosstabulation 汽车价格 10—20万元 Count Expected Count 东部地区 50 56.0 20 35.0 30 24.5 地区 西部地区 50 48.0 40 30.0 20 21.0 中部地区 60 56.0 40 35.0 20 24.5 Total 160 160.0 100 100.0 70 70.0 10万元以下 Count Expected Count 20—30万元 Count Expected Count 30万元以上 Count

Expected Count

40 24.5 140 140.0

10 21.0 120 120.0

20 24.5 140 140.0

70 70.0 400 400.0

Total Count

Expected Count

解:提出假设:H0:地区与所购买的汽车价格;H1:地区与所购买的汽车价格不

由于P值接近于0,拒绝原假设,表明地区与所购买的汽车价格不。

8.3 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企

业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h)数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异(α =0.05)。如果有差异,试用多重比较检验哪些企业之间有差异?

解:单因素方差分析:提出假设:

H0 :α1= α2 = α3 ; H1 : α1,α2 ,α3 不全为0

SUMMARY

组 列 1 列 2 列 3

方差分析 差异源 组间 组内 总计

观测数

5 5 5

求和

222 150 213

平均 方差

44.4 28.3

30 10

42.6 15.8

MS F P-value 307.8 17.06839 0.00031 18.03333

SS 615.6 216.4 832

df

2 12

F crit 3.885294

14

由于 F= 17.07 >F0.05(2,12) = 3.,因此拒绝原假设H0,即三个企业生产的电池的平均寿命之间有显著差异。

多重比较检验: 一:提出假设:

检验1:H0 :α1 =α2 H1: α1≠α2 检验2:H0 :α1 =α3 H1: α1≠α3 检验3:H0 :α2=α3 H1: α2≠α3 二:计算检验的统计量:

|y1-y2|=14.4 |y1-y3|=1.8 |y2-y3|=12.6 三:计算LSD

根据方差分析表可知,MSE=18.03333。t分布的自由度为n-k=12,根据LSD计算公式计算LSD=5.85 四:做出决策

|y1-y2|=14.4 >5.85,拒绝H0 ,A企业和B企业的电池的平均寿命之间有显著差异

|y1-y3|=1.8<5.85, 不拒绝H0 ,A企业和C企业的电池的平均寿命之间没有显著差异

|y2-y3|=12.6>5.85拒绝H0 ,B企业和C企业的电池的平均寿命之间有显著差异。

8.6

城市道路交通管理部门为研究不同的路段和不同的时段对行车时间的影

响,让一名交通分别在 3 个路段的高峰期与非高峰期亲自驾车进行试验,通过试验共获得 30 个行车时间的数据单位:分。试分析路段、时段以及路段和时段的交互作用对行车时间的影响 α =0.05。 Exel:

方差分析:可重复双因素分析

SUMMARY 高峰期 观测数 求和 平均 方差 非高峰期 观测数 求和 平均 方差 总计 观测数 求和 平均 方差

路段3

5 172.2 34.44 2.723 5 141.4 28.28 5.797 10 313.6 31.36 14.32711

F crit 2.456281 3.554557

总计

15 505.4 33.69333 8.702095 15 412.4 27.49333 11.22067

路段1

5 181.4 36.28 2.267 5 150 30 5.265 10 331.4 33.14 14.30267

9 2 18

路段2

5 151.8 30.36 2.518 5 121 24.2 6.025 10 272.8 27.28 14.33733

方差分析

差异源 SS 行 355.7787 列 180.5147 误差 30.92533 总计

567.2187

df

MS

39.53096 90.25733 1.718074

F

23.00888 52.53402 P-value 4.18E-08 3.06E-08

29

解:H0:无影响 H1:有影响 1. 路段对行车时间的影响

P=4.18E-08<α=0.05,表明路段对行车时间的影响显著。 2. 时段以对行车时间的影响

P=3.06E-08<α=0.05,表明时段以对行车时间的影响显著。 3.路段和时段的交互作用对行车时间的影响

F=0.026956< F crit=3.885294,表明路段和时段的交互作用对行车时间的影响显

著。 Spass:

Between-Subjects Factors

时段

非高峰期 高峰期

N

15 15 10 10 10 路段 路段1 路段2 路段3

Tests of Between-Subjects Effects Dependent Variable:行车时间 Type III Sum of Source Corrected Model Intercept 时段 路段 Error Total Corrected Total Squares 468.815a 28078.561 288.300 180.515 98.404 285.780 567.219 df 3 1 1 2 26 30 29 Mean Square 156.272 28078.561 288.300 90.257 3.785 F 41.290 7418.830 76.174 23.848 Sig. .000 .000 .000 .000 a. R Squared = .827 (Adjusted R Squared = .806)

实验四:一元线性回归;多元线性回归;时间序列预测及对实际数据进行分析 实验日期: 2014 年 11 月 11 日 主要实验内容 利用Spss、Excel软件进行一元线性回归、多元线性回归、时间序列预测及对实际数据进行综合分析。作业:练习题9.2、9.3、11.1、11.3 实验操作记录: 9.2:选择【Analyze】【Correlate - Bivariate】,将两个变量(本例为销售收入和 广告费用)分别选入【Variables】,点击【OK】。 9.3:选择【工具】下拉菜单,并选择【数据分析】选项在分析工具中选择【回归】,选择【确定】。 11.1:选择【工具】→数据分析。在分析工具中选择【移动平均】,单击确定。 11.3:选择【Analyze-Forecasting】【Create models】,进入主对话框,将预测变量选入第 十六 教学周 【Dependent Variables】。在【Method】下选择【Exponential Smoothing】,点击【Criteria】,在【Model Type】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主对话框。 实验总结:通过本次实验,我不仅仅是掌握操作步骤完成了实验任务,更重要的是在实验中验证自己的所学知识的掌握和运用。统计学的学习就是对数据的学习,而通过实验可以加强我们对统计数据的认知和运用,更好的学习统计学的知识。经过了几节课的实验,我发现做实验有许多需要注意的地方,尤其输入数据时不能出错,只有掌握了这些技巧才能让实验结果变的更加准确和方便。 教师评语: 本次实验绩 成 项目 得分 成绩合计: 预习 实验过程 练习题 报告书写 出勤和实验纪律 其他 批改日期: 教师签字:

9.2下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的

统计数据:(数据略)

(1)绘制散点图,计算相关系数,说明二者之间的关系。

(2)以人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性。(ɑ=0.05)

(5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。

人均GDP与人均消费水平的散点图14000人均消费水平(元)12000100008000600040002000001000020000人均GDP(元)3000040000

Model Summaryb Model 1 R .998a R Square .996 Adjusted R Square .996 Std. Error of the Estimate 247.303 a. Predictors: (Constant), 人均GDP(元) Model Summaryb Model 1 R .998a R Square .996 Adjusted R Square .996 Std. Error of the Estimate 247.303 a. Predictors: (Constant), 人均GDP(元) b. Dependent Variable: 人均消费水平(元) ANOVAb Model 1 Regression Residual Total Sum of Squares 8.144E7 305795.034 8.175E7 df 1 5 6 Mean Square 8.144E7 61159.007 F 1331.692 Sig. .000a a. Predictors: (Constant), 人均GDP(元) b. Dependent Variable: 人均消费水平(元) Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) 人均GDP(元) a. Dependent Variable: 人均消费水平(元) Residuals Statisticsa B 734.693 .309 Std. Error 139.540 .008 Coefficients Beta t 5.265 .998 36.492 Sig. .003 .000 Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum 1556.41 -.803 93.871 1539.17 -341.707 -1.382 -1.612 -4.815 -2.079 .007 .010 .001 Maximum 11398.76 1.868 210.510 11011.39 290.035 1.173 1.268 534.613 1.376 3.490 1.693 .582 Mean 4515.57 .000 127.368 4473.54 .000 .000 .053 42.035 .006 .857 .359 .143 Std. Deviation 3684.313 1.000 38.209 3583.076 225.756 .913 1.094 350.168 1.237 1.184 .608 .197 N 7 7 7 7 7 7 7 7 7 7 7 7 Model Summaryb Model 1 R .998a R Square .996 Adjusted R Square .996 Std. Error of the Estimate 247.303 a. Predictors: (Constant), 人均GDP(元) a. Dependent Variable: 人均消费水平(元) (1) 由excel的CORREL函数计算相关系数=0.998128,说明人均GDP和人均消费水平高度相关。 (2)ˆβ1=0.308683 ,ˆβ0=734.6928

y =734.6928+0.308683x

回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。 (3)判定系数R²=0.996,估计标准误差=247.303

意义:人均GDP对人均消费水平的影响达到99.6%。

(4)设H0:β1=0,人均消费水平与人均GDP之间的线性关系不显著。

F=1331.6921,Fɑ=6.61,F>Fɑ,拒绝原假设,即线性关系显著。 (5)y =734.6928+0.308683x=734.6928+0.308683×5000=2278.1078(元) (6)置信区间为(1990.74915,2565.46399)

9.3随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数金

子那个调查,所得数据如下:(数据略)

(1)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释其意义。

(2)检验回归系数的显著性。(ɑ=0.05)

(3)如果航班的正点率为80%,估计顾客的投诉次数。

Model Summaryb

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1 .869a .755 .724 18.887 a. Predictors: (Constant), 航班正点率(%) b. Dependent Variable: 投诉次数(次) ANOVAb Model 1 Regression Residual Total Sum of Squares 8772.584 2853.816 11626.400 df 1 8 9 Mean Square 8772.584 356.727 F 24.592 Sig. .001a a. Predictors: (Constant), 航班正点率(%) b. Dependent Variable: 投诉次数(次) Coefficientsa Standardized Unstandardized Coefficients Model 1 (Constant) 航班正点率(%) a. Dependent Variable: 投诉次数(次) Residuals Statisticsa B 430.1 -4.701 Std. Error 72.155 .948 Coefficients Beta t 5.962 -.869 -4.959 Sig. .000 .001 Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum .55 -2.340 5.975 -41.80 -24.678 -1.307 -1.451 -30.425 -1.581 .001 .001 .000 Maximum 108.20 1.108 15.5 102.99 24.615 1.303 1.710 59.804 2.009 5.474 3.551 .608 Mean 73.60 .000 7.957 69.49 .000 .000 .075 4.115 .100 .900 .441 .100 Std. Deviation 31.221 1.000 2.988 42.144 17.807 .943 1.127 28.047 1.220 1.657 1.096 .184 N 10 10 10 10 10 10 10 10 10 10 10 10 a. Dependent Variable: 投诉次数(次) (1) y=430.1-4.701x

回归系数的意义:回归系数-4.701表示航班正点率每增加1%,顾客投

诉次数平均下降4.7次。

(2)检验回归系数显著性:P=0.0011<0.05,表明回归系数显著,即航班正点率

对投诉次数有显著影响。

(3)航班正点率为80%时估计投诉次数为54.139;

航班正点率为80%时,平均投诉次数预测区间为(54.139±16.479); 航班正点率为80%时,某一特定航空公司投诉次数预测区间为(54.13±46.567);

11.1下表是1991-2008年我国小麦产量(单位:万吨)数据:(数据略)

(1)分别采用3期移动平均法和指数平滑法(ɑ=0.3)预测2009年的小麦产

量。将实际值和预测值绘图进行比较。 (2)分析预测误差,说明哪种方法预测更合适? 解:(1)

年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

小麦产量

移动平均法 指数平滑法

K=3 预测误差 ɑ=0.3 预测误差

9595.3 10158.7 9595.3 563.4 10639.0 10131.0 508.0 97.3 874.7 9929.7 10242.5 -312.8 10026.7 -97.0 10220.7 10263.1 -42.4 9997.6 223.1 11056.9 10402.4 654.5 100.5 992.4 12328.9 11202.2 1126.7 10362.2 1966.7 10972.6 11452.8 -480.2 10952.2 20.4 11388.0 11563.2 -175.2 10958.4 429.6 9963.6 10774.7 -811.1 11087.2 -1123.6 9387.3 10246.3 -859.0 10750.2 -1362.9 9029.0 9460.0 -431.0 10341.3 -1312.3 88.8 9021.7 -372.9 9947.6 -1298.8 9195.2 57.7 237.5 9558.0 -362.8 9744.5 9196.2 548.3 9449.1 295.4 10846.6 9928.8 917.8 9537.7 1308.9 10929.8 10507.0 422.8 9930.4 999.4 11246.4 11007.6 238.8 10230.2 1016.2

2009

预测误差和 11088.1 1170.0 10535.1

3132.6 (1)3期移动平均法预测值为11088.1万吨,指数平滑法预测值为10535.1万吨。

移动平均法实际值与估计值比较14000.012000.010000.08000.06000.04000.02000.00.0123456710111213141516171819年份

指数平滑法实际值与预测值比较14000.012000.010000.08000.06000.04000.02000.00.0123456710111213141516171819年份小麦产量系列1系列2小麦产量系列1系列2

(2)移动平均法的预测误差比指数平滑法的小,所以前者更合适。

11.3下表是某只股票连续35个交易日的收盘价格。分别拟合回归直线

ˆYt=b0+b1t、二阶曲线ˆYt=b0+b1t+b2t²和三阶曲线ˆYt=b0+b1t+b2t²+b3t³,并对结果进行比较。

直线 二阶曲线 三阶曲线 Intercept X Variable 1 374.1613 -0.6137 Intercept X Variable 1 X Variable 2 381.42 -1.8272 0.0337 Intercept X Variable 1 X Variable 2 X Variable 3 372.5617 1.0030 -0.1601 0.0036 各趋势方程为: 线性趋势:二阶曲线:三阶曲线:

根据趋势方程求得的预测值和预测误差如下表:

观测值Y 时间t 预测 372 370 374 375 377 377 374 372 373 372 369 367 373.5 372.9 372.3 371.7 371.1 370.5 369.9 369.3 368.6 368.0 367.4 366.8 误差平方 2.4 8.6 2.8 10.8 34.9 42.5 17.1 7.6 19.0 15.8 2.5 0.0 预测 379.9 378.1 376.5 374.9 373.4 371.9 370.5 369.2 367.9 366.7 365.6 3.6 误差平方 61.6 66.0 6.1 0.0 13.3 26.1 12.2 7.9 25.7 27.6 11.4 5.9 预测 373.4 374.0 374.2 374.2 374.0 373.6 373.0 372.2 371.2 370.2 369.0 367.7 误差平方 2.0 15.6 0.1 0.6 8.9 11.6 1.1 0.0 3.1 3.3 0.0 0.6 直线 二阶曲线 三阶曲线 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 367 365 363 359 358 359 360 357 356 352 348 353 356 356 356 359 360 357 357 355 356 363 365 366.2 365.6 365.0 3.3 363.7 363.1 362.5 361.9 361.3 360.7 360.0 359.4 358.8 358.2 357.6 357.0 356.4 355.7 355.1 354.5 353.9 353.3 352.7 0.7 0.3 3.8 28.5 32.8 16.9 6.3 23.9 27.8 75.0 145.1 41.4 7.9 4.9 2.5 4.1 13.2 1.6 3.5 0.2 4.4 94.2 151.8 363.6 362.7 361.8 361.0 360.3 359.7 359.1 358.6 358.1 357.8 357.5 357.2 357.0 356.9 356.9 356.9 357.0 357.2 357.4 357.7 358.1 358.5 359.0 11.6 5.4 1.4 4.2 5.4 0.5 0.8 2.5 4.6 33.2 .3 17.7 1.1 0.9 0.8 4.4 9.0 0.0 0.2 7.2 4.2 20.4 36.2 366.4 365.1 363.7 362.3 361.0 359.7 358.4 357.3 356.3 355.4 354.6 354.0 353.7 353.5 353.6 353.9 354.5 355.5 356.7 358.3 360.3 362.7 365.4 0.3 0.0 0.5 11.1 8.9 0.5 2.4 0.1 0.1 11.3 43.7 1.1 5.5 6.3 5.9 25.8 29.8 2.3 0.1 11.0 18.4 0.1 0.2 合计 — — 854.9 — 524.7 — 232.1 不同趋势线预测的标准误差如下:

直线:

二阶曲:

三阶曲线:

比较各预测误差可知,直线的误差最大,三阶曲线的误差最小。

从不同趋势方程的预测图也可以看出,三阶曲线与原序列的拟合

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务