一、填空题
8.1.1 函数关系、相关关系 8.1.2 因变量、自变量 8.1.3 函数关系 8.1.4 相关关系 8.1.5 涉及变量 8.1.6 单相关 8.1.7 偏相关 8.1.8 密切程度 8.1.9 表现形态 8.1.10 相关的方向 8.1.11 相关的性质 8.1.12 正相关 8.1.13 负相关 8.1.14 虚假相关 8.1.15 相关分析 8.1.16 回归分析 8.1.17 相关系数 8.1.18 偏相关系数 8.1.19 复相关系数 8.1.20 最小二乘法 8.1.21 估计标准差
8.1.22 各回归系数、整个回归方程8.1.23 t检验、F检验。 8.1.24 线性相关 8.1.25 回归系数
1
二、单项选择题
题号 答案 题号 答案
8.2.1 A 8.2.9 B 8.2.2 B 8.2.10 A 8.2.3 B 8.2.11 B 8.2.4 C 8.2.12 C 8.2.5 B 8.2.13 A 8.2.6 B 8.2.14 B 8.2.7 C 8.2.15 A 8.2.8 A 8.2.16 C 三、多项选择题
题号 答案 题号 答案
8.3.1 AC 8.3.9 AC 8.3.2 ABC 8.3.10 ABCD 8.3.3 BCD 8.3.11 AB 8.3.4 AB 8.3.12 CD 8.3.5 CD 8.3.13 ABD 8.3.6 ABC 8.3.14 AC 8.3.7 BCD 8.3.15 ABCD 8.3.8 ACD —— —— 四、判断改错题
8.4.1 (√)
8.4.2 (×,函数关系) 8.4.3 (×,偏相关) 8.4.4 (×,密切程度) 8.4.5 (√)
8.4.6 (×,具有密切联系的统计方法) 8.4.7 (√) 8.4.8 (√)
8.4.9 (×,只能认为变量之间不存在线性相关关系) 8.4.10 (√) 8.4.11 (×,y8.4.12 (√)
8.4.13 (×,残差平方和达到最小) 8.4.14 (√)
ˆ)) 8.4.15 (×,方差为var(1Lxx201x)
8.4.16 (√)
2
8.4.17 (×,回归线的代表性) 8.4.18 (×,t检验) 8.4.19 (×,回归平方和) 8.4.20 (√) 8.4.21 (√)
8.4.22 (×,一个因变量) 8.4.23 (×,随机变量) 8.4.24 (√)
8.4.25 (×,y01x2x)
2五、简答题
8.5.1 答:
相关关系是指变量之间客观存在的非严格确定的依存关系;函数关系是指变量之间存在的严格确定的依存关系。
函数关系中当一个或几个相互联系的自变量取一定的值时,因变量必定有一个且只有一个确定的值与之对应,而相关关系中,当一个或几个相互联系的自变量取一定的数值时,与之对应的因变量往往会出现几个不同的值,但这些数值会按某种规律在一定范围内变化。
8.5.2 答:
单相关是指两个现象之间的相关,即一个变量对另一个变量的相关关系。如居民家庭可支配收入与消费支出之间的关系。
复相关是指一个变量与两个或两个以上其他变量之间的相关关系。例如,某种商品的销售量与其价格水平以及人们收入水平之间的相关关系便是一种复相关。
偏相关是指在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系。例如,在假定人们的收入水平不变的条件下,某种商品的销售量与其价格水平的关系就是一种偏相关。
8.5.3 答:
线性相关是指两种相关现象之间在直角坐标系中近似地表现为一条直线时的相关关系。例如人均消费水平与人均收入水平通常呈线性关系。
非线性相关是指两种相关现象之间在图上并不表现为直线形式而是表现为某种曲线形式时的相关关系。例如产品的平均成本与产品总产量之间的相关关系就是一种非线性相关。
8.5.4 答:
相关分析是指研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法。
3
回归分析是指根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法。
两者之间的联系:相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
两者之间的区别:(1)相关分析中,变量x与变量y处于平等地位,不需要区分自变量和因变量;回归分析中必须区分自变量和因变量;(2)相关分析中所涉及的变量y与x全是随机变量,而回归分析中,因变量y是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量; (3)相关分析的研究主要是刻画两类变量间线性相关的密切程度,而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
8.5.5 答:
有关误差项的基本假设有:(1)误差项的期望值为0,即对所有的i有:E(i)0;(2)误差项的方差为常数,即对所有的i有var(i)E(i2)2;(3)误差项之间不存在自相关关系,其协方差为0,即当ij时,有cov(i,j)0;(4)自变量是给定的变量,与随机误差项线性无关;(5)随机误差项服从正态分布。
8.5.6 答:
所谓的P值是一个条件概率值,是在原假设H0为真的假设下,由样本观察值计算得到的对原假设H0可信程度的一个度量。
对于给定的值,当P值<时,拒绝原假设H0;当P值≥时,接受原假设H0。 8.5.7 答:
样本决定系数r2是指总离差平方和中回归平方和所占的比重,用以反映回归直线与样本观测值拟合优度的统计分析指标。r2反映了因变量的变化中能用自变量解释的比例。r2的值总是在0和1之间,也可以用百分数表示。
样本决定系数r2的取值在[0,1]区间内,r2越接近1,表明回归拟合的效果越好;r2越接近0,表明回归拟合的效果越差。与F检验相比,r2可以更清楚直观地反映回归拟合的效果,但是并不能作为严格的显著性检验。
8.5.8 答:
非线性回归分析必须解决两个主要问题:一是如何确定非线性回归函数的具体形式;二是如何估计函数中的参数。对于前一个问题,要注意非线性回归函数不同于线性回归函数,它有不同的表现形式,需要根据所要研究的问题的性质并结合实际样本观测值做出恰当的选择。对于后一个问题,要注意虽然非线性回归分析中最常用的参数估计方法仍然是最小二乘估计法,但需要根据函数的不同类型进行适当变换,先将非线性函数转换为线性函数,再利用最小二乘法估计参数。
4
六、计算题
8.6.1 解:
(1)根据需要,计算有关数据如下:
相关系数计算表
序号 1 2 3 4 5 6 7 8 9 10 合 计 高等数学成绩(分)x 54 66 68 76 78 82 85 87 90 94 780 统计学成 绩(分)y 61 80 62 86 84 76 85 82 88 96 800 x2 2916 4356 4624 5776 6084 6724 7225 7569 8100 8836 62210 y2 3721 00 3844 7396 7056 5776 7225 6724 7744 9216 65102 xy 3294 5280 4216 6536 6552 6232 7225 7134 7920 9024 63413 相关系数为: rnxiyixiyii1i1i1nnnnxi2(xi)2i1i1nnnyi2(yi)2i1i1nn
10634137808001062210780210651028002 101300.8244
117.05104.98相关系数为0.8244,说明高等数学成绩和统计学成绩之间存在较强的正相关关系。 (2)相关图如下:
统计学成绩(分)100908070605060708090100数学成绩(分) 高等数学成绩和统计学成绩相关关系示意图
5
8.6.2 解:
(1)绘出生产性固定资产与利润总额的散点图如下:
利润总额(万元)1801601401201008060400200400600800100012001400生产性固定资产(万元) 生产性固定资产与利润总额相关关系示意图
由图可以看出,随着生产性固定资产投入的增加,利润总额基本上也呈增加趋势,即生产性固定资产与利润总额之间存在正的相关关系。
(2)计算相关系数
根据需要,计算有关数据如下:
相关系数计算表
序号 1 2 3 4 5 6 7 8 9 10 合 计 生产性固定资产(万元)x 318 910 200 409 415 502 314 1210 1022 1225 6525 利润总额(万元)y 52 101 82 92 93 160 151 122 162 1079 x2 101124 828100 40000 167281 172225 252004 98596 14100 1044484 1500625 5668539 y2 2704 10201 4096 6724 84 25600 22801 14884 26244 130367 xy 16536 91910 12800 33538 38180 46686 50240 182710 124684 198450 795734
相关系数为:
6
rnxiyixiyii1i1i1nnnnxi2(xi)2nyi2(yi)2i1i1i1i1nnnn
10795734652501079105668539652521013036710792 9168650.65373756.3373.4相关系数并不是特别大,可视为中度相关。
8.6.3 解:
(1)绘出人均可支配收入与人均食品支出散点图如下:
人均食品支出(元)600500400300200400600800100012001400160018002000人均可支配收入(元) 人均可支配收入与人均食品支出散点图
由图可以看出,人均可支配收入与人均食品支出之间存在明显的正相关关系,随着人均可支配收入的增多,人均食品支出也持续增加。为了更好的描述其相关程度,计算相关系数r如下:
相关系数计算表
序号 1 2 3 4 5 6 7 8 人均可支配收入(元)x 450 520 675 735 786 880 1124 1250 人均食品支出(元)y 270 286 350 365 378 396 480 500 x2 202500 270400 455625 540225 617796 774400 1263376 1562500 y2 72900 81796 122500 133225 142884 156816 230400 250000 xy 121500 148720 236250 268275 297108 348480 539520 625000 7
9 10 11 12 合 计 1468 1765 1850 1880 13383 nni=1n520 540 580 585 5250 n2155024 3115225 3422500 3534400 17913971 270400 291600 3300 342225 2431146 763360 953100 1073000 1099800 74113 n邋xiyi-r=i=1xi yii=1n2ini=1n邋x-(2ii=1nxi)i=12n邋y-(i=1yi)2
==12?74113213383 5250212?1791397113383创122431146-52507428606=0.977235862963´1611252可见,二者的相关程度非常强。
ˆˆx ˆ(2)同样假设人均可支配收入为x,人均食品支出为y,所求的回归方程为y01根据最小二乘原理,解得回归系数如下: ˆ=b1n邋xiyi-i=1nnni=1ni=1xi yii=1nn邋xi2-(i=1xi)212?7411313383 5250
12?179139711338327428606==0.207135862963=ˆ=y-bˆxb01=437.5-0.2071?1115.25206.5317
ˆ206.53170.2071x 所求的回归方程为:y2判决系数R=0.955,调整后的Ra=0.951。在总的离差平方和中回归平方和所占的比
2重越大,则线性回归效果就越好。判决系数如此接近1,这说明回归直线与样本观测值拟合得很好。
8.6.4 解:以SPSS软件为例
(1)进入SPSS软件, 建立数据文件。依次选择Analyze → Correlate → Bivariate → OK 得到y、x1、x2的相关系数矩阵如下:
Correlations 货运总量1 0.556 0.731 y 工业总产值x1 0.556 1 0.155 农业总产值x2 0.731 0.155 1 y) 工业总产值(x1) 货运总量(农业总产值(x2) 8
由输出结果可以看出,货运总量与工业总产值、农业总产值存在正相关关系。
(2)依次选择Analyze → Regression → Linear → OK ,在菜单中将货运总量选为因变量,将工业总产值、农业总产值选为自变量;再点击Statistics,选择Confidence intervals得到如下输出结果:
Model Summary Model 1 R .872(a) R Square .761 Adjusted R Std. Error of Square .692 the Estimate 24.081
ANOVA Model 1 Regression Residual Total Sum of Squares 123.199 4059.301 16952.500 2 7 9 df Mean Square 46.600 579.900 F 11.117 Sig. .007(a)
Coefficients Model 1 Unstandardized Coefficients B -459.624 4.676 8.971 Std. Error 153.058 1.816 2.468 .479 .676 Standardized Coefficients Beta t -3.003 2.575 3.634 .020 .037 .008 Sig. 95% Confidence Interval for B Lower Bound -821.547 .381 3.134 Upper Bound -97.700 8.970 14.808 从Coefficients表中,得到y关于x1和x2的二元线性回归模型为:
ˆ-459.6244.676x18.971x2y
22(3)从Model Summary表中得到R=0.761,调整后的Ra=0.692,初步表明回归模
型拟合程度较好。
(4)从ANOVA表中,得到: SSR=123.199,SSE=4059.301
FSSRp123.199/211.117SSE(np1)4059.301/7
p=0.007
由F检验值和P值可知方程通过显著性检验,整个回归方程有效,即工业总产值、农业总产值两个自变量对货运总量这个因变量的线性关系非常显著。
(5)由Coefficients表可知,工业总产值的t检验值2.575,P值为0.037;农业总产值的t检验值3.634,P值为0.008。在5%的显着性水平下,工业总产值的回归系数和农业总产值的
9
回归系数都通过了显着性检验,即工业总产值与农业总产值两个自变量对因变量的影响在统计上都是显著的。
(6)由Coefficients表可知,工业总产值回归系数的置信区间为(0.381 8.970); 农业总产值回归系数的置信区间为(3.134 14.808)。
(7)当x1=75亿元,x2=42亿元,置信度95%时,利用SPSS软件计算得:
y的点估计值为:267.829万吨;
(204.436亿元,331.222亿元)。 y的95%的置信区间为:
8.6.5 解:
(1)绘出流通费用率与商品销售额散点图如下:
流通费用率(141210由图可以看出,流通费用率随着商品销售额的提高而逐渐下降,随后趋于稳定。 (2)设流通费用率为y,,商品销售额为x,选用双曲线函数 ˆˆ yˆx令x'1ˆˆx'。 ˆ,则有yx流通费用率对商品销售额的回归计算表
相关计算过程如下:
%)820246810121416商品销售额(百万元) 流通费用率与商品销售额散点图
超市 编号 1 2 3 4
商品销售额(百万元)x 1.4 3.0 4.1 5.8 流通费用率(%)y 12.8 9.0 5.4 4.2 x'1x x'2 0.510204082 0.111111111 0.05948840 0.029726516 x'y 9.142857143 3.000000000 1.317073171 0.724137931 0.714285714 0.333333333 0.243902439 0.172413793 10
5 6 7 8 9 10 合 计 6.8 8.6 11.0 12.8 13.8 15.6 82.9 3.6 3.0 2.8 2.6 2.6 2.4 48.4 0.147058824 0.116279070 0.090909091 0.078125000 0.072463768 0.01025 2.032873596 0.021626298 0.013520822 0.0082463 0.006103516 0.005250998 0.004109139 0.769405345 0.529411765 0.348837209 0.254545455 0.203125000 0.188405797 0.153846154 15.86223963 回归系数为:
ˆ1nx'iyix'iyinx'i2(x'i)2
1015.862239632.03287359648.460.2313142516.9119100.7694053452.03287359623.561478393ˆyˆx'4.8416.91190.20328735961.4020 1ˆ1.402016.9119所求的回归方程为:y221 x(3)R0.978,Ra0.957,p0.000,该模型很好的通过了显著性检验。
ˆ1.402016.9119当x=18时,y
8.6.6 解:
(1)散点图如下:
恩格尔系数(6012.3416 1850城镇居民家庭人均可支配收入与恩格尔系数之间的相关关系示意图
由图可以看出,随着城镇居民家庭人均可支配收入的增加,恩格尔系数基本上呈现下降趋势,也即两者间存在负的相关关系。
%)4030020004000600080001000012000人均可支配收入(元) 11
(2)根据经济理论,随着居民家庭人均可支配收入的增加,家庭收入中(或总支出中)用来购买食物的支出比例会下降,即恩格尔系数下降,两者之间是单向因果关系,因此,我们将城镇居民家庭人均可支配收入定为自变量,恩格尔系数确定为因变量。
由散点图可以看出,城镇居民家庭人均可支配收入与恩格尔系数基本上呈现出线性关系;使用SPSS的回归模块功能对曲线进行拟合,结合系数的经济意义、判决系数等进行比较,我们选定线性回归模型:
y01x
利用SPSS的回归模块的功能得到输出结果:
Model Summary R .950 R Square .902 Adjusted R Square .5 Std. Error of the Estimate 2.134
Coefficients Unstandardized Model Coefficients B 1 (Constant) 可支配收入 57.242 -.002 Std. Error 1.203 .000 Standardized Coefficients Beta -.950 47.575 -11.326 .000 .000 t Sig. 由上表中得出回归模型为:
ˆ=57.242-0.002x y
(3)由Coefficients表中我们可以看出回归系数的t值为-11.326,p值为0,通过显著性检验,即自变量可支配收入对恩格尔系数的影响是显著的;由一元回归模型的t检验和f检验的等价性,可以判定整个回归模型也是显著的。
当2008年城镇居民家庭人均可支配收入为13000元时,恩格尔系数(%)的估计值为:
ˆ=57.242-0.002?13000y
31.24%。
12
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务