回归分析举例习题作业
本次作业采用的是回归分析中的stepwise的用法。 举例如下:
水泥凝固时放出的热量y与水泥中4种化学成分x1,x2,x3,x4有关,今测得一组数据如表1,试用逐步回归来确定一个线性模型。
表1 序号 1 2 3 4 5 6 7 8 9 10 11 12 13
x1 x2 x3 x4 y 7 1 11 11 7 11 3 1 2 21 1 11 10 26 29 56 31 52 55 71 31 54 47 40 66 68 6 15 8 8 6 9 17 22 18 4 23 9 8 60 52 20 47 33 22 6 44 22 26 34 12 12 78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 93.8 113.3 109.4 编写程序如下: clc,clear
x0=[1 7 26 6 60 78.5 2 1 29 15 52 74.3 3 11 56 8 20 104.3 4 11 31 8 47 87.6 5 7 52 6 33 95.9 6 11 55 9 22 109.2 7 3 71 17 6 102.7 8 1 31 22 44 72.5 9 2 54 18 22 93.1 10 21 47 4 26 115.9 11 1 40 23 34 83.8 12 11 66 9 12 113.3 13 10 68 8 12 109.4]; x=x0(:,2:5); y=x0(:,6);
stepwise(x,y,[1:4])
在MATLAB中运行上述程序得到图一所示图形界面:
Coefficients with Error BarsX1X2X3X4-2-10123 Coeff. t-stat p-val 1.5511 2.0827 0.0708 0.510168 0.7049 0.5009 0.101909 0.1350 0.59 -0.144061 -0.2032 0.8441Model History4RMSE3211图一 逐步式回归交互画面
由上图可以看出x3,x4不显著,移去这两个变量后的统计结果如图2。
Coefficients with Error BarsX1X2X3X4-0.500.511.5 Coeff. t-stat p-val 1.46831 12.1047 0.0000 0.66225 14.4424 0.0000 0.250018 1.3536 0.20 -0.23654 -1.3650 0.2054Model History2.45RMSE2.42.352.3123
图二 逐步式回归交互画面
图4中的x3,x4两行用红色显示,表明它们已移去。从新的统计结果可以看出,虽然剩余标准差s(RMSE)没有太大的变化,但是统计量F的值明显增大,因此
新的回归模型更好一些。可以求出最终的模型为
y52.57731.4683x10.6623x2