实 验(实训)报 告
项 目 名 称 多元线性回归模型
所属课程名称 计量经济学
项 目 类 型 验证性实验
实验(实训)日期 15年4月 日
班 级
学 号 姓 名 指导教师
浙江财经学院教务处制
实验题目:研究货运总量y(万吨)与工业总产量x1 (亿元),农业总产值x2(亿元),居民非商品支出x3(亿元)的关系。数据如表:
1.计算y,x1,x2,x3的相关系数矩阵;
2.求y关于x1,x2,x3的三元线性回归方程;
3.对所求得的方程作拟合度检验
4.对每个回归系数作显著性检验;
5.对回归方程作显著性检验;
6.如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;
7.求出新回归方程的每一个回归系数的置信水平为95%的置信区间; 8.求新回归方程的标准化回归方程;
9.求当x175, x242时的y的预测值,给定99%的置信水平,计算其置信区间?
数据如下:
y x1 x2 x3
160
260
210
265
240
220
275
160
275
250
70 75 65 74 72 68 78 66 70 65 35 40 40 42 38 45 42 36 44 42 1.0 2.4 2.0 3.0 1.2 1.5 4.0 2.0 3.2 3.0
实验分析报告:
1.步骤:
首先安装软件包foreign,然后加载该软件包,读取SPSS数据。
library(
mydata=read.spss(
mydata
b=data.frame(mydata)
b
cor(b)
输出结果显示:
Y X1 X2 X3
Y 1.0000000 0.5556527 0.7306199 0.7235354
X1 0.5556527 1.0000000 0.1129513 0.3983870
X2 0.7306199 0.1129513 1.0000000 0.5474739
X3 0.7235354 0.3983870 0.5474739 1.0000000
2. 步骤:
c
c
输出结果显示:
Call:
lm(formula = Y ~ X1 + X2 + X3, data = mydata)
Coefficients:
(Intercept) X1 X2 X3
-348.280 3.754 7.101 12.447
分析:三元线性回归方程:Y=-348.280+3.754X1+ 7.101 X2+12.447 X3 (0.0959)(0.1002)(0.0488)(0.2835)
n=10 R^2=0.8055 调整R^2= 0.7083 估计的标准误=23.44
summary(c)
输出结果显示:
Call:
lm(formula = Y ~ X1 + X2 + X3, data = mydata)
Residuals:
Min 1Q Median 3Q Max
-25.198 -17.035 2.627 11.677 33.225
Coefficients:(回归系数)t value=3.754/1.933
Estimate Std. Error t value Pr(>|t|)
(Intercept) -348.280 176.459 -1.974 0.0959 .
X1 3.754 1.933 1.942 0.1002
X2 7.101 2.880 2.465 0.0488 *
X3 12.447 10.569 1.178 0.2835
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 23.44 on 6 degrees of freedom
Multiple R-squared: 0.8055, Adjusted R-squared: 0.7083
F-statistic: 8.283 on 3 and 6 DF, p-value: 0.01487
分析:由上述数据可知,调整后的决定系数为0.7083 ,说明回归方程对样本观测值的拟合程度较好。
4. 步骤:
summary(c)
输出结果显示:
Coefficients:(回归系数)t value=3.754/1.933
Estimate Std. Error t value Pr(>|t|)
(Intercept) -348.280 176.459 -1.974 0.0959 .
X1 3.754 1.933 1.942 0.1002
X2 7.101 2.880 2.465 0.0488 *
X3 12.447 10.569 1.178 0.2835
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
分析:由上述数据可知,
X1的t值=1.942,P值=0.0959>0.05, 接受原假设,
X2的t值=2.465 ,P值=0.0488
X3的t值=1.178,P值=0.2835>0.05, 拒绝原假设,
所以X2的回归系数是显著的,X1,X3的回归系数是不显著的。
summary(c)
输出结果显示:
Residual standard error: 23.44 on 6 degrees of freedom
Multiple R-squared: 0.8055, Adjusted R-squared: 0.7083
F-statistic: 8.283 on 3 and 6 DF, p-value: 0.01487
分析:由上述数据可知,F值=8.283,P值=0.01487
6. 步骤:
d
d
summary(d)
输出结果显示:
Call:
lm(formula = Y ~ X1 + X2, data = mydata)
Residuals:
Min 1Q Median 3Q Max
-42.012 -10.656 4.358 11.984 28.927
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -459.624 153.058 -3.003 0.01986 *
X1 4.676 1.816 2.575 0.03676 *
X2 8.971 2.468 3.634 0.00835 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 24.08 on 7 degrees of freedom
Multiple R-squared: 0.7605, Adjusted R-squared: 0.6921
F-statistic: 11.12 on 2 and 7 DF, p-value: 0.006718
分析:由于X1,X3的回归系数没有通过显著性检验,选择t值最小的将其剔除,那么先剔除X3,重新建立回归方程,并做回归方程的显著性检验和回归系数的显著性检验。
回归方程:Y=-459.624 +4.676 X1+ 8.971 X2
(0.01986)(0.03676)(0.00835)
n=10 R^2= 0.7605 调整R^2= 0.6921 估计的标准误=24.08
由上述数据可知,
X1的t值=2.575,P值=0.03676
X2的t值=3.634,P值=0.00835
所以X1,X2的回归系数是显著的。F值=11.12,P值=0.006718
7. 步骤:
confint(d,level=0.95)
输出结果显示:
2.5 % 97.5 %
(Intercept) -821.5473012 -97.700006
X1 0.3813047 8.969956
X2 3.1339785 14.807944
分析:由上述数据可知
β1的置信水平为95%的置信区间为[0.3813047, 8.969956],
β2的置信水平为95%的置信区间为[3.1339785 , 14.807944]。
8. 步骤:
ex=sd(mydata$Y)
ex1=sd(mydata$X1)
ex2=sd(mydata$X2)
t=mean(mydata$Y)
t1=mean(mydata$X1)
t2=mean(mydata$X2)
Y=(mydata$Y-t)/ex
X1=(mydata$X1-t1)/ex1
X2=(mydata$X2-t2)/ex2
e
summary(e)
输出结果显示:
Call:
lm(formula = Y ~ X1 + X2 - 1)
Residuals:
Min 1Q Median 3Q Max
-0.9680 -0.2455 0.1004 0.2761 0.6665
Coefficients:
Estimate Std. Error t value Pr(>|t|)
X1 0.4792 0.1741 2.752 0.02497 *
X2 0.6765 0.1741 3.885 0.00464 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.519 on 8 degrees of freedom
Multiple R-squared: 0.7605, Adjusted R-squared: 0.7007 F-statistic: 12.7 on 2 and 8 DF, p-value: 0.003288
分析:回归方程为:Y=0.4792 X1+0.6765 X2
(0.1741) (0.1741)
n=10 R^2= 0.7605 调整R^2=0.7007 估计的标准误=0.519
9. 步骤:
new=data.frame(X1=75,X2=42)
lm.pred=predict(e,new,interval=
输出结果显示:
fit lwr upr
1 267.829 174.0109 361.6471
分析:
Y的预测值= 267.829,
给定99%的置信水平,置信区间为[174.0109,361.6471]