一元线性回归案例分析

第二章案例分析

一、研究的目的要求

居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长，而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展，人民生活水平不断提高，居民的消费水平也不断增长。但是在看到这个整体趋势的同时，还应看到全国各地区经济发展速度不同，居民消费水平也有明显差异。例如，2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元，最高的上海市达人均10464元，上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因，需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多，例如，居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素，并分析影响因素与消费水平的数量关系，可以建立相应的计量经济模型去研究。

二、模型设定

我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费，由于各地区的城市与农村人口比例及经济结构有较大差异，最具有直接对比可比性的是城市居民消费。而且，由于各地区人口和经济总量不同，只能用“城市居民每人每年的平均消费支出”来比较，而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。

因为研究的目的是各地区城市居民消费的差异，并不是城市居民消费在不同时间的变动，所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。

影响各地区城市居民人均消费支出有明显差异的因素有多种，但从理论和经验分析，最主要的影响因素应是居民收入，其他因素虽然对居民消费也有影响，但有的不易取得数据，如“居民财产”和“购物环境”；有的与居民收入可能高度相关，如“就业状况”、“居民财产”；还有的因素在运用截面数据时在地区间的差异并不大，如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型，即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应，选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。

从2002年《中国统计年鉴》中得到表2.5的数据:

表2.5 2002年中国各地区城市居民人均年消费支出和可支配收入

如图2.12：

12000

图2.12

10000

8000

6000

4000

60008000

[**************]

从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系，所以建立的计量经济模型为如下线性模型： Yi12Xiui 三、估计参数

假定所建模型及随机扰动项ui满足古典假定，可以用OLS法估计其参数。运用计算机软件EViews作计量经济分析十分方便。

利用EViews作简单线性回归分析的步骤如下： 1、建立工作文件

首先，双击EViews图标，进入EViews主页。在菜单一次点击File\New\Workfile，出现对话框“Workfile Range”。在“Workfile frequency”中选择数据频率：

Annual (年度) Weekly ( 周数据 )

Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 ) Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 ) Monthly (月度) Undated or irreqular (未注明日期或不规则的) 在本例中是截面数据，选择“Undated or irreqular”。并在“Start date”中输入开始时间或顺序号，如“1”在“end date”中输入最后时间或顺序号，如“31”点击“ok”出现“Workfile UNTITLED”工作框。其中已有变量：“c”—截距项 “resid”—剩余项。

在“Objects”菜单中点击“New Objects”，在“New Objects”对话框中选“Group”，并在“Name for Objects”上定义文件名，点击“OK”出现数据编辑窗口。

若要将工作文件存盘，点击窗口上方“Save”，在“SaveAs”对话框中给定路径和文件名，再点击“ok”，文件即被保存。

2、输入数据

在数据编辑窗口中，首先按上行键“↑”，这时对应的“obs”字样的空格会自动上跳，在对应列的第二个“obs”有边框的空格键入变量名，如“Y”，再按下行键“↓”，对因变量名下的列出现“NA”字样，即可依顺序输入响应的数据。其他变量的数据也可用类似方法输入。

也可以在EViews命令框直接键入“data X Y ”(一元时) 或 “data Y X1 X2 „ ”(多元时)，回车出现“Group”窗口数据编辑框，在对应的Y、X下输入数据。

若要对数据存盘，点击 “fire/Save As”，出现“Save As”对话框，在“Drives”点所要存的盘，在“Directories”点存入的路径（文件名），在“Fire Name”对所存文件命名，或点已存的文件名，再点“ok”。

若要读取已存盘数据，点击“fire/Open”，在对话框的“Drives”点所存的磁盘名，在“Directories”点文件路径，在“Fire Name”点文件名，点击“ok”即可。

3、估计参数

方法一：在EViews主页界面点击“Quick”菜单，点击“Estimate Equation”，出现“Equation specification”对话框，选OLS估计，即选击“Least Squares”，键入“Y C X”，点“ok”或按回车，即出现如表2.6那样的回归结果。

表

2.6

在本例中，参数估计的结果为：

Yi282.24340.758511Xi （287.2649） (0.036928) t=(0.982520) (20.54026)

r0.935685 F=421.9023 df=29

方法二：在EViews命令框中直接键入“LS Y C X”，按回车，即出现回归结果。若要显示回归结果的图形，在“Equation”框中，点击“Resids”，即出现剩余项（Residual）、实际值（Actual）、拟合值（Fitted）的图形，如图2.13所示。

图2.13

四、模型检验

1、经济意义检验

所估计的参数20.758511，说明城市居民人均年可支配收入每相差1元，可导致居民消费支出相差0.758511元。这与经济学中边际消费倾向的意义相符。

2、拟合优度和统计检验

用EViews得出回归模型参数估计结果的同时，已经给出了用于模型检验的相关数据。拟合优度的度量：由表2.6中可以看出，本例中可决系数为0.935685，说明所建模型整体上对样本数据拟合较好，即解释变量“城市居民人均年可支配收入”对被解释变量“城市居民人均年消费支出”的绝大部分差异作出了解释。

对回归系数的t检验：针对H0:10和H0:20，由表2.6中还可以看出，估计的回归系数1的标准误差和t值分别为：SE(1)287.2649，t(1)0.982520；2的标准误差和t值分别为：SE(2)0.036928，t(2)20.54026。取0.05，查t分布表得自由度为

n2312的临界值t0

(02295)

204。.因为5

t(1)

0.9t802.520250

(2)能20H405:10；因为，所以9不拒.绝

t(2)20.54026t0.025(29)2.045，所以应拒绝H0:20。这表明，城市人均年可支

配收入对人均年消费支出有显著影响。五、回归预测

由表2.5中可看出，2002年中国西部地区城市居民人均年可支配收入除了西藏外均在8000以下，人均消费支出也都在7000元以下。在西部大开发的推动下，如果西部地区的城市居民人均年可支配收入第一步争取达到1000美元(按现有汇率即人民币8270元)，第二步再争取达到1500美元(即人民币12405元)，利用所估计的模型可预测这时城市居民可能达到的人均年消费支出水平。可以注意到，这里的预测是利用截面数据模型对被解释变量在不同空间状况的空间预测。

用EViews作回归预测，首先在“Workfile”窗口点击“Range”，出现“Change Workfile Range”窗口，将“End data”由“31”改为“33”，点“OK”，将“Workfile”中的“Range”扩展为1—33。在“Workfile”窗口点击“sampl”，将“sampl”窗口中的“1 31”改为“1 33”，点“OK”，将样本区也改为1—33。

为了输入Xf18270，Xf212405在EViews命令框键入data x /回车, 在X数据表中的“32”位置输入“8270”，在“33”的位置输入“12405”，将数据表最小化。

然后在“Equation”框中，点击“Forecast”，得对话框。在对话框中的“Forecast name”(预测值序列名)键入“

”，回车即得到模型估计值及标准误差的图形。双击“Workfile”

窗口中出现的“Yf”，在“Yf”数据表中的“32”位置出现预测值Yf16555.132，在“33”位置出现Yf29691.577。这是当Xf18270和Xf212405时人均消费支出的点预测值。

为了作区间预测，在X和Y的数据表中，点击“View”选“Descriptive Stats\Cmmon Sample”，则得到X和Y的描述统计结果，见表2.7: 表2.7

根据表2.7的数据可计算:

x

2x(n1)2042.6822(311)125176492.59

(X)(82707515.026)

569985.74 f1

(X)(124057515.026)23911845.72 f2

取0.05,Yf平均值置信度95%的预测区间为：

Yft2

Xf18270时

6555.132.045413.1593 6555.13162.10

Xf212405时

9691.582.045413.1593 9691.58499.25

即是说，当Xf18270元时，Yf1平均值置信度95%的预测区间为（6393.03，6717.23）元。当Xf212405元时，Yf2平均值置信度95%的预测区间为（9292.33，10090.83）元。

Yf个别值置信度95%的预测区间为：

Yft2^

Xf18270时

6555.132.045413.15936555.13860.32

Xf212405时

9691.582.045413.1593

9691.58934.49

即是说，当第一步Xf18270时，Yf1个别值置信度95%的预测区间为（5694.81，7415.45）元。当第二步Xf212405时，Yf2个别值置信度95%的预测区间为（8757.09，10626.07）元。

在“Equation”框中，点击“Forecast”可得预测值及标准误差的图形如图2.14：

图2.14

一元线性回归案例分析

相关内容

热门内容