一元线性回归案例分析 - 范文中心

一元线性回归案例分析

11/01

第二章 案例分析

一、研究的目的要求

居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。

二、模型设定

我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。

因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。

影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。

从2002年《中国统计年鉴》中得到表2.5的数据:

表2.5 2002年中国各地区城市居民人均年消费支出和可支配收入

如图2.12:

12000

图2.12

10000

Y

8000

6000

4000

4000

60008000

X

[**************]

从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立的计量经济模型为如下线性模型: Yi12Xiui 三、估计参数

假定所建模型及随机扰动项ui满足古典假定,可以用OLS法估计其参数。运用计算机软件EViews作计量经济分析十分方便。

利用EViews作简单线性回归分析的步骤如下: 1、建立工作文件

首先,双击EViews图标,进入EViews主页。在菜单一次点击File\New\Workfile,出现对话框“Workfile Range”。在“Workfile frequency”中选择数据频率:

Annual (年度) Weekly ( 周数据 )

Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 ) Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 ) Monthly (月度) Undated or irreqular (未注明日期或不规则的) 在本例中是截面数据,选择“Undated or irreqular”。并在“Start date”中输入开始时间或顺序号,如“1”在“end date”中输入最后时间或顺序号,如“31”点击“ok”出现“Workfile UNTITLED”工作框。其中已有变量:“c”—截距项 “resid”—剩余项。

在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。

若要将工作文件存盘,点击窗口上方“Save”,在“SaveAs”对话框中给定路径和文件名,再点击“ok”,文件即被保存。

2、输入数据

在数据编辑窗口中,首先按上行键“↑”,这时对应的“obs”字样的空格会自动上跳,在对应列的第二个“obs”有边框的空格键入变量名,如“Y”,再按下行键“↓”,对因变量名下的列出现“NA”字样,即可依顺序输入响应的数据。其他变量的数据也可用类似方法输入。

也可以在EViews命令框直接键入“data X Y ”(一元时) 或 “data Y X1 X2 „ ”(多元时),回车出现“Group”窗口数据编辑框,在对应的Y、X下输入数据。

若要对数据存盘,点击 “fire/Save As”,出现“Save As”对话框,在“Drives”点所要存的盘,在“Directories”点存入的路径(文件名),在“Fire Name”对所存文件命名,或点已存的文件名,再点“ok”。

若要读取已存盘数据,点击“fire/Open”,在对话框的“Drives”点所存的磁盘名,在“Directories”点文件路径,在“Fire Name”点文件名,点击“ok”即可。

3、估计参数

方法一:在EViews主页界面点击“Quick”菜单,点击“Estimate Equation”,出现“Equation specification”对话框,选OLS估计,即选击“Least Squares”,键入“Y C X”,点“ok”或按回车,即出现如表2.6那样的回归结果。

2.6

在本例中,参数估计的结果为:

Yi282.24340.758511Xi (287.2649) (0.036928) t=(0.982520) (20.54026)

2

r0.935685 F=421.9023 df=29

^

方法二:在EViews命令框中直接键入“LS Y C X”,按回车,即出现回归结果。 若要显示回归结果的图形,在“Equation”框中,点击“Resids”,即出现剩余项(Residual)、实际值(Actual)、拟合值(Fitted)的图形,如图2.13所示。

图2.13

四、模型检验

1、经济意义检验

所估计的参数20.758511,说明城市居民人均年可支配收入每相差1元,可导致居民消费支出相差0.758511元。这与经济学中边际消费倾向的意义相符。

2、拟合优度和统计检验

用EViews得出回归模型参数估计结果的同时,已经给出了用于模型检验的相关数据。 拟合优度的度量:由表2.6中可以看出,本例中可决系数为0.935685,说明所建模型整体上对样本数据拟合较好,即解释变量“城市居民人均年可支配收入”对被解释变量“城市居民人均年消费支出”的绝大部分差异作出了解释。

对回归系数的t检验:针对H0:10和H0:20,由表2.6中还可以看出,估计的回归系数1的标准误差和t值分别为:SE(1)287.2649,t(1)0.982520;2的标准误差和t值分别为:SE(2)0.036928,t(2)20.54026。取0.05,查t分布表得自由度为

^

^

^

^

^

^

^

n2312的临界值t0

.

(02295)

204。.因为5

t(1)

^

^

0.9t802.520250

(2)能20H405:10;因为,所以9不拒.绝

t(2)20.54026t0.025(29)2.045,所以应拒绝H0:20。这表明,城市人均年可支

配收入对人均年消费支出有显著影响。 五、回归预测

由表2.5中可看出,2002年中国西部地区城市居民人均年可支配收入除了西藏外均在8000以下,人均消费支出也都在7000元以下。在西部大开发的推动下,如果西部地区的城市居民人均年可支配收入第一步争取达到1000美元(按现有汇率即人民币8270元),第二步再争取达到1500美元(即人民币12405元),利用所估计的模型可预测这时城市居民可能达到的人均年消费支出水平。可以注意到,这里的预测是利用截面数据模型对被解释变量在不同空间状况的空间预测。

用EViews作回归预测,首先在“Workfile”窗口点击“Range”,出现“Change Workfile Range”窗口,将“End data”由“31”改为“33”,点“OK”,将“Workfile”中的“Range”扩展为1—33。在“Workfile”窗口点击“sampl”,将“sampl”窗口中的“1 31”改为“1 33”,点“OK”,将样本区也改为1—33。

为了输入Xf18270,Xf212405在EViews命令框键入data x /回车, 在X数据表中的“32”位置输入“8270”,在“33”的位置输入“12405”,将数据表最小化。

然后在“Equation”框中,点击“Forecast”,得对话框。在对话框中的“Forecast name”(预测值序列名)键入“

Yf

”, 回车即得到模型估计值及标准误差的图形。双击“Workfile”

窗口中出现的“Yf”,在“Yf”数据表中的“32”位置出现预测值Yf16555.132,在“33”位置出现Yf29691.577。这是当Xf18270和Xf212405时人均消费支出的点预测值。

为了作区间预测,在X和Y的数据表中,点击“View”选“Descriptive Stats\Cmmon Sample”,则得到X和Y的描述统计结果,见表2.7: 表2.7

根据表2.7的数据可计算:

x

2

i

2x(n1)2042.6822(311)125176492.59

22

(X)(82707515.026)

569985.74 f1

22

(X)(124057515.026)23911845.72 f2

取0.05,Yf平均值置信度95%的预测区间为:

Yft2

^^

Xf18270时

6555.132.045413.1593 6555.13162.10

Xf212405时

9691.582.045413.1593 9691.58499.25

即是说,当Xf18270元时,Yf1平均值置信度95%的预测区间为(6393.03,6717.23)元。当Xf212405元时,Yf2平均值置信度95%的预测区间为(9292.33,10090.83)元。

Yf个别值置信度95%的预测区间为:

Yft2^

^

Xf18270时

6555.132.045413.15936555.13860.32

Xf212405时

9691.582.045413.1593

9691.58934.49

即是说,当第一步Xf18270时,Yf1个别值置信度95%的预测区间为(5694.81,7415.45)元。当第二步Xf212405时,Yf2个别值置信度95%的预测区间为(8757.09,10626.07)元。

在“Equation”框中,点击“Forecast”可得预测值及标准误差的图形如图2.14:

图2.14


相关内容

  • 气体的流量与压力之间的回归分析
    摘要 数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系. 变量之间的确定性关系和相关关系在一定 ...
  • 北航数理统计回归分析大作业20**年
    应用数理统计 第一次大作业 学号: SY1007?? 姓名:班级: 2010年12月 国家财政收入的多元线性回归模型 摘 要 本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素, ...
  • 大学生网络购物情况及影响因素分析
    大学生网络购物情况及影响因素分析 一.研究问题 本文主要的研究问题是大学生网购状况及其部分影响因素.伴随电子商务的发展,消费者的消费方式发生了巨大变化,网络购物蓬勃发展.大学生网民占网民总体四成左右,使用网络购物人数占网络购物网民数的半数以 ...
  • 应用数学方法进行房地产市场调查与预测
    [摘要] 市场调查与预测是房地产企业为营销决策提供依据的重要手段,也是企业降低风险.提高竞争力的必要途径.在进行房地产市场调查与预测时,离不开数学方法:如应用数理统计方法对市场调查收集的数据进行处理;应用数学模型进行定量预测.将从这两个方面 ...
  • GDP与中国经济变化的关系
    12队 GDP与中国经济变化的关系 摘 要 本文从四个方面探讨了GDP与中国经济变化关系的问题. 针对问题一,选取居民消费水平作为主要指标来探讨中国GDP与经济变化的关系,利用搜集到的统计数据,使用MATLAB软件中统计回归工具建立一元线性 ...
  • 毕业论文文献综述基于SPSS的多元回归分析模型选取的应用 之文献综述
    基于SPSS 的多元回归分析模型选取的应用 文献综述 重庆工商大学 统计学 2010级 统计2班 殷婷 引 言 随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军 ...
  • 模型初步解释
    1. 回归分析模型:研究一个变量与另一个或者另外多个变量之间的相关关系. 一元线性回归,首先作出X ,Y 的散点图,来确认是否可以用直线拟合:其次,用最小二乘法估计出模型参数:最后通过模型可决系数,解释变量前系数的显著性来判断模型是否通过. ...
  • 数据之间的关系
    数据之间的关系:  1. SPSS(Statistics Package for Social Science)面向社会科学的统计包. (Statistical Product and Service Solution)统计产品和服务解决 ...
  • 统计分析软件主要复习内容
    统计分析软件课程主要复习内容 数据处理部分: 数据录入格式 变量数据类型的设置(字符型和数值型) 数据文件合并(横向和纵向) 部分样本的选择及其复原 变量计算(加减乘除) 变量取值的编码(相同变量和不同变量编码) 数据描述统计部分: 频率分 ...
  • 统计学基础
    统计学基础编辑 统计学是收集.分析.表述和解释数据的科学.作为数据分析的一种有效工具,统计方法已广泛应用于社会科学和自然科学的各个领域,是各学科领域研究者和实际工作者的必备知识. 书    名 统计学基础 作    者 贾俊平 ISBN [ ...