第2章 数据分析(梅长林)习题题答案 - 范文中心

第2章 数据分析(梅长林)习题题答案

11/05

第2章 习 题

一、习题2.4 (1)回归模型

y i =β0+β1x i 1+β2x i 2+εi , i =1, 2, 15

调用

由此输出得到的回归方程为:

y =3. 45261+0. 49600X 1+0. 00920X 2

由最后一列可以看出,使用化妆品的人数X1和月收入X2对化妆品的销售数量有着显著影响。β0=3. 46521可以理解为该化妆品作为一种必需品每个月的销售量。当购买该化妆品的人数固定时,月收入没增加一个一个单位,改化妆品的销售数量将增加0.0092个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加0.49600个单位。

σ=

∧2

SSE

是σ2的无偏估计,所以σ2

的估计值是4.7403. n -p

(2)调用

由此可到线性回归关系显著性检验:

H 0:β1=β2=0H 1:β1, β2至少有一个为0

的统计量F =

SSR /(p -1) MSR

=的观测值F 0=5679. 47, 检验的p 值

SSE /(n -p ) MSE

p 0=p H 0(F >=F 0)

SSR 53845

==0. 9989,R 2描述了由自由变量的线性关系函另外R 2=

SST 53902

数值所能反映的Y 的总变化量的比例。表明线性关系越明显。R 2越大,这些结果均表明Y 与X1,X2之间的回归关系高度显著。

(3)若置信水平α=0. 05,由t 0. 975(12) =2. 17881,利用参数估计值得

到β0, β1, β2的置信区间分别为:

8. 7458) )对β0, 3. 45216±2. 1781⨯2. 43065=3. 4516±5. 2942,即(-1. 8426,

对β1:0. 49600±2. 1781⨯0. 00605=0. 49600±0. 01318,即(0. 48, 0. 2580) 2198

0. 00920±2. 1781⨯0. 0009681=0. 00920±0. 0021:,即β2

(-0. 0071, 0. 00113)

(4)首先检验X1对Y 是否有显著性影:

2, 15 假设其约简模型为:y i =β0+β2x i 2+εi , i =1,

由观测数据并利用proc reg过程拟合此模型求得:

SSE (R ) =484. 88137 f R =15-2=13 SSE (F ) =56. 88357 f R =15-3=12

由F =

F 0=

[SSE (R ) -SSE (F )]f R -f F )

求得检验统计量的值为:

SSE (F ) /f F

由此拒绝原假设,所以x2对Y 有显著影响。 同理检验X2对Y 是否有显著性影:

2, 15 假设其约简模型为:y i =β0+β1x i 1+εi , i =1,

由观测数据并利用proc reg过程拟合此模型求得: SSE (R ) =31872 f R =15-2=13

484. 88137-56. 88357

=90. 3

56. 88357/12

p 0=p H 0(F >=F 0) =P (F (1, 13) >=F 0)

SSE (F ) =56. 88357 f R =15-3=12

由F =

F 0=

[SSE (R ) -SSE (F )]f R -f F )

求得检验统计量的值为:

SSE (F ) /f F

由此拒绝原假设,所以x2对Y 有显著影响。 检验X1、x2交叉项对Y 是否有显著性影:

2, 15 假设其全模型为:y i =β0+β1x i 1+β2x i 2+β3x i 1x i 2+εi , i =1,

检验X1、X2的交互作用是否显著即检验假设H 0:β3=0是否能被拒

31872-56. 88357

56. 88357/12 p 0=p H 0(F >=F 0) =P (F (1, 13) >=F 0)

绝。

由观测数据并利用proc reg过程拟合此模型求得:

SSE (F ) =56. 72 f F =15-4=11 SSE (R ) =56. 88357 f R =15-3=12

由F =

F 0=

[SSE (R ) -SSE (F )]f R -f F )

求得检验统计量的值为:

SSE (F ) /f F

由此接受原假设,也即X1*X2对Y 无显著影响,即模型中没有必要引进交叉项。

(5)关于Y 的预测:

对于给定的X1,X2的值(220,2500),由回归方程可以得到y 0的预测值:

y 0=3. 45261+0. 49600⨯220+0. 00920⨯2500=135. 573

T -1(X X ) y

0为了得到

T

,MSE =4.74030,求得y 的置信度为95%的置信区x =(1,220,2500) 0由

56. 88357-56. 72

=0. 0317

56. 72/11

p 0=p H 0(F >=F 0) =P (F (1, 11) >=0. 0317) =0. 138>0. 05

间为:

y ±t 0.975(12)=135.5726±2.1788⨯2.2818=135.5726±4.9716即(130.6010,140.5442)

(6)利用proc reg过程可根据要求输出学生化残差:

利用学生化残差,检验模型误差项的正态性假定的合理性: 1频率检验法: ○

学生化残差中有10/15=0.6667(约0.68)落在(-1,1)内;有13/15=0.8667(约0.87)落在(-1.5,1.5)内;有15/15=1(约0.95)落在(-2,2)内。由此可见,学生化残差在上述各区间内的频率与N (0,1)分布的相应概率相差均不大,因此模型误差项的正态性假定是合理的。 ②正态QQ 图

利用

通过sas 计算得到(r i , q i )

再利用proc corr 得到学生化残差与相应标准正态分布的分位数的pearson 相关系数矩阵。可以看出学生化残差与相应标准正态分布的分位数的相关系数为0.97710

为了进一步验证模型假设的合理性,利用proc gplot的做出的几个残差图:

们认为相应的线性回归模型以及误差的独立正态分布的假设是合理的。

二、习题2.6 回归模型

y i =β0+β1x i 1+β2x i 2+εi , i =1, 2, 15

调用proc reg过程, 得到参数估计的相关结果:

调用

根据上述回归模型,画出学生化残差正态QQ 图以及Y 的拟合值的残

残差与相应标准正态分布的分位数的相关系数为0.94091

相差较大。另外拟合值的图像也表明Y 与X1和X2不能满足线性关系。 (2)对因变量Y 做Box-Cox 变换,对不同的λ值,利用sas 系统中的

λλ

SSE (λ, Z ) λSSE (λ, Z )

由图可知SSE (λ, Z ) 在λ=0. 31时取得最小值,因此Box-Cox 变换中λ取0.31 ,记变换后的因变量为YY, 对拟合后的变量重新做线性回归,得到以下结果:

从图中可以看出,无论是学生化残差的正态QQ 图还是变换后因变量YY 的拟合值都有明显的改观。而且求得学生化残差与相应标准正态分布的分位数的相关系数达到了0.96990,并且检验p 值小于0.0001差分析,认为YY 与XX1、XX2之间的线性关系较为合理。

拟合YY 与X1、X2的线性回归模型,其方差分析以及参数估计如下所示。


相关内容

  • 华生董事长林国雄荣获"中国优秀创新企业家"称号
    2010-10-27 17:17   来源:中国经济网 新民认证 t.xinmin.cn/false 新民网记者团记者 新民认证 t.xinmin.cn/false 新民网记者团记者 关闭 近日,由中国民营企业家协会.中国国际经济合作学会和 ...
  • [金融风险管理]课后习题答案
    <金融风险管理>课后习题答案 第一章课后习题答案 一.重要名词 答案略 二.单项选择 1-5 C B D A A 6-10 C A C C C 11-15 D A B D A 16-20 B C D D D 21-25 B B ...
  • 大学课后题答案
    不用买参考书了!大学课本答案大全!--爱死你了!( 为什么大四才发现啊) 2008-12-18 16:50 | (分类:) 注册可用 公共课程 http://www.10xiao.com/forum-6-1.html 新视野大学英语读写教程 ...
  • 苏教版四年级下册语文补充习题答案
    苏教版四年级下语文补充习题 1,走,我们去植树 补充习题答案 一,读一读,再抄写. 二,读一读,根据提示写句子. 1,小鸟是人类的朋友. 2,风儿快活地唱着歌,唤醒了沉睡中的大地. 三,根据课文内容填空. 1,沟渠,山坡,欢声笑语,一棵棵青 ...
  • 第二章财务分析信息基础习题答案
    第二章财务分析信息基础作业答案 单选题 1. 在各项财务分析标准中,可比性较高的是( ) A .经验标准 B .历史标准 C .行业标准 D .预算标准 [答案]B 2. 为了评价判断企业所处的地位与水平,在分析时通常采用的标准是( ) A ...
  • 统计学习题 第四章_数据分布特征的描述习题答案
    第四章 数据分布特征的描述习题 一.填空题 1.数据分布集中趋势的测度值(指标)主要有 众数 . 中位数 和 均值 .其中 众数 和 中位数 用于测度品质数据集中趋势的分布特征, 均值 用于测度数值型数据集中趋势的分布特征. 2.标准差是反 ...
  • [结构力学]习题+答案
    <结构力学>习题 第一套 一.判断题 1.多余联系只存在于几何不变体系中,瞬边体系和几何可变体系中不存在多余联系. ( ) 2.在地基差的时候,采用静定结构类的结构方案比较合适,因为当基础沉降时,结构中不会 产生内力. ( ) ...
  • 会计从业资格考试练习题一
    第一章    会计法律制度 单选 法律规范组成部分中的()是指规定的人们在违反法律规范时要承担的法律后果. a.假定 b.处理 c.制裁 d.惩罚 答案是c 本题分析法律规范一般由假定.处理.制裁三个部分组成.其中,制裁是指规定的人们在违反 ...
  • 化学教学法课程指导书
    现代远程教育 <中学化学教学法> 课 程 学 习 指 导 书 作者:韩春亮 2009年 3月 课程学习方法指导 学习方法是否得当直接关系到学习效果的优劣.好的学习方法使你事半功倍,不良的学习方法使你事倍功半,因此学习<中学 ...