变量之间的相关关系教学设计
苏松廉
↓
二.教学目标分析:
(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
(2) 了解最小二乘法的含义,知道最小二乘法的思想
,能根据给出的线性回归方程系数公式建立线性回归方程.
(3)在两个变量具有线性相关关系时,会在散点图中作出线性回归直线,会用线性回归方程进行预测.
三.教学重点与难点:
教学重点:回归直线方程的求解方法. 教学难点:回归直线方程的求解方法.
四.教学过程课堂设计:
1.创设情景,揭示课题
的6个数对所表示的点在坐标系内标出,得到散点图.
从散点图可以看出.这些点大致分布在通过散点图中心的一条直线的附近.
如果散点图中点的分布从整体看大致分布在一条直线的附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线.
如果能够求出这条回归直线的方程,我们就可以比较清楚的了解热茶销量与气温之间的关系. 2.最小二乘法
选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直
线的斜率、截距; ………………
怎样的直线最好呢? ------从整体上看,各点与此直线的距离最小.
ˆbxa的直线拟合散点图中的点,应使得该直线与散点图中的点最接近. 即: 用方程为y
ˆbxa与图中六个点的接近程度呢? 那么,怎样衡量直线y
ˆ的值: 我们将表中给出的自变量x的六个值带入直线方程,得到相应的六个y
26ba,18ba,13ba,10ba,4ba,ba.这六个值与表中相应的实际值应该越接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和:
Q(a,b)(26ba20)2(18ba24)2(13ba34)2(10ba38)2
(4ba50)2(ba64)2
1286b26a2140ab3820b460a10172
ˆbxa与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量Q(a,b)是直线y
ˆbxa与图中六个点的接近程度,所以,设法取a,b的值,使Q(a,b)达到最小值.这种直线y
方法叫做最小平方法(又称最小二乘法) .
140a3820
时, Q取得最小
21286140b460
值.同理, 把b看作常数,那么Q是关于a的二次函数.当a时, Q取得最小
12
先把a看作常数,那么Q是关于b的二次函数.易知,当b
140a3820b值.因此,当21286时,Q取得最小值,由此解得b1.6477,a57.5568.所求
a140b46012
ˆ1.6477x57.5568.当x5时,yˆ66,故当气温为5C时,热茶销直线方程为y
量约为66杯.
3.线性回归方程的求解方法
一般地,设有n个观察数据如下:
当a,b使Q(y1bx1a)(y2bx2a)...(ynbxna)取得最小值时,就
ˆbxa为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线. 称y
上述式子展开后,是一个关于a,b的二次多项式,应用配方法,可求出使Q为最小值时的a,b的值.即
nn
(xix)(yiy)xiyinxy
i1i1
bnn2nn
112(xix)xinx,(*) xi, yi ni1ni1i1i1
aybx
线性回归方程是
ˆbxa,其中b是回归方程的斜率,a是截距.系数 y
4.求线性回归方程的步骤:
(1)计算平均数,;
(2)计算xi与yi的积,求(3)计算
xy
i
ii
i
;
x
2i
;
b
(4)将结果代入公式
xy
i1ni1
n
nxy
2
,求b;
xi2nx
(5)用 ab,求a; (6)写出回归方程5. 线性回归方程的应用
(2)求出回归直线方程
解:(1)散点图(略).
4.75,2故可得到 7000730
a399.34.7530257
b
^
从而得回归直线方程是y4.75x257.
6.小结:
对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.写出回归方程