tceic.com
学霸学习网 这下你爽了
相关文档
相关标签
当前位置:首页 >> 数学 >>

2013年数学高考总复习重点精品课件: 《1.1回归分析的基本思想及其初步应用》课件 新人教A版选修1-2


1.1 回归分析的基本思想及其初步应用

【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤;

4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.

【核心扫描】

1.利用散点图分析两个变量是否存在相关关系,求线性回归方
程.(重点) 2.回归模型的选择,特别是非线性回归模型.(难点、易错点)

自学导引 1.回归分析

回归分析是对具有 相关关系 的两个变量进行统计分析的一种常
用方法. 2.线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不是一 条直线上,不能用一次函数y=bx+a描述它们之间的关系,因 随机误差 .

此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,
e为

(2)对参数 a 和 b 的估计,由《数学必修 3》可知:最小二乘法估 计a和b就是未知参数 a、b 的最好估计,其计算公式为
^ ^

? ?xi- x ??yi- y ? ?xiyi-n x y
b=
^ i=1 i=1

n

n



,a= y -b x ,

^

^

? ?xi- x ?
i=1

n

2

?x2-n x 2 i
i=1

n

1n 1n 其中 x =n ?xi, y =n ?yi,( x , y )称为样本点的中心. i=1 i=1

(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e,

因变量y由 自变量x



随机误差e

共同确定,即自变量x只解

释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.

试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必

过(

).
x 1 2 3 4

y 1 3 5 7

A.点(2,3)
C.点(2.5,4)
提示

B.点(1.5,4)
D.点(2.5,5)

选 C.线性回归方程必过样本点的中心( x , y ),即(2.5,4).

3.刻画回归效果的方式
数据点和它在回归直线上相应位置的差异(yi-yi)是随机 残差 误差.称ei=yi-yi 为残差,ei 称为相应于点(xi,yi)的残 差. ?
i=1 n ^ 2 (yi-yi) 称为残差平方和 ^ ^ ^ ^

利用图形来分析残差特性,作图时纵坐标为 残差 ,横 残差图 坐标可以选为 样本编号 ,或 身高数据 ,或体重估计值 等,这样作出的图形称为残差图

残差 图法

残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高

残差平 残差平方和为 ? (yi-y) ,残差平方和 越小 ,模型
i=1

n

^ 2

方和 拟合效果越好

?
i=1

n

^ 2 ?yi-yi?

相关指 R2=1- 数R
2

, 2 表示 解释 变量对 预报 变量变 R

?yi- y ?2 ?
i=1

n

化的贡献率,R2 越接近于 1,表示回归的效果越好

想一想:回归分析中,利用线性回归方程求出的函数值一定是真实 值吗?为什么? 提示 不一定是真实值,利用线性回归方程求的值,在很多时候是

个预报值,例如,人的体重与身高存在一定的线性关系,但体重除
了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动 等.

4.非线性回归分析
(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是 一条直线附近.我们就称这两个变量之间不具有线性相关关系 而是非线性相关关系. (2)非线性回归方程线性化

①y=axn(其中a,x,y均为正值)(幂函数型函数)
lg y=lg a+n lg x,令u=lg y,v=lg x,b=lg a, 则u=nv+b,图象为一直线. ②y=cax(a>0,c>0)(指数型函数) lg y=x lg a+lg c,令u=lg y,b=lg c,d=lg a,

则u=dx+b,图象为一直线.

名师点睛 1.线性回归方程 (1)在分析两个变量的相关关系时, 可根据样本数据散点图确定 两个变量之间是否存在相关关系, 然后利用最小二乘法求出回 归直线方程. ^ ^ ^ ^ ^ ^ (2)求线性回归方程y=bx+a的关键是求未知参数a和b,其中b ^ ^ ^ ^ 可借助于计算器求出,因为a= y -b x ,即 y =b x +a,所以点 ( x ,y )一定满足线性回归方程,即回归直线一定过点( x ,y ).

(3)求线性回归方程的步骤: ①先把数据制成表,从表中计算出 x , y ,
2 x1+x2+…+x2,x1y1+x2y2+…+xnyn 的值; 2 n

^ ^ ②计算未知参数a,b; ^ ^ ^ ③写出线性回归方程y=bx+a.

2.线性回归分析

(1)由线性回归方程给出的是一个预报值而非精确值.
(2)随机误差的主要来源 ①线性回归模型与真实情况引起的误差; ②省略了一些因素的影响产生的误差; ③观测与计算产生的误差.

(3)残差分析是回归分析的一种方法.
(4)用相关指数R2来刻画回归效果. R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2 越小,残差平方和越大,即模型的拟合效果越差.

3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报 变量. (2)画出确定好的解释变量和预报变量的散点图,观察它们之间 的关系(如是否存在线性关系等).

(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,
则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大 或残差呈现不随机的规律性等).若存在异常,则检查数据是否

有误,或模型是否合适等.

题型一 求线性回归方程

【例1】 某班5名学生的数学和物理成绩如下表:
学生

学科

A B C D E

数学成绩(x) 88 76 73 66 63

物理成绩(y) 78 65 71 64 61

(1)画出散点图; (2)求物理成绩y对数学成绩x的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.

[思路探索] 先利用散点图分析物理成绩与数学成绩是否线性相关,
若相关再利用线性回归模型求解.



(1)散点图如图.

1 (2) x =5×(88+76+73+66+63)=73.2, 1 y = ×(78+65+71+64+61)=67.8. 5

?xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
i=1

5

?x2=882+762+732+662+632=27 174. i
i=1

5

?xiyi-5 x y
所以b= x2-5 x 2 ?i
i=1 5 ^ i=1

5

25 054-5×73.2×67.8 = 27 174-5×73.22

≈0.625.

a= y -b x ≈67.8-0.625×73.2=22.05. 所以 y 对 x 的回归直线方程是 y=0.625x+22.05. (3)x=96,则y=0.625×96+22.05≈82, 即可以预测他的物理成绩是 82.
^ ^

^

^

规律方法

(1)散点图是定义在具有相关关系的两个变量基础上的,

对于性质不明确的两组数据,可先作散点图,在图上看它们有无关 系,关系的密切程度,然后再进行相关回归分析.

(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,
求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫 无意义.

【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x

的数据:

房屋面积/m2

115 110

80

135 105

销售价格/万元 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.

解 (1)数据对应的散点图如下图所示:

5 15 (2) x = ?xi=109, ? (xi- x )2=1 570, 5i=1 i=1

y =23.2, ? (xi- x )(yi- y )=308.
i=1

5

设所求回归直线方程为y=bx+a,

^

^

^

? ?xi- x ??yi- y ?
则b=
^ i=1

5

? ?xi- x ?2
i=1

5

308 =1 570≈0.196 2,

a= y -b x =0.181 42. 故所求回归直线方程为y=0.196 2x+1.814 2. 回归直线如上图所示. (3)据(2),当 x=150 m2 时,销售价格的估计值为 y=0.196 2×150+1.814 2=31.244 2(万元).
^ ^

^

^

题型二 线性回归分析 【例2】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,

对不同重量的6个物体进行测量,数据如下表所示:

x

5

10

15

20

25

30

y 7.25 8.12 8.95 9.90 10.9 11.8

(1)作出散点图并求线性回归方程;
(2)求出R2; (3)进行残差分析.

[思路探索] 作残差分析时,一般从以下几个方面予以说明:(1)散 点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区

域的宽窄.



(1)散点图如图

1 x =6(5+10+15+20+25+30)=17.5, 1 y =6(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, x2=2 i i=1

?

6

275, ?xiyi=1 076.2
i=1
^ ^

6

计算得,b≈0.183,a≈6.285, 所求回归直线方程为y=0.183x+6.285.
^

(2)列表如下:

yi-yi

^

0.05

0.005

-0.08 -0.045 0.04 0.025 0.41 1.41 2.31

yi- y -2.24 -1.37 -0.54
所以 ?
i=1 6 ^ 2 (yi-yi) ≈0.013 6

18, ? (yi- y )2=14.678 4.
i=1

0.013 18 所以,R =1- ≈0.999 1, 14.678 4
2

回归模型的拟合效果较好.

(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确 认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠

正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀
地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系. 规律方法 当资料点较少时,也可以利用残差表进行残差分析,注

意计算数据要认真细心,残差分析要全面.

【变式2】 已知某种商品的价格x(元)与需求量y(件)之间的关系有如 下一组数据: x 14 16 18 20 22 y 12 10 7 5 3

求y对x的回归直线方程,并说明回归模型拟合效果的好坏.



1 x = (14+16+18+20+22)=18, 5

1 y = (12+10+7+5+3)=7.4, 5

?x2=142+162+182+202+222=1 660, i
i=1

5

?xiyi=14×12+16×10+18×7+20×5+22×3=620,
i=1

5

?xiyi-5 x y
所以b=
^ i=1

5

?x2-5 x 2 i
i=1 ^

5

620-5×18×7.4 = =-1.15. 1 660-5×182

a=7.4+1.15×18=28.1, 所以所求回归直线方程是:y=-1.15x+28.1. 列出残差表:
^

yi-yi yi- y
5

^

0

0.3 -0.4 -0.1

0.2

4.6 2.6 -0.4 -2.4 -4.4

5 ^ 2 所以, (yi-yi) =0.3, i=1 i=1

?

? (yi- y )2=53.2,

?
i=1

5

^ 2 ?yi-yi?

R2=1-

≈0.994,

? ?yi- y ?2
i=1

5

所以回归模型的拟合效果很好.

题型三 非线性回归分析 【例3】 下表为收集到的一组数据: x 21 23 25 27 29 32 35

y 7 11 21 24 66 115 325 (1)作出x与y的散点图,并猜测x与y之间的关系; (2)建立x与y的关系,预报回归模型并计算残差;

(3)利用所得模型,预报x=40时y的值.

(1)画出散点图或进行相关性检验,确定两变量x、y是 否线性相关.由散点图得x、y之间的回归模型. (2)进行拟合,预报回归模型,求回归方程.

[规范解答] (1)作出散点图如下图,从散点图可以看出x与y不具有 线性相关关系,根据已有知识可以发现样本点分布在某一条指数

函数曲线y=c1ec2x的周围,其中c1、c2为待定的参数.(4分)

(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换 后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样

就可以利用线性回归模型来建立y与x之间的非线性回归方程了,
数据可以转化为: x 21 23 25 27 29 32 35

z 1.946 2.398 3.045 3.178 4.190 4.745 5.784

求得回归直线方程为=0.272x-3.849, ∴=e0.272x-3.849. 残差 yi
i i

(8分)

7

11

21

24

66

115

325

6.443 11.101 19.125 32.950 56.770 128.381 290.325 0.557 -0.101 1.875 -8.950 9.23 -13.381 34.675
(10 分)

(3)当 x=40 时,y=e0.272x

-3.849

≈1 131.(12 分)

【题后反思】 解决非线性回归问题的方法及步骤

(1)确定变量:确定解释变量为x,预报变量为y;
(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数 函数、二次函数)作比较,选取拟合效果好的函数模型; (3)变量置换:通过变量置换把非线性问题转化为线性回归问题; (4)分析拟合效果:通过计算相关指数等来判断拟合效果; (5)写出非线性回归方程.

【变式3】 为了研究某种细菌随时间x变化时,繁殖个数y的变化, 收集数据如下: 天数x/天

1 2

3

4

5

6

繁殖个数y/个 6 12 25 49 95 190
(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数 据的散点图; (2)描述解释变量x与预报变量y之间的关系;

(3)计算相关指数.

解 (1)所作散点图如图所示.

(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于 是令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln

c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间
的非线性回归方程了,数据可以转化为:

x

1

2

3

4

5

6

z 1.79 2.48 3.22 3.89 4.55 5.25

由计算器得:z=0.69x+1.115,则有y=e0.69x+1.115.

^

^

(3) yi 6.08 12.12 24.17 48.18 96.06 191.52 yi 6 12 25 49 95 190
^

^ 2 377 n ^2 n y = 6 , ?e i = ? (yi-y) =4.816 1, i=1 i=1

?
i=1

n

4.816 1 (yi- y ) =24 642.8,R =1-24 642.8≈0.999 8,
2 2

即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.

误区警示

对相关指数 R2 理解不当致误

【示例】 关于 x 与 y 有如下数据: x 2 4 5 6 8

y 30 40 60 50 70 为了对 x、 两个变量进行统计分析, y 现有以下两种线性模型: ^ ^ 甲模型y=6.5x+17.5,乙模型y=7x+17,试比较哪一个模型 拟合的效果更好.

^ ? ?yi-yi?2
i=1

5

[错解]

∵R2=1- 1

? ?yi- y ?2
i=1

5

155 =1- =0.845. 1 000

?
i=1

5

^ ?yi-yi?2 180 =1-1 000=0.82.

R2=1- 2

? ?yi- y ?2
i=1

5

又∵84.5%>82%,∴乙选用的模型拟合的效果更好.

用相关指数R2来比较模型的拟合效果,R2越大,模型 的拟合效果越好,并不是R2越小拟合效果更好.

^ ? ?yi-yi?2
i=1

5

[正解]

R2=1- 1

? ?yi- y ?2
i=1

5

155 =1- =0.845, 1 000

^ ? ?yi-yi?2
i=1

5

R2=1- 2

?
i=1

5

?yi- y ?2

180 =1-1 000=0.82,

84.5%>82%,所以甲选用的模型拟合效果更好.

^ ? ?yi-yi?2
i=1

n

R2=1-

,R2 越大,残差平方和越小,从而

?
i=1

n

?yi- y ?2

回归模型的拟合效果越好.在线性回归模型中,R2 表示解释变量 对于预报变量变化的贡献率, 2 越接近 1, R 表示回归的效果越好(因 为 R2 越接近 1,表示解释变量和预报变量的线性相关性越强).


推荐相关:

高考数学复习点拨 回归分析的基本思想及其初步应用知识...

高考数学复习点拨 回归分析的基本思想及其初步应用知识点精析。高考数学复习点拨 回归分析的基本思想及其初步应用知识点精析 回归分析的基本思想及其初步应用知识点精析...


1.1回归分析的基本思想及其初步应用

搜试试 7 帮助 全部 DOC PPT TXT PDF XLS ...1.1回归分析的基本思想及其初步应用_高二数学_数学_...教学重点:了解评价回归效果的三个统计量:总偏差平方...


1、1回归分析的基本思想及其初步应用

搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS ...11回归分析的基本思想及其初步应用_高三数学_数学...(重点) 课标解读 2.会求回归方程,掌握建立回归模型...


1.1回归分析的基本思想及其初步应用

搜试试 3 帮助 全部 DOC PPT TXT PDF XLS ...1.1回归分析的基本思想及其初步应用_数学_高中教育_...【预习案】一.复习 1:函数关系是一种 复习 2:...


1.1回归分析的基本思想及其初步应用(第一课时)

1.1回归分析的基本思想及其初步应用(第一课时)_高二数学_数学_高中教育_教育...课件,教案,多媒体 正确认识与对待党和国家的民族政策, 在日常生活中, 能遵循...


《1.1回归分析的基本思想及其初步应用(一)》教学案3

《1.1回归分析的基本思想及其初步应用(一)》教学案3_高二数学_数学_高中教育_教育专区。《1.1回归分析的基本思想及其初步应用(一)》教学案3 教学目标 (1)....


1.1回归分析的基本思想及其初步应用导学案及答案

搜试试 7 悬赏文档 全部 DOC PPT TXT PDF XLS 广告 百度文库 教育专区 ...1.1回归分析的基本思想及其初步应用导学案及答案_数学_高中教育_教育专区。第04...


高考数学复习点拨:回归分析的基本思想及其初步应用知识...

高考资源网(ks5u.com) 您身边的高考专家 回归分析的基本思想及其初步应用知识点精析.知识要点,学习目标 1.如果组具有相关关系的数据 ( x1 , y1 ),( x2...


1.1回归分析的基本思想及其初步应用 教学设计 教案

标签 教学过程 复习引入【师】问题 1:你能...PPT1.散点图在回归分析中的作用是 (D) A....和残差分析比较 3.数形结合思想,转化的数学思想。 ...


1.1回归分析的基本思想及其初步应用

11 回归分析的基本思想及其初步应用(习题课)(第五课时) 目标:通过习题巩固所学知识 过程:1复习有关知识 2、典型例题: 例 1:某班 5 名学生的数学和化学...

网站首页 | 网站地图
All rights reserved Powered by 学霸学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com