tceic.com
简单学习网 让学习变简单
当前位置:首页 >> 数学 >>

1.1回归分析


§ 1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析

●三维目标 1.知识与技能 (1)通过对典型案例的探究,了解回归的基本思想、方法及初步应用. (2)了解相关系数 r 的含义,会根据两个随机变量的线性相关系数判断它们之间的线性 相关程度. (3)能将非线性回归问题转化为线性回归问题来解决. 2.过程与方法 在分析和探讨变量之间

的线性关系的过程中, 体会统计推理由直观到严谨的过程, 进一 步了解统计推理的基本方法和基本思想,发展统计思维能力. 3.情感、态度与价值观 通过对两个随机变量进行回归分析, 并根据回归方程对数据进行预测, 认识和体会统计 推理及其方法在解决实际问题中的作用,感受数学与生活的密切联系. ●重点难点 重点:(1)回归分析的基本思想和方法.(2)判断两个随机变量是否线性相关. 难点:(1)对两个随机变量是否线性相关进行判断.(2)求线性回归方程. 本节的教学, 要通过具体问题的解决, 引导学生复习回顾利用最小二乘法求变量之间的 线性回归方程的方法,以及如何根据线性回归方程,对数据进行估计. 教学中,要通过引导学生探究,明确在求线性回归方程时,要对变量是否线性相关作出 判断的必要性以及判断方法.判断方法有两种:散点图法—定性判断,相关系数法—定量判 断.

(教师用书独具)

●教学建议 1.通过学生熟悉的实际问题引入课题,为学习创设情境,拉近数学与现实的距离,激

发学生的求知欲,调动学生主动参与的积极性. 2.在教学中,要引导学生探究两个变量相关性的判断方法,感悟两个变量相关性判断 的必要性. 3.在鼓励学生主体参与的同时,不可忽视教师的主导作用,具体体现在设问、讲评和 规范等方面,要教会学生清晰的思维、准确地计算,要引导学生感悟定性判断与定量判断之 间的辩证关系. ●教学流程 情境引入?如何判断线性相关?如何判断线性相关的程度?线性回归方程的应用?可 线性化的回归分析?归纳总结,深化认识

1.了解回归分析的思想和方法(重点). 课标解读 2.掌握相关系数的计算和判断线性相关的方法(重点). 3.了解常见的非线性回归模型转化为线性回归模型的方法 (难点).

回归分析 【问题导思】 1.自变量取值一定时,若因变量的取值也随之确定,则这两个变量之间的关系称为什 么关系?若因变量的取值具有随机性呢? 【提示】 函数关系,相关关系. 2.类比用函数图像研究函数,具有相关关系的两个变量可用什么研究? 【提示】 散点图. 1.回归分析 设变量 y 对 x 的线性回归方程为 y=a+bx,由最小二乘法知系数的计算公式为:

lxy b= = lxx

i=1

? ?xi- x ??yi- y ? ?xiyi-n x
i=1

n

n

y ,a= y -b x . x
2


i=1

? ?xi- x ?

n

2

x2 i -n i=1

?

n

2.相关系数 (1)相关系数 r 的计算 假设两个随机变量的数据分别为(x1,y1),(x2,y2),?,(xn,yn),则变量间线性相关系

数 r=

lxy lxxlyy

i=1

? ?xi- x ??yi- y ?

2

n

i=1 n

?xiyi-n x
x
2

n

y .
n


i=1

? ?xi- x ?

n

i=1

? ?yi- y ?

n

2

x2 i -n i=1

?

yi2-n i=1

?

y

2

(2)相关系数 r 与线性相关程度的关系 ①r 的取值范围为[-1,1]; ②|r|值越大,误差 Q 越小,变量之间的线性相关程度越高; ③|r|值越接近 0,误差 Q 越大,变量之间的线性相关程度越低. (3)相关性的分类 ①当 r>0 时,两个变量正相关; ②当 r<0 时,两个变量负相关;

③当 r=0 时,两个变量线性不相关.

求线性回归方程

一根弹簧的长度 y(单位:厘米)在不同拉力 x(单位:牛顿)的作用下的 数据如下表: x/牛顿 y/厘米 5 7.25 10 8.12 15 8.95 20 9.90 25 10.90 30 11.80

(1)求出该弹簧长度 y 对拉力 x 的线性回归方程; (2)预测拉力为 18 牛顿时的弹簧长度是多少? 【思路探究】 根据样本点数据画出散点图.利用散点图直观分析弹簧长度 y 与拉力 x 具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程. 【自主解答】 (1)作出散点图如图所示:

由散点图可看出,两个变量呈现出近似的线性关系,可以建立弹簧长度 y 对拉力 x 的线 性回归方程. 将已知数据列成下表: xi 5 10 15 20 25 30 105 105 由此可得 x = =17.50, 6 i 1 2 3 4 5 6 ∑ yi x2 i 7.25 25 8.12 100 8.95 225 9.90 400 10.90 625 11.80 900 56.92 2 275 56.92 y= ≈9.49,进而可求得 6 xiyi 36.25 81.20 134.25 198.00 272.50 354.00 1 076.20

1 076.20-6×17.50×9.49 b= ≈0.18, 2 275-6×17.502 a=9.49-0.18×17.50=6.34. 于是,y 对 x 的线性回归方程为 y=6.34+0.18x. (2)由线性回归方程可知当拉力为 18 牛顿时,弹簧长度的估计值为 6.34+0.18×18= 9.58(厘米).

1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在作回归分析时,要 先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关. 2.利用回归直线,我们可以进行预测.若回归直线方程 y=a+bx,则 x=x0 处的估计 值为 y0=a+bx0. 3.线性回归方程中的截距 a 和斜率 b 都是通过样本估计而得到的,存在着误差,这种 误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值. ...................... 4.回归直线必过样本点的中心点.

假定单位面积小麦基本苗数 x 与成熟期有效穗 y 是线性相关的,今测得 5 组数据如下: x y 15.0 39.4 25.8 42.9 30.0 42.9 36.6 43.1 44.4 49.2

求 y 与 x 之间的线性回归方程,并对基本苗数 56.7 预报有效穗. 【解】 设线性回归方程为 y=a+bx. 则 x =30.36, y =43.5, x 2=921.729 6, x y =1 320.66, ?xiyi=6 746.76, ?x2 i =5 101.56.
i=1 i=1 5 5

i=1

?xiyi-5 x ?x2 i -5 x
5 2

5

y ≈0.291,a= y -b x ≈34.67,

所以 b=

i=1

∴所求的线性回归方程为 y=34.67+0.291x. 当 x=56.7 时,y=34.67+0.291×56.7=51.170. 估计成熟期有效穗为 51.170. 相关系数的应用

下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通 事故数与机动车辆数是否有线性相关关系.

机动车辆 数 x/千台 交通事故 数 y/千件

95

110

112

120

129

135

150

180

6.2

7.5

7.7

8.5

8.7

9.8

10.2

13.0

【思路探究】 列表计算出相关系数所需数据,代入公式即可求出相关系数 r,由此判 断交通事故数 y 与机动车辆数 x 是否线性相关. 【自主解答】 将数据列成下表: i 1 2 3 4 5 6 7 8 ∑ xi 95 110 112 120 129 135 150 180 1 031 yi 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13.0 71.6 x2 i 9 025 12 100 12 544 14 400 16 641 18 225 22 500 32 400 137 835 y2 i 38.44 56.25 59.29 72.25 75.69 96.04 104.04 169.00 671.00 xiyi 589.0 825.0 862.4 1 020.0 1 122.3 1 323.0 1 530.0 2 340.0 9 611.7

由此可得 x =128.875, y =8.95.进而求得 r= 9 611.7-8×128.875×8.95 ?137 835-8×128.8752?×?671.00-8×8.952?

≈0.992 7. 因为 r>0.75,所以可以得出交通事故数 y 和机动车辆数 x 有较强的线性相关程度.

1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图 相比较,线性相关系数要精细得多.需要注意的是线性相关系数 r 的绝对值小,只是说明线 性相关程度低,但不一定不相关,可能是非线性相关. 2.利用相关系数 r 来检验线性相关显著性水平时,通常与 0.75 作比较,若 r>0.75,则 线性相关较为显著,否则为不显著.

现随机抽取了某中学高一 10 名在校学生,他们入学时的数学成绩(x)与入学后第一次考 试的数学成绩(y)如下: 学生号 x 1 120 2 108 3 117 4 104 5 103 6 110 7 104 8 105 9 99 10

108

y

84

64

84

68

69

68

69

46

57

71

请问:这 10 名学生的两次数学成绩是否具有线性关系? 【解】 y=
10

x=

1 ×(120+108+?+99+108)=107.8, 10

1 (84+64+?+57+71)=68, 10

i=1

2 2 2 2 ?x2 i =120 +108 +?+99 +108 =116 584,

i=1

2 2 2 2 ?y2 i =84 +64 +?+57 +71 =47 384,

10

i=1

?xiyi=120×84+108×64+?+99×57+108×71

10

=73 796. 所以相关系数为 r= 73 796-10×107.8×68 ?116 584-10×107.82??47 384-10×682?

≈0.750 6. 由此可看出这 10 名学生的两次数学成绩具有较强的线性相关关系.

可线性化的回归分析

某地区的女性在不同年龄段的身高平均值 x(单位:cm)和体重平均值 y(单位:kg)的数据如下表: 60 70 80 90 100 身高 x/cm 6.13 7.90 9.99 12.15 15.02 体重 y/kg 身高 x/cm 体重 y/kg 120 130 140 150 160 20.92 26.85 31.11 38.85 47.25 (1)试建立 y 与 x 之间的回归方程; (2)若体重超过相同身高的女性体重平均值的 1.2 倍为偏胖,低于 0.8 倍为偏瘦,那么这 个地区一名身高 175 cm、体重 82 kg 的女性的体重是否正常? 【思路探究】 由样本点画出散点图, 找出拟合函数曲线, 转化为线性回归模型解题. 注 意最后要将中间变量值用 x 代换. 【自主解答】 (1)根据上表中的数据画出散点图如图所示:

110 17.50 170 55.05

由图可看出,样本点分布在某条类似指数函数曲线 y=ec1+c2x 的周围,其中 c1 和 c2 是 待定的系数,令 z=ln y,变换后的样本数据表如下: x z x z 60 1.81 120 3.04 70 2.07 130 3.29 80 2.30 140 3.44 90 2.50 150 3.66 100 2.71 160 3.86 110 2.86 170 4.01

作出散点图如图所示:

设 z 与 x 之间的线性回归模型为 z=a+bx, 则由表中数据得 b≈0.020,a= z -b x ≈0.625, 所以 z 与 x 之间的线性回归方程为 z=0.625+0.020x,所以 y=e0.625 (2)当 x=175 cm 时, 预测平均体重 y=e0.625
+0.020×175 +0.020x

.

≈61.87(kg),

由于 61.87×1.2=74.24<82,所以这位女性偏胖.

非线性回归方程的求解步骤:

若函数模型为 y=x2+bx+c,则作变换 t=________才能转化为 y 对 t 的线性回归方程.
2 4c-b2 b 2 4c-b b2 【解析】 y=(x+ ) + ,令 t=(x+ ) ,则 y=t+ . 2 4 2 4

【答案】

b (x+ )2 2

求解不严谨致误 某工厂在 2012 年的各月中,某产品的月总成本 y(万元)与月产量 x(吨) 之间有如下数据: 4.16 4.38 4.24 4.56 4.38 4.6 4.56 4.83 4.72 4.96 4.96 5.13 5.18 5.38 5.36 5.55 5.6 5.71 5.74 5.89 5.96 6.04

6.1

6.2

若 2013 年 1 月份该产品的计划产量是 6 吨, 试估计该产品 1 月份的总成本(精确到小数 点后两位).
n

∑xiyi-n x 【错解】 b=
i=1 n

y =0.92,a= y -b x =0.60.∴线性回归方程为 y=0.92x x
2

∑x2 i -n i=1 +0.60.

当 x=6 时,y=0.92×6+0.60=6.12(万元), 即该产品 1 月份的总成本的估计值为 6.12 万元.

【错因分析】 未判断 y 与 x 是否线性相关就求线性回归方程,思维不严谨致误. 【防范措施】 在求线性回归方程之前,应先判断变量之间是否线性相关,再求回归方 程,否则建立的线性回归方程没有意义. 【正解】 (1)散点图见下图,从图中可以看到,各点大致在一条直线附近,说明 x 与 y 有较强的线性相关关系.

n

∑xiyi-n x (2)b=
i=1 n

y =0.92,a= y -b x =0.60, x
2

∑x2 i -n i=1

∴线性回归方程为 y=0.92x+0.60. 当 x=6 时,y=0.92×6+0.60=6.12(万元), 即该产品 1 月份的总成本的估计值为 6.12 万元.

1.解决线性回归问题的思路 首先通过散点图分析两变量间是否线性相关,然后利用公式求回归方程,在此基础上, 借助回归方程对实际问题进行分析.

2.对于非线性回归问题,可以画出已知数据的散点图,经过比较,挑选一种跟这些散 点拟合得最好的函数,采用适当的变量置换,把问题化为线性回归分析问题.

1.下列两变量中具有相关关系的是( A.正方体的体积与边长 B.人的身高与体重 C.匀速行驶车辆的行驶距离与时间 D.球的半径与体积

)

【解析】 选项 A 中正方体的体积为边长的立方,有固定的函数关系;选项 C 中匀速 4 行驶车辆的行驶距离与时间成正比,也是函数关系;选项 D 中球的体积是 π 与半径的立方 3 相乘,有固定函数关系.只有选项 B 中人的身高与体重具有相关关系. 【答案】 B 2.某产品的广告费用 x 与销售额 y 的统计数据如下表: 广告费用 x(万元) 销售额 y(万元) 4 49 2 26 3 39 5 54

根据上表可得回归方程 y=bx+a 中的 b 为 9.4, 据此模型预报广告费用为 6 万元时销售 额为( ) B.65.5 万元 D.72.0 万元 4+2+3+5 49+26+39+54 =3.5, y = =42,∴a= y -b x =42- 4 4

A.63.6 万元 C.67.7 万元 【解析】 9.4×3.5=9.1, ∴回归方程为 y=9.4x+9.1, x=

∴当 x=6 时,y=9.4×6+9.1=65.5,故选 B. 【答案】 B 3.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查 显示年收入 x 与年饮食支出 y 具有线性相关关系, 并由调查数据得到 y 对 x 的回归直线方程: y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加 ________万元. 【解析】 由题意知其回归系数为 0.254,故家庭年收入每增加 1 万元,年饮食支出平 均增加 0.254 万元. 【答案】 0.254

4.两个变量满足如下关系: x y 5 103
5

10 105

15 110
5

20 111

25 114

试判断这两个变量的相关程度. 【解】
5 2 由表可得:∑xi =1375,∑y2 i =59 i=1 i =1 5

051,∑xiyi=8 285, x =15, y =108.6.
i=1

∑xiyi-5 x ∴r=
i=1 5 5

y ∑yi2-5 y
i=1 2

∑x2 i -5 i=1 =

x

2

8 285-5×15×108.6 1 375-5×152 5 9051-5×108.62

≈0.982 6.

因此可说两个变量的线性相关程度很强.

一、选择题 1.下列两个变量具有相关关系的是( A.正方体的体积与边长 B.匀速行驶的车辆的行驶距离与行驶时间 C.人的身高与体重 D.人的身高与视力 【解析】 A、B 是函数关系,D 无相关关系.相关关系是一种不确定的关系. 【答案】 C 2.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则 y 与 x 之间的回归直线方 程为( ) B.y=x+2 )

A.y=x+1

C.y=2x+1 D.y=x-1 【解析】 1+2+3+4 5 2+3+4+5 7 x= = ,y= = . 4 2 4 2

因为回归直线一定过点( x , y ),所以 A 项符合要求. 【答案】 A 3.设(x1,y1),(x2,y2),?,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本

点通过最小二乘法得到的线性回归直线(如图 1-1-1),以下结论正确的是(

)

图 1-1-1 A.直线 l 过点( x , y ) B.x 和 y 的相关系数为直线 l 的斜率 C.x 和 y 的相关系数在 0 到 1 之间 D.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 【解析】 由样本的中心( x , y )落在回归直线上可知 A 正确;x 和 y 的相关系数表示 为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 B 错;x 和 y 的相关系数应在-1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数并不绝对平均,无论样本点个数 是奇数还是偶数,故 D 错. 【答案】 A 4.为了考查两个变量 x 和 y 之间的线性相关性,甲、乙两名同学各自独立地做了 10 次 试验和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1 和 l2.已知两个人在试验 中发现对变量 x 的观测数据的平均数都为 s,对变量 y 的观测数据的平均数都为 t,那么下 列说法中正确的是( )

A.直线 l1 和 l2 都过点(s,t) B.直线 l1 和 l2 相交,但交点不一定是(s,t) C.直线 l1 和 l2 必平行 D.直线 l1 和 l2 必重合 【解析】 线性回归方程 y=bx+a 恒过点( x , y ),故直线 l1 和 l2 都过点(s,t). 【答案】 A 5.若已知∑(xi- x )2 是∑(yi- y )2 的两倍,∑(xi- x )(yi- y )是∑(yi- y )2 的 1.2 倍, 则相关系数 r 的值是( 2 A. 1.2 1.2 B. 2 )

C.0.92 D.0.65

i=1

? ?xi- x ??yi- y ? ? ?xi- x ?2 ? ?yi- y ?2
i=1 n n

n

【解析】 由题意知 r=
i=1

1.2 ? ?yi- y ?2
i=1

n


n n i=1 i=1

2 ? ?yi- y ?2· ? ?yi- y ?2 【答案】 B 二、填空题

1.2 = . 2

6.已知变量 y 对 x 的线性回归方程为 y=-0.81+0.50x,则当 x=25 时,y 的估计值为 ________. 【解析】 当 x=25 时,y 的估计值为-0.81+0.50×25=11.69. 【答案】 11.69 7.某单位为了了解用电量 y(度)与气温 x(℃)之间的关系,随机统计了某 4 天的用电量 与当天气温,并制作了对照表: 气温(℃) 用电量(度) 18 24 13 34 10 38 -1 64

由表中数据得线性回归方程 y=bx+a 中 b=-2,预测当天气温为-4 ℃时,用电量约 为________. 【解析】 ∵ x = y= 18+13+10-1 =10, 4

24+34+38+64 =40,y=-2x+a 过(10,40), 4

∴a=40+2×10=60,∴y=-2x+60. 当 x=-4 时,y=-2×(-4)+60=68. 【答案】 68 度 8.若回归直线方程中的回归系数 b=0,则相关系数 r=________. 【解析】
n

对比线性相关系数和线性回归方程系数 b 的求解公式:r=
n

∑xiyi-n x
i=1 n n

y 和 b= y ?
2

∑xiyi-n x
i=1 n

y ,可以发现其分子相同,故 b=0,可推 x
2

?∑x2 i -n i=1 得 r=0.

x

2

??∑y2 i -n i=1

∑x2 i -n i=1

【答案】 0 三、解答题 9.某连锁经营公司所属的 5 个零售店某月的销售额和利润情况如下表:

商店名称 销售额 x/千万元 利润 y/百万元

A 3 2

B 5 3

C 6 3

D 7 4

E 9 5

判断销售额与利润是否具有相关性; 若销售额和利润具有线性相关关系, 用最小二乘法 计算利润 y 对销售额 x 的线性回归方程.(判断相关性利用两种方法) 【解】 判断相关性先利用散点图大体观察是否具有相关性,散点图如下:

通过散点图可知,两个变量具有相关性,下面通过计算再次明确是否具有相关性(根据 上表数据,可以算出: x =6, y =3.4),其他数据见下表:

xi A B C D E 合计 进而可求得 r= 3 5 6 7 9 30

yi 2 3 3 4 5 17

x2 i 9 25 36 49 81 200

y2 i 4 9 9 16 25 63

xiyi 6 15 18 28 45 112

112-5×6×3.4 200-5×62 63-5×3.42

≈0.98,相关系数非常接近 1,因此两个变量

具有显著的线性相关性,b= 方程为 y=0.5x+0.4.

112-5×6×3.4 =0.5,a=3.4-0.5×6=0.4,故所求线性回归 200-5×62

10. 某小卖部为了解雪糕销售量与气温之间的关系, 随机统计并制作了卖出雪糕数与当 天气温的对照表: 气温 x(℃) 卖出雪糕数 y(根) 20 16 23 24 25 30 27 34 29 38 31 42 34 50 35 64

求出线性回归方程,并预测气温为 37 ℃时卖出雪糕的数量.

【解】 由表中数据可得:

i=1

?x2 i =6 466, ?xiyi=8 884, x =28, y =37.25,
i=1

8

8

进而可以求得

i=1

?xiyi-8 x ?xi2-8 x
8 2

8

y

b=

i=1



8 884-8×28×37.25 ≈2.78, 6 466-8×282

a= y -b x ≈37.25-2.78×28=-40.59. ∴线性回归方程为 y=-40.59+2.78x. 把 x=37 代入,得 y≈62, ∴预测气温为 37 ℃时,卖出雪糕的数量约为 62 根. 11.某种图书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据如下:

x y

1 10.15

2 5.52

3 4.08

5 2.85

10 2.11

20 1.62

30 1.41

50 1.30

100 1.21

200 1.15

1 检测每册书的成本费 y 与印刷册数的倒数 之间是否具有线性相关关系,如有,求出 y x 对 x 的回归方程. 1 【解】 首先作变量转换 u= ,题目所给数据变成如下表所示的数据: x

i ui yi

1 1 10.15

2 0.5 5.52

3 0.33 4.08
10

4 0.2 2.85

5 0.1 2.11

6 0.05 1.62

7 0.03 1.41

8 0.02 1.30

9 0.01 1.21

10 0.005 1.15

∑ ?ui- u ??yi- y ? 可以求得,r=
i=1 10 2 10

≈0.999 8.
2

∑ ?ui- u ? ∑ ?yi- y ?
i=1 i=1

因此,变量 y 与 u 之间具有较强的线性相关关系.

经 计 算 得 8.973 x

b≈8.973 , a≈1.125 , 最 后 回 代

1 u = x 可 得 , y = 1.125 + .

(教师用书独具)

某商店经营一批进价为每件 4 元的商品,在市场调查时发现,此商品的销售单价 x(元) 与日销售量 y(件)之间有如下关系: x y 5 10 6 8 7 7 8 3

4

4

经计算得:x 与 y 具有线性相关关系,且∑ (xi- x )(yi- y )=-11,∑ (xi- x )2=5,
i=1 i=1

为使日利润最大,则销售单价应定为多少元? 【思路探究】 本题具有综合性,首先求得线性回归方程,再利用函数思想求得关于利 润的关系式,转化为二次函数知识求解.
n

∑ ?xi- x ??yi- y ? 【自主解答】 由 b=
i=1 n



∑ ?xi- x ?2
i=1

-11 =-2.2, 结合数表可得 x =6.5, y = 5

7. 由 y =b x +a,得 a= y -b x =7-(-2.2)×6.5=21.3,则销售单价为 x 时的利润 w 30.1 =(x-4)(-2.2x+21.3)=-2.2x2+30.1x-85.2,当 x= ≈6.8 时,日利润最大. 2×2.2 ∴销售单价应定为 6.8 元.

1.在求回归方程时,一般先要考查 y 与 x 是否具有线性相关关系,考查的方法有两种: 一种是画出散点图,另一种是作相关性检验,即求相关系数. 2.求解两个变量的相关系数及它们的线性回归方程的计算量较大,需要细心、谨慎地
n n n n n 2 计算.如果会使用含统计的科学计算器,能简单得到∑xi,∑yi,∑x2 i ,∑yi ,∑xiyi 这些量, i=1 i=1 i=1 i=1 i=1

也就无需制表这一步,直接算出结果即可.另外,利用计算机有关应用程序也可以对这些数

据进行处理. 3.本题把线性回归、一次函数、二次函数巧妙地结合在一起,知识交汇是高考命题的 主要思路,所以这类题目应该引起关注.

某高中地处县城,学校规定家到学校路程在 5 里以内的学生可以走读,因交通便利,所 以走读生人数很多, 该校先后 5 次对走读生的情况进行统计, 下表是根据 5 次调查得到的下 午开始上课时间与平均每天午休的走读生人数的统计数据表: 下午开始 2:00 2:10 2:20 2:30 2:40 上课时间 平均每天 250 350 500 650 750 午休人数 (1)如果把下午开始上课时间 2:00 作为横坐标原点,上课时间每推迟 10 分钟,横坐标 x 增加 1,以平均每天午休人数为纵坐标,画出散点图; (2)求平均每天午休人数 y 与上课时间 x 之间的线性回归方程 y=bx+a; (3)预测当下午上课时间推迟到 2:50 时,走读生中大约有多少人午休? 【解】 (1)由题意得 x y 散点图: 0 250 1 350 2 500 3 650 4 750

(2) x =2, y =500,b=130,a= y -b·x =240, ∴所求线性回归方程为 y=130x+240. (3)下午上课时间推迟到 2:50,x=5, ∴y=130×5+240=890. 此时午休的走读生约有 890 人. 线性回归的来历 回归分析最早是 19 世纪末期高尔顿所引入.高尔顿是生物统计学派的奠基人,他的表 哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力进化问题,统计学上的

“相关”和“回归”的概念也是高尔顿第一次使用的. 1855 年,他发表了一篇“遗传的身高向平均数方向的回归”文章,分析儿童身高与父 母身高之间的关系,发现父母的身高可以预测子女的身高,当父母越高或越矮时,子女的身 高会比一般儿童高或矮, 他将子女与父母身高的这种现象拟合出一种线形关系. 但是有趣的 是,通过观察他注意到,尽管这是一种拟合较好的线性关系,但仍然存在例外现象:身材较 矮的父母所生子女比其父母要高,身材较高的父母所生子女的身高将回降到人的平均身 高.换句话说,当父母身高走向极端(或者非常高,或者非常矮),子女的身高不会像父母身 高那样极端化,其身高要比父母们的身高更接近平均身高.高尔顿选用“回归”一词,把这 一现象叫做“向平均数方向的回归”. 关于父辈身高与子代身高的具体关系,高尔顿和他的学生 K· Pearson 观察了 1078 对夫 妇,以每对夫妇的平均身高作为自变量,取他们的一个成年子女的身高作为因变量,结果发 现两者近乎一条直线,其回归直线方程为 y=33.73+0.516x,这种趋势及回归方程表明父母 身高每增加一个单位时,其成年子女的身高平均增加 0.516 个单位.这样当然极端值就会向 中心靠拢.


推荐相关:

1.1回归分析

§ 1 回归分析 1.1 回归分析 1.2 相关系数 1.3 可线性化的回归分析 ●三维目标 1.知识与技能 (1)通过对典型案例的探究,了解回归的基本思想、方法及初步...


1.1回归分析的基本思想及其初步应用

阿尔山市一中高二年级数学学科导学案主备人 课题 代丽艳 课时 1 时间 45 分钟 1.1 回归分析的基本思想及其初步应用 学习目标 1.知识与技能:回忆线性回归模型与...


1、1回归分析的基本思想及其初步应用

新课标 数学 选修 1-2 1.1 回归分析的基本思想及其初步应用 (教师用书独具) ●三维目标 1.知识与技能 通过典型案例的探究, 了解回归分析的基本思想,会对两个...


1.1回归分析的基本思想及其初步应用

1.1回归分析的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例的探究,进一步了解回归分析...


回归分析1.1练习题

回归分析1.1练习题_高二数学_数学_高中教育_教育专区。回归分析的基本思想及其初步应用训练卷 一、选择题: 1.相关系数度量 () A.两个变量之间线性相关关系的...


1.1.1_回归分析的基本思想及其初步应用教案

高中数学新课标选修 1-2 课时计划 授课时间: 2012 年月日(星期 )第节 总第 课时 第一课时 1.1 回归分析的基本思想及其初步应用(一) 教学要求:通过典型案例...


1.1回归分析的基本思想及其初步应用 教学设计 教案

1.1回归分析的基本思想及其初步应用 教学设计 教案。教学准备 1. 教学目标 1、能根据散点分布特点,建立不同的回归模型;了解有些非线性模型通过转化可以 转化为...


实验1-1 一元线性回归分析

图 1-1 Eviews 窗口 1.1 实验1-1 一元线性回归分析 Eviews 的窗口 Eviews 的窗口分为几个部分:标题栏、主菜单栏、命令窗口、状态行和工作区(如图 1-1 ...


第三章 多元线性回归分析1

第三章 多元线性回归分析1_数学_自然科学_专业资料。计量经济学课件 1 第三章主要内容: ? 多元线性回归模型 ? 多元线性回归模型的参数估计 ? 多元线性回归模型...

网站首页 | 网站地图
All rights reserved Powered by 简单学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com