tceic.com
简单学习网 让学习变简单
当前位置:首页 >> 数学 >>

数学选修1-2 第一章 统计案例 导学案


第一章 统计案例 1.1 回归分析的基本思想及其初步应用(1)
一、设置情境,引入课题 引入:对于一组具有线性相关关系的数据 ( x1 , y1 ),( x2 , y2 ),( x3 , y3 ), 率的最小二乘法估计公式分别为:

,( xn , yn ). 其回归直线方程的截距和斜

a ? y ? bx

>b?

? ( x ? x)( y ? y)
i ?1 i i

n

? ( x ? x)
i ?1 i

n

2

x?

1 n ? xi n i ?1

y?

1 n ? yi n i ?1

( x ,y 称为样本点的中心。 )

回归方程: y ? bx ? a 二、例题应用,剖析回归基本思想与方法 例1、 从某大学中随机选取 8 名女大学生,其身高和体重的数据如图所示: 编号 身高/cm 体重/kg 1 165 48 2 165 57 3 157 50 4 170 54 5
[来源:学#科#网 Z#X#X#K]

6 165 61

7 155 43

8 170 59

175 64

(1) 画出以身高为自变量 x,体重为因变量 y 的散点图 (2) 求根据女大学生的身高预报体重的回归方程 (3) 求预报一名身高为 172cm 的女大学生的体重 解: (1)由于问题中要求根据身高预报体重,因此选取身高为自变量 x,体重为因变量 y 作散点图 (2)

b ? 0.849, a ? ?85.712

?回归方程: y ? 0.849 x ? 85.712.

(3)对于身高 172cm 的女大学生,由回归方程可以预报体重为:

y ? 0.849 ?172 ? 85.712 ? 60.316(kg)
练习 1 观察两相关变量得如下数据 x y —1 —9 —2 —7 —3 —5 —4 —3 —5 —1 5 1 3 5 4 3 2 7 1 9

求两个变量的回归方程.

1

答:

x ? 0, y ? 0, ? xi 2 ? 110, ? xi yi ? 110,
i ?1 i ?1

10

10

?b ?

? x y ? 10 x y
i ?1 10 i i

10

?x
i ?1

2

i

? 10 x

2

?

110 ? 10 ? 0 ? 1, a ? y ? bx ? 0 ? 0 b ? 0. 110 ? 10 ? 0

所以所求回归直线方程为 y ? x 例 2.研究某灌溉倒水的流速 y 与水深 x 之间的关系,测得一组数据如下: 水深 x(m) 流速 y(m/s) 1.40 1.70 1.50 1.79 1.60 1.88 1.70 1.95 1.80 2.03 1.90 2.10 2.00 2.16 2.10 2.21

(1) 求 y 与 x 的回归直线方程; (2) 预测水深为 1.95m 时水的流速是 多少? 分析: (1)y 与 x 的回归直线方程为 y ? 0.733x ? 0.6948 (2)当水深为 1.95m 时,可以预测水的流速约为 2.12m/s 练习 2 1.对两个变量 y 和 x 进行回归分析,得到一组样本数据: ( x1 , y1 ),( x2 , y2 ),( x3 , y3 ), 不正确的是( )

,( xn , yn ). 则下列说法

A.由样本数据得到的回归方程 y ? bx ? a 必过样本中心 ( x, y ) B.残差平方和越小的模型,拟合的效果越好 C.用相关指数 R 来刻画回归效果, R 越小,说明模型的拟合效果越好 D.若变量 y 与 x 之间的相关系数 r ? ?0.9362 ,则变量 y 与 x 之间具有线性相关关系 2.已知某地每单位面积菜地年平均使用氮肥量 xkg 与每单位面积蔬菜年平均产量 yt 之间的关系有如下数 据: 年份 x(kg) y(t) 1985 70 5.1 1986 74 6.0 1987 80 6.8 1988 78 7.8 1989 85 9.0 1990 92 10.2 1991 90 10.0 1992 95 12.0
2 2

年份 x(kg) y(t)

1993 92 11.5

1994 108 11.0

1995 115 11.8

1996 123 12.2

1997 130 12.5

1998 138 12.8

1999 145 13.0

若 x 与 y 之间线性相关,求蔬菜年平均产量 y 与使用氮肥量 x 之间的回归直线方程,并估计每单位面积蔬
2

菜的年平均产量.(已知 x ? 101, y ? 10.11,

? xi 2 ? 161, ? xi yi ? 16076.8 )
i ?1 i ?1

15

15

解:设所求的回归直线方程为 y ? bx ? a ,则

?b ?

? x y ? 15x y
i ?1 15 i i

15

?x
i ?1

2

i

? 15 x

2

?

16076.8 ? 15 ?101?10.11 ? 0.0937, a ? y ? bx ? 10.11 ? 0.0937 ? 101 ? 0.6463. 161125 ? 15 ?1012

所以,回归直线方程为: y ? 0.0937 x ? 0.6463 当 x=150kg 时,每单位面积蔬菜的年平均产量 y ? 0.0937 ?150 ? 0.6463 ? 14.701(kg)

[来源:学科网 ZXXK]

3.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准 煤)的几组对照数据: x y 3 2.5 4 3 5 4 6 4.5

(1) 请画出上表数据的散点图; (2) 请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 y ? bx ? a ; (3) 已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤,试根据(2)求出的线性回归方程,预测生 产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值: 3 ? 2.5 ? 4 ? 3 ? 5 ? 4 ? 6 ? 4.5 ? 66.5 ) 解: (1)由题设所给数据,可得散点图如下图

(2)由对照数据,计算得:

3

? xi 2 ? 86, x ?
i ?1
4

4

4 3? 4 ?5? 6 2.5 ? 3 ? 4 ? 4.5 ? 4.5, y ? ? 3.5, 已知 ? xi yi ? 66.5 4 4 i ?1

所以,由最小二乘法确定的回归方程的系数为:

b?

? x y ? 4x y
i ?1 4 i i

?x
i ?1

2

i

? 4x

2

?

66.5 ? 4 ? 4.5 ? 3.5 ? 0.7, a ? y ? bx ? 3.5 ? 0.7 ? 4.5 ? 0.35. 86 ? 4 ? 4.52

因此,所求的线性回归方程为 y ? 0.7 x ? 0.35 (4) 由(2)的回归方程及技改前生产 100 吨甲产品的生产能耗,得降低的生产能耗为 。 90 ? (0.7 ?100 ? 0.35) ? 19.65 (吨标准煤)

[来源:学&科&网 Z&X&X&K]

1.1 回归分析的基本思想及其初步应用(2)
【教学过程】 一、设置情境,引入课题 上节例题中,身高 172cm 女大学生,体重一定是 60kg 吗?如果不是,其原因是什么? 二、引导探究,发现问题,解决问题 1 y ? 0.849x ? 85.712 对 于 b ? 0 . 8 4 9 是斜率的估计值, 说明身高 x 每增加 1 个单位,体重 就 ,表明体重与身高具有 2 如何描述线性相关关系的强弱? 的线性相关关系。

r?

? ( x ? x)( y ? y)
i ?1 i i

n

? ( xi ? x)2 ? ( yi ? y)2
i ?1 i ?1

n

n

(1)r>0 表明两个变量正相关; (2)r<0 表明两个变量负相关; (3)r 的绝对值越接近 1,表明相关性越强,r 的绝对值越接近 0,表明相关性越弱。 (4)当 r 的绝对值大于 0.75 认为两个变量具有很强的相关性关系。 3 身高 172cm 的女大学生显然不一定体重是 60.316kg,但一般可以认为她的体 重接近于 60.316kg. ①样本点与回归直线的 ②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表

4

示 y ? bx ? a ? ? e 是 y 与 y ? bx ? a 的误差,e 为随机变量,e 称为随机误差。 ③E(e)=0,D(e)= ? >0.④D(e)越小,预报真实值 y 的精度越高。
2

⑤随机误差是引起预报值 y 与真实值 y 之间的误差之一。 ⑥ a, b 为截距和斜率的估计值,与 a,b 的真实值之间存在误差,这种误差也引起 y 与真实值 y 之间的误差 之一。 4 思考 产生随机误差项 e 的原因是什么? 5 探究在线性回归模型中,e 是用 y 预报真实值 y 的误差,它是一个不可观测的量,那么应该怎样研究随 机误差?如何衡量预报的精度? ① D(e) ? ? 来衡量随机误差的大小。② ei ? yi ? yi
2

③ ei ? yi ? yi ? yi ? bxi ? a

④? ?

2

1 n 2 1 e ? Q(a, b)(n ? 2) ? n ? 2 i ?1 n?2
2

⑤ Q(a, b) 称为残差平方和, ? 越小,预报精度越高。 6 思考 当样本容量为 1 或 2 时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为 0 吗? 7 残差分析

①判断原始数据中是否存在可疑数据;②残差图 ③相关指数 R ? 1 ?
2

?(y ? y ) ? ( y ? y)
i ?1 i i ?1 n i i

n

2

2

④R 越大,残差平方和越小,拟合效果越好;R 越接近 1,表明回归的效果越好。 8 建立回归模型的基本步骤: ①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量。 ②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系; ③由经验确定回归方程的类型; ④按一定规则估计回归方程中的参数; ⑤得出结果后分析残差图是否异常。 三、典型例题 例 1 下表是某年美国旧轿车价格的调查资料,今以 x 表示轿车的使用年数,y 表示响应的年均价格,求 y 关于 x 的回归方程 使用年数 x 年均价格 y (美元) 1 2651 2 194 3 3 1494 4 1087 5 765 6 538 7 484 8 290 9 226 10 204

2

2

分析:由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但不在一条直 线附近,但据此认为 y 与 x 之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线

5

性关系的变量间的关系。 解:作出散点图如下图 y 年均价格 3000 2500
[来源:学*科*网 Z*X*X*K]

2000 1500 1000 500 O 5 10 15 x 使用年限

可以发现,各点并不是基本处于一条直线附近,因此,y 与 x 之间应是非线性相关关系.与已学函数图 像比较,用 y ? ebx?a 来刻画题中模型更为合理,令 z ? ln y ,则 z ? bx ? a , 题中数据变成如下表所示: x y 1 7.883 2 7.572 3 7.309 4 6.991 5 6.640 6 6.288 7 6.182 8 5.670 9 5.421 10 5.318

在散点图中可以看出变换的样本点分布在一条直线附近,因此可以用线性回归模型方程拟合,由表中数据 可得 r ? ?0.996, r ? 0.75 ,认为 x 与 z 之间具有线性相关关系,由表中数据的 b ? ?0.298, a ? 8.165, 所 以 z ? ?0.298x ? 8.165 ,最后回代 z ? ln y , 即 y ? e?0.298 x?8.165 练习: 1 两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 R2 如下,其中拟合效果最好 的模型是( )

A C

模型 1 的 R ? 0.98
2

B 模型 2 的 R ? 0.80
2

模型 3 的 R ? 0.50
2

D 模型 4 的 R ? 0.25
2

答案 A 例 2 随着我国经济的快速发展,城乡居民的审核水平不断提高,为研究某市家庭平均收入与月平均生活支 出的关系,该市统计部门随机调查 10 个家庭,得数据如下: 1 2 3 4 5 6 7 8 9 10 家庭编号 x 收入(千元) y 支出千元 0.8 0.7 1.1 1.0 1.3 1.2 1.5 1.0 1.5 1.3 1.8 1.5 2.0 1.3 2.2 1.7 2.4 2.0 2.8 2.5

(1) 判断家庭平均收入与月平均生活支出是否相关?

6

(2) 若二者线性相关,求回归直线方程。 思路点拨:利用散点图观察收入 x 和支出 y 是否线性相关,若呈现线性相关关系,可利用公式来求出回归 系数,然后获得回归直线方程。 解:作散点图

y 月支/千元 3 2.5 2 1.5 1 0.5

O

0.5

1

1.5

2

2.5

3

x 平均收入/千元

观察发现各个数据对应的点都在一条直线附近,所以二者呈现线性相关关系。 (2) x ?

1 (0.8 ? 1.1 ? 1.3 ? 1.5 ? 1.5 ? 1.8 ? 2.0 ? 2.2 ? 2.4 ? 2.8) ? 1.74, 10

y?

1 (0.7 ? 1.0 ? 1.2 ? 1.0 ? 1.3 ? 1.5 ? 1.3 ? 1.7 ? 2.0 ? 2.5) ? 1.42, 10

?b ?

? x y ? nx y
i ?1 n i i

n

?x
i ?1

2

i

? nx

2

? 0.8136, a ? 1.42 ? 1.74 ? 0.0043.

所以回归方程 y ? 0.8136x ? 0.0043 练习 2 1 山东鲁洁棉业公式的可按人员在 7 块并排形状大小相同的试验田上对某棉花新品种进行施化肥量 x 对产 量 y 影响的试验,得到如下表所示的一组数据(单位:kg) 施化肥量 x 产量 y 15 330 20 345 25 365 30 405 35 445 40 450 45 455

(1) 画出散点图; (2) 判断是否具有相关关系 思路点拨 (1)散点图如图所示

7

y 棉花产量

500 450 400 350 300

O

10

20

30

40

50

施化肥量 x

(2) 由散点图可知, 各组数据对应点大致都在一条直线附近, 所以施化肥量 x 与产量 y 具有线性相关关系.

六.课后练习与提高: 1 在对两个变量 x、y 进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释;②收集数据 ( xi , yi ), i ? 1, 2,

, n ;③求线性回归方程;④求相关系数;

⑤根据所搜集的数据绘制散点图。如果根据可靠性要求能够作出变量 x、y 具有线性相关结论,则在下列操 作顺序中正确的是( ) A ①②⑤③④ B ③②④⑤① C ②④③①⑤ D ②⑤④③① 2 三点(3,10) , (7,20),(11,24)的线性回归方程为( ) A y ? 1.75x ? 5.75 B y ? 1.75x ? 5.75 C y ? ?1.75x ? 5.75 D y ? ?1.75x ? 5.75 )

3 对有线性相关关系的两个变量建立的回归直线方程 y ? a ? bx 中,回归系数 b ( A.可以大于 0 B 大于 0 C 能等于 0 D 只能小于 0

4 废品率 x 0 0 和每吨生铁成本 y(元)之间的回归直线方程为 y ? 256 ? 2x ,表明(



A 废品率每增加 1 0 0 ,生铁成本增加 258 元; B 废品率每增加 1 0 0 ,生铁成本增加 2 元; C 废品率每增加 1 0 0 ,生铁成本每吨增加 2 元;D 废品率不变,生铁成本增加 256 元; 答案 1 D 2 B 3 A 4 C

8

1.2.1 独立性检验的基本思想及其初步应用
教学目标 (1)通过对典型案例的探究,了解独立性检验(只要求 2 ? 2 列联表)的基本思想、方法及初步应用; (2)经历由实际问题建立数学模型的过程,体会其基本方法。 教学过程 一、问题情境 5 月 31 日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞 性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样 得出的呢?我们看一下问题: 某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了 9965 个人,其中吸烟者 2148 人,不吸烟者 7817 人。调查结果是:吸烟的 2148 人中有 49 人患肺癌,2099 人未患肺癌;不吸烟的 7817 人中有 42 人患肺癌,7775 人未患肺癌。 问题:根据这些数据能否断定“患肺癌与吸烟有关”? 二、学生活动 (1)引导学生将上述数据用下表(一)来表示: (即列联表) 不患肺癌 不吸烟 吸烟 总计 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965

(2)估计吸烟者与不吸烟者患肺癌的可能性差异: 42 49 在不吸烟者中,有 ≈0.54%的人患肺癌;在吸烟的人中,有 ≈2.28%的人患肺癌。 7817 2148 问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 三、建构数学 1、从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表,柱形图和条形 图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。但这种结论能否推广到总体呢?要回答这个问 题,就必须借助于统计理论来分析。 2、独立性检验: (1)假设 H 0 :患肺癌与吸烟没有关系。即: “吸烟与患肺癌相互独立”。用 A 表示不吸烟,B 表示不 患肺癌,则有 P(AB)=P(A)P(B) 若将表中“观测值”用字母代替,则得下表(二) : 患肺癌 吸烟 不吸烟 合计 未患肺癌 合计

a c

b
d b?d

a?b c?d a?b?c?d
(强、弱)?

a?c

学生活动 :让学生利用上述字母来表示对应概率,并化简整理。 思考交流: | ad ? bc | 越小,说明患肺癌与吸烟之间的关系越

9

(2)构造随机变量 K 2 ?

n(ad ? bc)2 (其中 n ? a ? b ? c ? d ) (a ? b)(c ? d )(a ? c)(b ? d )
2 2

由此若 H 0 成立,即患肺癌与吸烟没有关系,则 K 的值应该很小。把表中的数据代入计算得 K 的观测值 k 约为 56.632,统计学中有明确的结论,在 H 0 成立的情况下,随机事件 P(K ≥6.635)≈0.01。由此,我们
2

有 99%的把握认为 H 0 不成立,即有 99%的把握认为“患肺癌与吸烟有关系”。 上面这种利用随机变量 K 来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分 类变量的独立性检验。 说明:估计吸烟者与不吸烟者患肺癌的可能性差异是用频率估计概率,利用 K 进行独立性检验,可以 对推断的正确性的概率作出估计,观测数据 a, b, c, d 取值越大,效果越好。在实际应用中,当 a, b, c, d 均 不小于 5,近似的效果才可接受。 (2)这里所说的“患肺癌与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患肺癌的可能性(风 险)更大”,而不是说“抽烟的人一定患肺癌”。 (3)在假设 H 0 成立的情况下,统计量 K 应该很小,如果由观测数据计算得到 K 的观测值很大,则在一
2 2 2 2

定程度上说明假设不合理(即统计量 K 越大,“两个分类变量有关系”的可能性就越大)。 3、对于两个分类变量 A 和 B,推断“A 和 B 有关系”的方法和步骤为: ①利用三维柱形图和二维条形图; ②独立性检验的一般步骤: 第一步,提出假设 H 0 :两个分类变量 A 和 B 没有关系; 第二步,根据 2×2 列联表和公式计算 K 统计量; 第三步,查对课本中临界值表,作出判断。 附:临界值表(部分) : P(k2>k) k 0.50 0.455 0.40 0.708 0.25 1..323 0.15 2.072 0.10 2.706 0.05 3.84 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10..83
2

2

4、独立性检验与反证法: 反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立; 独立性检验原理:在一个已知 假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不 成立。 四、数学运用 例 1 在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶;而另外 772 名不是因为患心脏 病而住院的男性病人中有 175 名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?

10

练习 1: (1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?女教 授人数,男教授人数,女副教授人数,男副教授人数。 (2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业 非统计专业 统计专业 性别 13 10 男 7 20 女 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K2 ?

50 ? (13 ? 20 ? 10 ? 7)2 ? 4.844 ,∵K2 ? 3.841 , 23 ? 27 ? 20 ? 30
. (答案:5%)

所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为

例 2. 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取 300 名学 生,得到如下列联表: 喜欢数学课程 男 女 总 计 37 35 72 不喜欢数学课程 85 143 228 总 计 122 178 300

由表中数据计算得到 K 2 的观察值 k ? 4.514 . 在多大程度上可以认为高中生的性别与是否数学 课程之间 有关系?为什么? (学生自练,教师总结) 强调:①使得 P( K 2 ? 3.841) ? 0.05 成 立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这 个前提不成立,上面的概率估计式就不一定正确; ②结论有 95%的把握认为“性别与喜欢数学课程之间有关系”的含义; ③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算 K 2 的值解决实际问题,而没有必要画 相应的图形,但是图形的直观性也不可忽视. 例 3、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调 查,调查结果如表所示。根据所选择的 193 个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计 58 64 122 无效 40 31 71 合计 98 95 193

分析:在口服的病人中,有

58 64 ? 59% 的人有效;在注射的病人中,有 ? 67% 的人有效。从直观上来 98 95

看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下 面用独立性检验的方法加以说明。

11

说明:如果观测值 K ≤2.706,那么就认为没有充分的证据显示“A 与 B 有关系”,但也不能作出结论 “ H 0 成立”,即 A 与 B 没有关系 小结:独立性检验的方法、原理、步骤 练习 2: 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大 把握认为“高中生学习状况与生理健康有关”? 不健康 不优秀 优 秀 总 计 41 37 78 健 626 296 922 康 总计 667 333 1000

2

3.2.2 独立性检验的基本思想及其初步应用 学习目标 2 通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用 K 进行独立性检验. 学习重点:独立性检验的应用 学习过程 一.前置测评 ( 1 )某大学在研究性别与职称 ( 分正教授、副教授 ) 之间是否有关系,你认为应该收集哪些数 据? 。 (2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 专业 非统计专业 统计专业 性别 男 13 10 女 7 20 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K ?
2

50 ? (13 ? 20 ? 10 ? 7)2 ? 4.844 ,∵K2≥3.841, 23 ? 27 ? 20 ? 30


所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 附:临界值表(部分) :

P (K2≥k0)

0.10

0.05

0.025

0.010

12

k0

2.706

3.841

5.024

6.635

二.典型例题 例 1 为考察高中生的性别与是否喜欢数学课程之间的关系, 在某城市的某校高中生中随机抽取 300 名学生, 得到如下列联表: 喜欢数学课程 男 女 总 计
2

不喜欢数学课程 85 143 228

总 计 122 178 300

37 35 72

由表中数据计算得到 K 的观察值 k≈4.514. 在多大程度上可以认为高中生的性别与是否数学课程之间有 关系?

例 2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调 查,调查结果如表所示。根据所选择的 193 个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计 58 64 122 无效 40 31 71 合计 98 95 193

三、巩固练习: 1. 为 了研究色盲与性别的关系,调查了 1000 人,调查结果如下表所示: 男 正常 色盲 442 38 女 514 6

根据上述数据,试问色盲与性别是否是相互独立的? 解析:由已知条件可得下表 男 正常 色盲 合计 442 38 480
2

女 514 6 520

合计 956 44 100 0

依据公式得 K 2 ?

1000 ? ? 442 ? 6 ? 38 ? 514 ? ? 27.139 。 956 ? 44 ? 480 ? 520
13

由于 27.139 ? 10.828 ,∴有 99% 的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与 性别不是相互独立的。 评注:根据假设检验的思想,比较 计算出的 K 与临界值的大小,选择接受假设还是拒绝假设。 2. 考察黄烟经过培养液处理与否跟发生青花 病的关系,调查了 4 57 株黄烟,得到下表中的数据,请根 据数据作统计分析。 培 养液处理 青花病 无青花病 合计 25 80 105
2
2

未处理 210 142 352

合计 235 222 457

457 ? ? 25 ?142 ? 80 ? 210 ? 解析:根据公式得 K ? ? 41.61 235 ? 222 ?105 ? 352
2

由于 41.61 ? 10.828 ,说明黄烟经过培养液处理与否跟发生青 花病是有关系的。 3.在研究某种新药对猪白痢的防治效果问题时,得到以下数据: 存活数 新措施 对照 合计
[来源:Z*xx*k.Com]

死亡数 18 36 54
[来源:学科网 ZXXK]

合计 150 150 300

132 114 246

试问新措施对防治猪白痢是否有效? 4.在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况如下表所示,据此资料你是否 认为在 恶劣气候飞行中男性比女性更容易晕机? 晕机 男性 女性 合计 答案: 1 .提示: K ? 7.317 ? 6.635 ,有 99% 的把 握认为新措施对防治猪白痢是有效的
2

不晕机 32 25 57

合计 55 34 89

23 9 32

2.提示: K ? 2.149 ? 2.706 ,我们不能认为 在恶劣气候飞行中男性比女性更容易晕机
2

14

高考题目练习: 1.(2011?广东文数)工人月工资 y(元)与劳动生产率 x(千元)变化的回归方程为 =50+80x,下列判断 正确的是 ② ①劳动生产率为 1 千元时,工资为 130 元;②劳动生产率提高 1 千元,则工资提高 80 元;③劳动生产率 提高 1 千元,则工资提高 130 元;④当月工资为 210 元时,劳动生产率为 2 千元. 1、解答:解:劳动生产率提高 1 千元,则工资提高 80 元,②正确,③不正确. ①④不满足回归方程的意义. 故答案为:②. 2. (2013 广州一模)某工厂的某种型号的机器的使用年限 x 和所支出的维修费用 y (万元)有下表的统计资 料:

x
y

2 2.2

3 3.8

4 5.5

5 6.5

6 7.0

? ? 1.23x ? a ? ,据此模型估计,该型号机器使用年限为 10 年的维修费用约 根据上表可得回归方程 y
万元(结果保留两位小数) . 2、 12.38 3. (2010 广州二模文数) 某学校课题组为了研究学生的数学成绩与物理成绩之间的关系, 随机抽取高二年级 20 名学生某次考试成绩(满分 100 分)如下表所示: 序号 数学成绩 物理成绩 1 95 90 2 75 63 3 80 72 4 94 87 5 92 91 6 65 71 7 67 58 8 84 82 9 98 93 10 71 81 11 67 77 12 93 82 13 64 48 14 78 85 15 77 69 16 90 91 17 57 61 18 83 84 19 72 78 20 83 86

若单科成绩 85 分以上(含 85 分) ,则该科成绩为优秀. (1)根据上表完成下面的 2×2 列联表(单位:人): 数学成绩优秀 物理成绩优秀 物理成绩不优秀 合 计 20 数学成绩不优秀 合 计

(2)根据题(1)中表格的数据计算,有多大的把握,认为学生的数学成绩与物理成绩之间有 关系? (3)若从这 20 个人中抽出 1 人来了解有关情况,求抽到的学生数学成绩与物理成绩至少有一门 不优秀的概率. 参考数据: ① 假设有两个分类变量 X 和 Y ,它们的值域分别为 ?x1 , x2 ? 和 ? y1 , y2 ? ,其样本频数列联表(称

15

为 2 ? 2 列联表)为:

y1 x1 x2
合计
2

y2
b
d b?d

合计

a c

a?b c?d a?b?c?d

a?c

2 则随机变量 K ?

n ? ad ? bc ? ,其中 n ? a ? b ? c ? d 为样本容量; ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2

②独立检验随机变量 K 的临界值参考表:

P ? K 2 ? k0 ?

0.50 0.455

0.40 0.708

0.25 1.323

0.15 2.072

0.10 2.706

0.05 3.841

0.025 5.024

0.010 6.635

0.005 7.879

0.001 10.828

k0

3.(1)解:2×2 列联表为(单位:人): 数学成绩优秀 物理成绩优秀 物理成绩不优秀 合 计 ?4 分 (2)解:提出假设 H 0 :学生数学成绩与物理成绩之间没有关系. 根据列联表可以求得 K 2 ? 5 1 6 数学成绩不优秀 2 12 14 合 7 13 20 计

20 ? (5 ? 12 ? 1 ? 2) 2 ? 8.802 ? 7.879 . 6 ? 14 ? 7 ? 13

?6 分

当 H 0 成立时, P( K 2 ? 7.879) ? 0.005 . 所以我们有 99.5% 的把握认为:学生的数学成绩与物理成绩之间有关系. (3)解:由(1)可知数学成绩与物理成绩都优秀的学生的人数为 5 人, 则数学成绩与物理成绩至少有一门不优秀的学生人数为 15 人. ?10 分 ?8 分

故从 20 名学生中抽出 1 名,抽到的学生数学成绩与物理成绩至少有一门不优秀的概率为

15 3 ? .?12 分 20 4

4. (2007 广东文数)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x (吨)与相应的 生产能耗 y (吨标准煤)的几组对照数据.

x
y
(1)请画出上表数据的散点图;

3 2.5

4 3

5 4

6 4.5

16

? ?a ?; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 y ? bx
(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试根据(2)求出的线性回归方程,预测 生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值: 3 ? 2.5 ? 4 ? 3 ? 5 ? 4 ? 6 ? 4.5 ? 66.5 ) 4 解: (1) 散点图略 (2)

? X Y ? 66.5
i ?1 i i

4

?X
i ?1

4

2 i

? 3 2 ?4 2 ?5 2 ?6 2 ?8 6 X ? 4 . 5

Y ?3. 5

? ? 66.5 ? 4 ? 4.5 ? 3.5 ? 66.5 ? 63 ? 0.7 ; b 86 ? 4 ? 4.52 86 ? 81
所求的回归方程为 (3)

? ? Y ? ?b X ? a 3 . 5 ? 0 . 7? 4 . ? 5

0.35

y?0.7 x? 0. 35 y ?1 0 0 ? 0.35

x ? 100 ,

预测生产 100 吨甲产品的生产能耗比技改前降低 90 ? 70.35 ? 19.65 (吨)

17


推荐相关:

高二数学选修1-2第一章《统计案例》学案

高二数学选修 1-2 第一章统计案例学案 1.1.1 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归...


高中数学 第一章统计案例学案 新人教A版选修1-2

高中数学 第一章统计案例学案 新人教A版选修1-2_数学_高中教育_教育专区。§...来判断两变量之间的性关系的, 学习评价 ※ 自我评价 你完成本节导学案的情况...


高中数学 第一章统计案例学案 新人教A版选修1-2

高中数学 第一章统计案例学案 新人教A版选修1-2_数学_高中教育_教育专区。§...(导学案第 1 页例 1) (4) 求学生 A,B,C,D,E 的物理成绩的实际成绩和...


高二+数学文科+选修1-2学案

高二数学选修 1-2 第一章统计案例学案 1.1.1 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归...


高二+数学文科+选修1-2学案成册

高二数学选修 1-2 第一章统计案例学案 1.1.1 回归分析的基本思想及其初步应用课标转述:①通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归...


高中数学选修1-2学生学案

张家口市第一中学 2015-2016 学年度高二年级文科班数学学案 选修 1-2 班级: 姓名: 学案一、第一章统计案例 1.1 回归分析的基本思想及其初步应用 线性回归方程 ...


高中数学选修1-2第一章统计案例测试题带详细解答

高中数学选修1-2第一章统计案例测试题带详细解答_数学_高中教育_教育专区。高中数学选修1-2第一章统计案例测试题带详细解答选修1-2 第一章统计案例测试一、选...


高中数学选修1-2第一章统计案例测试题带详细解答

高中数学选修1-2第一章统计案例测试题带详细解答_高三数学_数学_高中教育_教育专区。选修 1-2 第一章统计案例测试一、选择题 1.已知 x 与 y 之间的一组...


数学:第一章《统计案例》素材(新人教A版选修1-2)

数学:第一章统计案例》素材(新人教A版选修1-2)_理学_高等教育_教育专区。第一章 1.1 【要点梳理】 1、统计学提出假设 H 0 ,采用统计量 ? 2 ? 统计...


数学:第一章《统计案例》素材(新人教A版选修1-2)

数学:第一章统计案例》素材(新人教A版选修1-2)_数学_小学教育_教育专区。高考资源网(ks5u.com) 您身边的高考专家 第一章 1 .1【要点梳理】 要点梳理】 ...

网站首页 | 网站地图
All rights reserved Powered by 简单学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com