tceic.com
学霸学习网 这下你爽了
相关标签
当前位置:首页 >> 高三数学 >>

2016届高考数学(文)二轮复习考点例题课件:专题六+第2讲+统计与统计案例(人教版) (1)


第 2讲

统计与统计案例

高考定位

以选择题、填空题考查的内容有样本数字特征的

计算、频率分布直方图、条形图、茎叶图、线性回归方程、 独立性检验等;以解答题考查线性回归直线方程、独立性检

验以及概率与统计的交汇,都属于中、低档题,也是必得分
的题目.

真题感悟 1.(2015· 湖北卷)我国古代数学名著《数书九章》有“米谷粒分” 题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽 样取米一把,数得 254 粒内夹谷 28 粒,则这批米内夹谷约为

( B )
A.134石 B.169石 C.338石 D.1 365石

28 解析 因为样品中米谷的比为254,所以这批米内夹谷约为 28 1 534× ≈169(石). 254

2.(2015· 全国Ⅱ卷)根据下面给出的2004年至2013年我国二氧化硫 年排放量(单位:万吨)柱形图,以下结论中不正确的是( )

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关

解析

从2006年起,将每年的二氧化硫排放量与前一年作差比

较,得到2008年二氧化硫排放量与2007年排放量的差最大,A 选项正确;2007年二氧化硫排放量较 2006年降低了很多,B选 项正确;虽然 2011 年二氧化硫排放量较 2010 年多一些,但自 2006年以来,整体呈递减趋势,即C选项正确;自2006年以来 我国二氧化硫年排放量与年份负相关,D选项错误.故选D.

答案 D

3.(2015· 湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:

分钟)的茎叶图如图所示

若将运动员按成绩由好到差编为 1~35号,再用系统抽样方 法从中抽取 7 人,则其中成绩在区间 [139 , 151] 上的运动员 人数是( )

A.3

B.4

C.5

D.6

解析

由题意知,将1~35号分成7组,每组5名运动员,成

绩落在区间 [139 , 151] 的运动员共有 4 组,故由系统抽样法

知,共抽取4名.选B.
答案 B

4.(2015· 广东卷)已知样本数据 x1,x2,?,xn 的均值x=5,则样本 数据 2x1+1,2x2+1,?,2xn+1 的均值为________.
解析 由 x1, x2 , ?, xn 的均值x =5, 得 2x1+1, 2x2+1, ?,
- -



2xn+1 的均值为 2x +1=2×5+1=11.

答案

11

考点整合
N 1.系统抽样:如果遇到 n 不是整数的情况,可以先从总体中随机剔除 几个个体,使得总体中剩余的个体能被样本容量整除. 2.在频率分布直方图中,小长方形的面积=频率,各小长方形的面积 的总和等于 1. 3.方差与标准差
- - - 1 2 2 s =n[(x1-x ) +(x2-x ) +?+(xn-x )2],

2

s=

- - - 1 2 2 2 [ ( x 1- x ) +(x2- x ) +?+(xn- x ) ]. n

- - ? ? y ? a b 4.回归直线 = x+ 经过样本点的中心点(x ,y ),若 x 取某一个值

? x+ a ? =b ? 中,可求出 y 的估计值. 代入回归直线方程 y

5.独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频 数列联表是:

y1
x1 x2 总计 a c a+ c

y2
b d b+ d

总计 a+ b
c+d n

2 n ( ad - bc ) 则 K2= (其中 n=a+b+c+d (a+b)(c+d)(a+c)(b+d)

为样本容量).

热点一 统计中的热点
[微题型1] 对抽样方法的考查
【例 1-1】 (2015· 北京卷)某校老年、 中年和青年教师的人数见下 表,采用分层抽样的方法调查教师的身体状况,在抽取的样本 中,青年教师有 320 人,则该样本的老年教师人数为( )

类别 老年教师 中年教师 青年教师 合计
A.90 B.100 C.180 D.300

人数 900 1 800 1 600 4 300

解析

320 1 由题意抽样比为 1 600 = 5 , ∴ 该样本的老年教师人数为

1 900× =180(人). 5

答案 C
探究提高 系统抽样又称 “等距”抽样,被抽到的各个号码间

隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总 体容量中的比例.

[微题型2] 对茎叶图与数字特征的考查
【例 1-2】 (2015· 山东卷)为比较甲、乙两地某月 14 时的气温状

况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单 位:℃)制成如图所示的茎叶图.考虑以下结论:

①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温;

③甲地该月14时的气温的标准差小于乙地该月14时的气温的标 准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标

准差.
其中根据茎叶图能得到的统计结论的编号为( A.①③
解析

)

B.①④

C.②③

D.②④

甲地 5 天的气温为:26,28,29,31,31,


26+28+29+31+31 其平均数为x 甲= =29; 5

1 方差为 s甲= [(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31 5
2

-29)2]=3.6; 标准差为 s 甲= 3.6. 乙地 5 天的气温为:28,29,30,31,32, 28+29+30+31+32 其平均数为x 乙= =30; 5


1 方差为 s乙=5[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32
2

-30)2]=2; 标准差为 s 乙= 2.∴x 甲<x 乙,s 甲>s 乙.
- -

答案 B

探究提高

(1) 平均数的大小与一组数据里每个数据均有关系,

任何一个数据的变动都会引起平均数的变动,而中位数和众
数都不具备此性质. (2) 众数考查各数据出现的频率,当一组数据中有不少数据多 次出现时,众数往往更能反映问题. (3) 中位数仅与数据的排列位置有关,中位数可能出现在所给

数据中,也可能不在所给数据中,当一组数据中的个别数据
变动较大时,可用中位数描述其集中趋势.

[微题型3] 对频率分布直方图的考查
【例 1-3】 (2015· 广东卷)某城市 100 户居民的月平均用电量(单

位:度),以[160,180),[180,200),[200,220),[220,240), [240,260),[260,280),[280,300]分组的频率分布直方图如图.

(1)求直方图中x的值; (2)求月平均用电量的众数和中位数;

(3) 在月平均用电量为 [220,240) ,[240,260) ,[260,280) ,[280,
300]的四组用户中,用分层抽样的方法抽取 11户居民,则月平均 用电量在[220,240)的用户中应抽取多少户?
解 (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20 =1 得:x=0.007 5,所以直方图中 x 的值是 0.007 5. 220+240 (2)月平均用电量的众数是 =230. 2 因为(0.002+0.009 5+0.011)×20=0.45<0.5, 所以月平均用电量的中 位数在[220,240)内,设中位数为 a,由(0.002+0.009 5+0.011)×20 +0.012 5×(a-220)=0.5 得:a=224,所以月平均用电量的中位数 是 224.

(3)月平均用电量为[220,240]的用户有 0.012 5×20×100=25(户), 月平均用电量为[240,260)的用户有 0.007 5×20×100=15(户),月 平均用电量为[260,280)的用户有 0.005×20×100=10(户),月平 均用电量为[280,300]的用户有 0.002 5×20×100=5(户),抽取比 11 1 例= = ,所以月平均用电量在[220,240)的用户中 25+15+10+5 5 1 应抽取 25× =5(户). 5

探究提高 利用频率分布直方图估计样本的数字特征
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的 面积相等,由此可以估计中位数的值. (2)平均数:平均数为频率分布直方图的 “重心”,等于图中每个 小矩形的面积乘以小矩形底边中点的横坐标之和. (3)众数:在频率分布直方图中,众数是最高的矩形底边的中点的 横坐标.

【训练 1】 (1)(2015· 江苏卷)已知一组数据 4,6,5,8,7,6, 那么这组数据的平均数为________. (2)为了保证驾乘人员的安全,某市要对该市出租车司机的年龄 进行调查,现从中随机抽出 100 名司机,已知抽到的司机年龄 都在[20,45)岁,根据调查结果得出司机的年龄情况残缺的频 率分布直方图如图,利用这个残缺的频率分布直方图估计该市 出租车司机年龄的中位数大约是( )

A.31.6岁
C.33.6岁
解析

B.32.6岁
D.36.6岁

(1) 由 平 均 数 公 式 可 得 这 组 数 据 的 平 均 数 为

4+6+5+8+7+6 =6. 6

(2) 法一

设第二组矩形的高为 h , ( 则 0.01 + h + 0.07 + 0.06 +

0.02)×5=1,解得 h=0.04.中位数是位于样本数据中间的数,设中 位数为 a,则直线 x=a 平分各个矩形的面积之和,即 0.01×5+ 0.25 0.04×5+0.07×(a-30)=0.5,得 a=30+0.07≈33.6. 法二 设中位数为 a,则直线 x=a 平分各个矩形的面积之和,即

10 0.02×5+0.06×5+0.07×(35-a)=0.5,解得 a=35- 7 ≈33.6.

答案 (1)6 (2)C

热点二 统计案例

[微题型1] 对线性回归直线方程的考查
【例 2-1】 (2015· 全国Ⅰ卷)某公司为确定下一年度投入某种产品 的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t) 和年利润 z(单位:千元)的影响,对近 8 年的年宣传费 xi 和年销售 量 yi(i=1,2,?,8)数据作了初步处理,得到下面的散点图及一 些统计量的值.

18 表中 wi= xi,w= ?wi. 8i=1


(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销 售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说 明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结 果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归直线v =α+βu的斜率和截距的最小二乘估计分别为

解 (1)由散点图可以判断, y=c+d x适宜作为年销售量 y 关于年宣 传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程,由于

? =100.6+68w,因此 y 关于 x 所以 y 关于 w 的线性回归方程为 y ? =100.6+68 x. 的回归方程为 y

(3)①由(2)知,当 x=49 时,年销售量 y 的预报值
? =100.6+68 49=576.6, y
? =576.6×0.2-49=66.32. 年利润 z 的预报值 z

②根据(2)的结果知,年利润 z 的预报值
? =0.2(100.6+68 x)-x=-x+13.6 x+20.12. z

13.6 ? 取得最大值. 所以当 x= 2 =6.8,即 x=46.24 时, z 故年宣传费为 46.24 千元时,年利润的预报值最大.

探究提高

线性回归方程求解的关键在于准确求出样本点中

心.回归系数的求解可直接把相应数据代入公式中求解,回归 常数的确定则需要利用中心点在回归直线上建立方程求解.

[微题型2] 对独立性检验的考查
【例 2-2】 某新闻媒体为了了解观众对央视《开门大吉》节目的 喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名, 得到如下的列联表:


喜爱 不喜爱 40 20


20 30

总计
60 50

总计

60

50

110

试根据样本估计总体的思想,估计约有________的把握认为“喜
爱该节目与否和性别有关”. 参考附表:

P(K2≥k0) k0

0.050 3.841

0.010 6.635

0.001 10.828

2 n ( ad - bc ) ( 参考公式: K2 = ,其中 n (a+b)(c+d)(a+c)(b+d)

=a+b+c+d)
解析 假设喜爱该节目和性别无关,分析列联表中数据,可得 K2

的观测值 110×(40×30-20×20)2 k= ≈7.822>6.635, 所以有 99%的把握 60×50×60×50 认为“喜爱《开门大吉》节目与否和性别有关”.

答案 99%

探究提高 不可混淆 K2 与 k 的关系: K2 与 k 的关系并不是 k= K2, k 是 K2 的观测值,或者说 K2 是一个随机变量,它在 a,b,c,d 取不同的值时,K2 可能不同,而 k 是取定一组数 a,b,c,d 后 的一个确定的值.

【训练 2】

(2015· 咸阳模拟)某产品在某零售摊位上的零售价 x(元)与

每天的销售量 y(个)统计如下表:

x y

16 50

17 34

18 41

19 31

? x+ a ? =-4,据此模型预计 ? =b ? 中的 b 据上表可得回归直线方程 y

零售价定为 15 元时,销售量为(

)

A.48

B.49

C.50

D.51

解析

? =- 4x 样本点的中心为 (17.5,39) ,代入回归直线方程 y

? =-4x+109,把 x=15 代入得 y ? =49. ? 中,得 a ? =109,所以 y +a

答案 49

热点三 概率与统计的交汇
【例 3】 (2015· 全国Ⅱ卷)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据用户对产品的满意 度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地 区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图

B地区用户满意度评分的频数分布表
满意度 评分分 组 频数 [50,60) [60,70) [70,80) [80,90) [90,100] 2 8 14 10 6

(1) 在图中作出 B 地区用户满意度评分的频率分布直方图,并
通过直方图比较两地区满意度评分的平均值及分散程度 (不要 求计算出具体值,给出结论即可);

B地区用户满意度评分的频率分布直方图

(2)根据用户满意度评分,将用户的满意度分为三个等级:

满意度评分
满意度等级

低于70分
不满意

70分到89分
满意

不低于90分
非常满意

估计哪个地区用户的满意度等级为不满意的概率大?说明理由.

解 (1)如图所示.

通过两地区用户满意度评分的频率分布直方图可以看出,B地区用 户满意度评分的平均值高于A地区用户满意度评分的平均值;B地

区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示 事件:“B地区用户的满意度等级为不满意”.

由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)
的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大. 探究提高 概率试题的核心是概率计算,统计试题的核心是样

本数据的分布;概率与统计综合解答题的主要依托点是统计图 表,正确认识和使用这些图表是解决问题的关键,因此在复习 该部分时,要在这些图表上下工夫,把这些统计图表的含义弄

清楚,在此基础上掌握好样本的数字特征的计算方法和各类概
率的计算方法.解答此类试题时要做到:(1)读取图表的数据要准 确;(2)在计算古典概型概率时,基本事件的总数要计算准确.

【训练 3】 (2015· 安徽卷)某企业为了解下属某部门对本企业职工的服 务情况,随机访问 50 名职工,根据这 50 名职工对该部门的评分, 绘制频率分布直方图(如图所示), 其中样本数据分组区间为[40, 50), [50,60),?,[80,90),[90,100].

(1)求频率分布直方图中a的值;

(2)估计该企业的职工对该部门评分不低于80的概率;
(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的 评分都在[40,50)的概率. 解 (1) 因为 (0.004 + a + 0.018 + 0.022×2 + 0.028)×10 = 1 ,所

以a=0.006.

(2) 由所给频率分布直方图知, 50 名受访职工评分不低于 80 的
频率为(0.022+0.018)×10=0.4. 所以该企业职工对该部门评分不低于80的概率的估计值为0.4.

(3)受访职工中评分在[50,60)的有:50×0.006×10=3(人),记 为 A1,A2,A3; 受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为 B1,B2, 从这 5 名受访职工中随机抽取 2 人,所有可能的结果共有 10 种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2, A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.又 因为所抽取 2 人的评分都在[40, 50)的结果有 1 种, 即{B1, B2}, 1 故所求的概率为 P= . 10

1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个 体数量不多的情况,当总体中的个体数量明显较多时要使用系

统抽样,当总体中的个体具有明显的层次时使用分层抽样 . 系
统抽样最重要的特征是“等距”,分层抽样最重要的是各层的 “比例”. 2.用样本估计总体 (1)在频率分布直方图中,各小长方形的面积表示相应的频率, 各小长方形的面积的和为1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是

描述一组数据集中趋势的量,平均数是最重要的量.

(3)当总体的个体数较少时,可直接分析总体取值的频率分布规 律而得到总体分布;当总体容量很大时,通常从总体中抽取一 个样本,分析它的频率分布,以此估计总体分布. 1n ①总体平均值的估计,计算样本平均值 x =n ?xi.②总体方差(标 i =1


1 准差)的估计:方差= n ? ( x ? x ) ,标准差= 方差,方差(标准差)
n 2 i ?1 i

较小者较稳定.
- - ? ? y ? a b 3.线性回归方程 = x+ 过样本点中心(x ,y ),这为求线性回归

方程带来很多方便. 4.独立性检验 (1)作出 2×2 列联表.(2)计算随机变量 K2(χ2)的值. (3)查临界值,检验作答.


推荐相关:

...数学文二轮专题突破:专题六 第2讲统计与统计案例

2014届高考数学文二轮专题突破:专题六 第2讲统计与统计案例_高考_高中教育_教育...考点一 抽样方法 例1 (2012· 山东)采用系统抽样方法从 960 人中抽取 32 人...


2016年高考数学二轮复习 第一部分专题六 第3讲 统计与...

2016年高考数学二轮复习 第一部分专题六 第3讲 统计与统计案例专题强化精练提能 理_数学_高中教育_教育专区。第一部分专题六 概率、统计、复数、算法、推理与证明...


高考数学二轮复习:(理数)专题六第1讲统计与统计案例

高考数学二轮复习:(理数)专题六第1讲统计与统计案例_高三数学_数学_高中教育_...答案:(1)3 (2)6 000 三、解答题 10.(2014· 全国Ⅱ卷)某地区 2007 ...


...复习第一部分重点保分专题检测(六)统计与统计案例文...

通用版2017届高三数学二轮复习第一部分重点保分专题检测()统计与统计案例文_...填空题 13. (2016·海口调研)如图是某班 8 位学生诗词比赛得分的茎叶图, ...


2017高考(新课标)数学(文)二轮专题复习(检测):专题六第...

2017高考(新课标)数学(文)二轮专题复习(检测):专题六第1讲统计与统计案例 Word版含解析_数学_高中教育_教育专区。数学学习资料 专题六 第1讲一、选择题 概率与...


...专题7 概率与统计 第2讲 统计与统计案例 文

【导与练】(新课标)2016高考数学二轮复习 专题7 概率与统计 第2讲 统计与统计案例 文_数学_高中教育_教育专区。第2讲 统计与统计案例 抽样方法 1.(2013 新...


高考数学二轮复习:(理数)专题六第

高考数学二轮复习:(理数)专题六第_高考_高中教育_教育专区。高考数学二轮复习:(理数)专题六第 专题六 概率与统计 第 1 讲 统计与统计案例 一、选择题 1.某...


【金版学案】2016高考数学理科二轮复习习题:专题7第三...

【金版学案】2016高考数学理科二轮复习习题:专题7第三讲 统计统计案例_数学_高中教育_教育专区。专题七 概率与统计、推理与证明、算法初步、框图、 复数第三讲 ...


【高优指导】2016届高考数学二轮复习 专题能力训练17 ...

【高优指导】2016届高考数学二轮复习 专题能力训练17 统计与统计案例 文_数学_高中教育_教育专区。专题能力训练 17 统计与统计案例 一、选择题 1.某学院 A,B,...


2016高考数学二轮复习 专题7 概率与统计、推理与证明、...

2016高考数学二轮复习 专题7 概率与统计、推理与证明、算法初步、框图、复数 第二讲 统计统计案例 文_数学_高中教育_教育专区。第二讲 统计统计案例 从近...

网站首页 | 网站地图
All rights reserved Powered by 学霸学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com