tceic.com
学霸学习网 这下你爽了
赞助商链接
当前位置:首页 >> 数学 >>

【导与练】(新课标)2016高考数学二轮复习 专题七 概率与统计 第2讲 统计与统计案例课件 文


第2讲 统计与统计案例

考向分析 核心整合 热点精讲 阅卷评析

考向分析
考情纵览
年份 考点 统计与 统计 案例 概率与 统计的 综合 19 3 2011 2012 Ⅰ 2013 Ⅱ Ⅰ 2014 Ⅱ 19(1) (3) Ⅰ 2015 Ⅱ

18

18

19

3

18

19

19(2)

18

真题导航
1.(2015新课标全国卷Ⅱ,文3)根据下面给出的2004年至2013年我国二氧 化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( D )

(A)逐年比较,2008年减少二氧化硫排放量的效果最显著 (B)2007年我国治理二氧化硫排放显现成效 (C)2006年以来我国二氧化硫年排放量呈减少趋势 (D)2006年以来我国二氧化硫年排放量与年份正相关

解析:结合图形可知,2007年与2008年二氧化硫的排放量差距明显,显然 2008年减少二氧化硫排放量的效果最显著;2006年二氧化硫的排放量最 高,从2006年开始二氧化硫的排放量开始整体呈下降趋势.显然A,B,C正 确,不正确的是D,不是正相关.

2.(2014新课标全国卷Ⅱ,文19)某市为了考核甲、乙两部门的工作情况, 随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明 市民的评价越高),绘制茎叶图如下:

(1)分别估计该市的市民对甲、乙两部门评分的中位数;

解:(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的 中位数的估计值是 75. 50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样 本中位数为 是 67.
66 ? 68 =67,所以该市的市民对乙部门评分的中位数的估计值 2

(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.

解:(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分
5 8 别为 =0.1, =0.16,故该市的市民对甲、 乙两部门的评分高于 90 的概 50 50

率的估计值分别为 0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分 的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对 乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一

致,对乙部门的评价较低、评价差异较大.

3.(2013新课标全国卷Ⅱ,文19)经销商经销某种农产品,在一个销售季
度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元. 根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所

示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,
100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下 一个销售季度内经销该农产品的利润. (1)将T表示为X的函数;

解:(1)当 X∈[100,130)时, T=500X-300(130-X)=800X-39000. 当 X∈[130,150]时,T=500×130=65000.

?800 X ? 39000,100 ? X ? 130, 所以 T= ? ?65000,130 ? X ? 150.

(2)根据直方图估计利润T不少于57000元的概率. 解:(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图

知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不
少于57000元的概率的估计值为0.7.

4.(2015新课标全国卷Ⅱ,文18)某公司为了解用户对其产品的满意度,
从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分, 得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分

的频数分布表.
A地区用户满意度评分的频率分布直方图

B地区用户满意度评分的频数分布表
满意度评 分分组 [50,60) [60,70) [70,80) [80,90) [90,100]

频数

2

8

14

10

6

(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地 区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);

解:(1)如图所示.

通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满 意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满 意度评分比较集中,而 A 地区用户满意度评分比较分散.

(2)根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 满意度等级 低于70分 不满意 70分到89分 满意 不低于90分 非常满意

估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 解:(2)A地区用户的满意度等级为不满意的概率大.

记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B
地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为 (0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大.

备考指要
1.怎么考

(1)对统计图(频率分布直方图与茎叶图)的考查是高考热点,这部分内容可
以单独命题,也可以与概率、抽样方法.统计案例等知识综合命题,主要考 查对统计图表的理解,以及从图形中获取信息的能力,利用样本估计总体的 实践能力. (2)对线性回归方程的考查主要以实际问题为背景,作散点图,求线性回归 方程并由回归方程估计预测,有时需将非线性回归模型转换为线性回归模 型解决.

这部分题目难度不大,属中低档题,选择题、解答题均有.
2.怎么办 对于统计与统计案例不少高考试题源于课本,有的考查就是教材中习题的 变形,备考复习中要回归课本重视基础知识的掌握和识图用图,分析解决问 题能力的训练.

核心整合
1.抽样方法

抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三种抽样方
法各自适用于不同特点的总体,但无论哪种抽样方法,每一个个体被抽到 的概率都是相等的,都等于样本容量和总体容量的比值,并且都是不放回 的抽样.

2.频率分布直方图 ①小长方形的高=
频率 频率 ,小长方形的面积=组距× =频率; 组距 组距

②各小长方形的面积之和等于 1 ;

3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字 样本数据 特征 众数 中位 数 平均 数 出现次数最多的数据 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间 两个数据的平均数) 样本数据的算术平均数

频率分布直方图 取 最高的小长方形底边中点 的横坐标 把 频率分布直方图划分左右 两个面积相等的分界线 与横轴交点的横坐标 每个小矩形的面积乘以小矩 形底边中点的横坐标之和

(2)方差:s2=

1 [(x1- x )2+(x2- x )2+?+(xn- x )2]. n

标准差:s=

1 [( x1 ? x) 2 ? ( x2 ? x) 2 ? ? ? ( xn ? x) 2 ] . n

4.对 n 个样本数据(x1,y1),(x2,y2),?,(xn,yn), ? x+ a ? =b ? ,其中 其线性回归方程为 y

?= b

?x y
i ?1 n i

n

i

? nx y ? nx
2

?x
i ?1

? x , x , y 分别是{xi}、{yi}的平均数. ? = y -b ,a

2 i

5.独立性检验 利用独立性检验来考查两个分量是否有关系,并且能较为准确地给出这 种判断的可靠程度,具体的做法是根据观测数据计算,由公式
n(ad ? bc ) 2 K= 所给出的检验随机变量 K2 的观测值 k0,并且 ( a ? b)( a ? c)(b ? d )(c ? d )
2

k0 的值越大,说明“X 与 Y 有关系”成立的可能性就越大.

温馨提示

(1)随机抽样的方法有三种,其中简单随机抽样适用于总体中

的个体数量不多的情况,当总体中的个体数量较多且差别不大时要使用系

统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重
要的特征是“等距”,分层抽样最重要的特征是总体中个体有明显的“层 次”,且各层抽样比相等.
? x+ a ? =b ? 经过样本点的中心( x , y ). (2)线性回归方程 y

热点精讲
热点一

用样本估计总体

【例 1】 (1)(2015 山东卷)为比较甲、乙两地某月 14 时的气温状况, 随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如 图所示的茎叶图.考虑以下结论:

①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温; ②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; ③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差; ④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) (A)①③ (B)①④ (C)②③ (D)②④

(1)解析:由题中茎叶图, 知 x甲 = s 甲= =
26 ? 28 ? 29 ? 31 ? 31 =29, 5

1 [(26 ? 29 2 ) ? (28 ? 29) 2 ? (29 ? 29) 2 ? (31 ? 29) 2 ? (31 ? 29) 2 ] 5

3 10 ; 5
28 ? 29 ? 30 ? 31 ? 32 =30, 5

x乙 =

s 乙=

1 [(28 ? 30) 2 ? (29 ? 30) 2 ? (30 ? 30) 2 ? (31 ? 30) 2 ? (32 ? 30) 2 ] = 2 . 5

所以 x甲 < x乙 ,s 甲>s 乙,故选 B.

(2)(2014北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时 间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号 1 2 3 分组 [0,2) [2,4) [4,6) 频数 6 8 17

4
5 6 7

[6,8)
[8,10) [10,12) [12,14)

22
25 12 6

8
9 合计

[14,16)
[16,18)

2
2 100

①从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12
小时的概率; ②求频率分布直方图中的a,b的值; ③假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中 的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)

(2)解:①根据频数分布表,100 名学生中课外阅读时间不少于 12 小时的 学生共有 6+2+2=10 名,所以样本中的学生课外阅读时间少于 12 小时的 频率是 110 =0.9. 100

从该校随机选取一名学生,估计其课外阅读时间少于 12 小时的概率为 0.9.

②课外阅读时间落在组[4,6)的有 17 人,频率为 0.17, 所以 a=
频率 0.17 = =0.085. 组距 2

课外阅读时间落在组[8,10)的有 25 人,频率为 0.25, 所以 b=
频率 0.25 = =0.125. 组距 2

③样本中的 100 名学生课外阅读时间的平均数在第 4 组.

方法技巧

用样本估计总体的两种方法

①用样本的频率分布(频率分布表、频率分布直方图、茎叶图等)估计 总体的频率分布. ②用样本的数字特征(众数、中位数、平均数、方差、标准差)估计总 体的数字特征.

举一反三1-1:(1)(2015河南模拟)PM2.5是指大气中直径小于或等于2.5 微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8 点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶 图,则甲、乙两地浓度的方差较小的是( )

(A)甲

(B)乙

(C)甲、乙相等 (D)无法确定 解析: (1)从茎叶图上可观察到:甲监测点 的样本数据比乙监测点的样本数据更加集 中,因此甲地浓度的方差较小.故选A.

(2)(2015辽宁模拟)某大学对1000名学生的自主招生水平测试成绩进行 统计,得到样本频率分布直方图(如图),则这1000名学生在该次自主招 生水平测试中成绩不低于70分的学生数是( (A)300 (B)400 (C)500 (D)600 解析: (2)依题意得,题中的1000名学生在 该次自主招生水平测试中成绩不低于70分 )

的学生数是1000×(0.035+0.015+0.010)
×10=600,选D.

热点二

回归分析及应用

【例 2】 一只红铃虫的产卵数 y 与温度 x 有关,现收集了 7 组观测数据 列于表: 温度 x/℃ 产卵数 y/个 程如下:
? =e0.272x-3.843;② y ? =0.367x2-202.543. ①y

21 7

23 11

25 21

27 24

29 66

32 115

35 325

为建立 y 与 x 之间的回归方程,我们采用了两种回归模型,得到回归方

试比较上述两种拟合模型,阐述其数据拟合的基本思想和方法.

解:根据收集的数据,作散点图,如图.

从图中可以看出,样本点并没有分布在某个带状区域内,因此两个变量不 呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间 的关系,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲 线 y=c1 C2x 的附近,其中 c1,c2 为特定的参数,我们可以通过对数变换把指 数关系变为线性关系,令 z=ln y,则变换后样本点分布在直线 z=bx+a (a=ln c1,b=ln c2)的附近,这样可以建立 y 与 x 的回归方程了,变换的样 本点分布在一条直线的附近,因此可以用线性回归方程来拟合.

由表中的数据可得到变换的样本数据表,如表: x z 21 1.946 23 2.398 25 3.045 27 3.178 29 4.190 32 4.745 35 5.784

? =0.272x-3.843. 可以求得线性回归直线方程为 z
? =e0.272x-3.843,另一方 因此红铃虫的产卵数对温度的非线性回归方程为 y

面,可以认为图中的样本点集中在某二次曲线 y=c3x +c4 的附近,其中 c3,c4 为特定参数,因此可以对温度变量进行变换,即令 t=x ,然后建立 y 与 t 之间的线性回归方程,从而得到 y 与 x 之间的非线性回归方程. 下表是红铃虫的产卵数和对应的温度的平方的线性回归模型拟合表, 作出相应的散点图,如图
2

2

t y

441 7

529 11

625 21

729 24

841 66

1024 115

1225 325

从图中可以看出,y 与 t 的散点图并不分布在一条直线的周围,因此不宜 用线性回归方程来拟合它,即不宜用二次函数 y=c3x2+c4 来拟合 x 与 y 之
? =e 间的关系,因此利用 y
0.272x-3.843

来拟合效果较好.

方法技巧

解决回归分析问题时应注意

(1)若由散点图观察到两变量之间不是线性关系而是指数(或对数等)关 系可以对变量处理转化为线性相关,再代入公式计算.

(2)若两变量呈线性相关,但数据较大可先对数据处理再代入计算,以简
化运算.

举一反三 2 1:某地最近十年粮食需求量逐年上升,如表是部分统计 数据: 2013 2015 276 286 ? x+ a ? =b ?; (1)利用所给数据求年需求量与年份之间的回归直线方程 y 年份 需求量(万吨) 2007 236 2009 246 2011 257

解:(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面 求回归直线方程,为此对数据预处理如下: 年份-2011 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 对预处理后的数据,容易算得 x =0, y =3.2.
? = ( ?4) ? ( ?21) ? ( ?2) ? ( ?11) ? 2 ? 19 ? 4 ? 29 ? 5 ? 0 ? 3.2 = 260 =6.5, b ( ?4) 2 ? ( ?2) 2 ? 2 2 ? 4 2 ? 5 ? 0 2 40

? x =3.2. ? = y -b a

由上述计算结果,知所求回归直线方程为 ? (x-2011)+ a ? -257= b ? =6.5(x-2011)+3.2, y
? =6.5(x-2011)+260.2. 即y

(2)利用(1)中所求出的直线方程预测该地2017年的粮食需求量. 解:(2)由回归直线方程,可预测2017年的粮食需求量为6.5×(2017-

2011)+260.2=6.5×6+260.2=299.2(万吨).

热点三

统计、统计案例与概率的综合

【例 3】 (2015 江西九江二模)春节期间,某高二学生随交警对某高速公路某 路段上行驶的七座以下小型汽车进行监控抽查,抽查方式按进入该路段的先 后每间隔 20 辆就抽取一辆的方法进行,共抽取了 40 辆,将它们的车速(km/h) 分成 6 段区间:(70,80],(80,90],(90,100],(100,110],(110,120], (120,130],得到如图的频率分布直方图.已知该段高速公路的规定时速为 100 km/h,超过规定时速将被罚款,规定如下:超过规定时速 10%以内(含),不 罚款;超过规定时速 10%以上未超过 20%的,处以 50 元罚款;超过规定时速 20% 以上未超过 50%的,处以 200 元罚款.

(1)问该学生监控抽查采取的是什么
抽样方法?中位数落在哪段区间内?

解:(1)监控抽查采取的是系统抽样方法 频率分布直方图中 a=0.1-(0.005+0.01×3+0.025)=0.04, 所以 6 段区间的辆数依次是 4,10,16,4,4,2 辆, 故中位数落在(90,100]内.

(2)试估计这40辆小型汽车的平均车速; (3)若从该学生抽查的受到罚款的车辆中随机抽取2辆车的罚款作为该学 生的学业赞助费,求该学生所得学业赞助费超过200元的概率.

解:(2)这 40 辆小型汽车的平均车速约为
4 ? 75 ? 10 ? 85 ? 16 ? 95 ? 4 ? 105 ? 4 ? 115 ? 2 ? 125 =95 (km/h). 40

(3)受到罚款的车辆共 6 辆,其中罚款 50 元的有 4 辆车分别记为 a,b,c,d; 罚款 200 元的有 2 辆车分别记为 x,y.从这 6 辆车中随机抽取 2 辆共有 15 种不同取法,罚款总金额超过 200 元的有 ax,bx,cx,dx,ay,by,cy,dy,xy 9 种取法. 故该学生所得学业赞助费超过 200 元的概率为 P=
9 3 = , 15 5

【例 4】 (2015 东北三校第二次联考)微信是现代生活进行信息交流的一种工 具,据统计,某公司 200 名员工中 90%的人使用微信,其中每天使用微信时间在 一小时以内的有 60 人,其余每天使用微信在一小时以上.若将员工年龄分成青 年(年龄小于 40 岁)和中年(年龄不小于 40 岁)两个阶段,使用微信的人中 75% 是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,经常使 用微信的员工中
2 是青年人. 3

(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出 2×2 列 联表;

2×2列联表 青年人 中年人 合计

经常使用微信 不经常使用微信 合计

解:(1)由已知可得,该公司员工中使用微信的有 200×0.9=180 人,其中 青年人有 180×75%=135 人. 经常使用微信的有 180-60=120 人, 其中青年人:120×
2 =80 人,所以可得 2×2 列联表: 3

经常使用微信 不经常使用微信 合计

青年人 80 55 135

中年人 40 5 45

合计 120 60 180

(2)由列联表中所得数据,是否有99.9%的把握认为“经常使用微信与年 龄有关”?

解:(2)将列联表中数据代入公式可得
180 ? (80 ? 5 ? 55 ? 40) 2 K 的观测值 k= ≈13.333, 120 ? 60 ? 135 ? 45
2

由于 13.333>10.828,所以有 99.9%的把握认为“经常使用微信与年龄 有关”.

(3)采用分层抽样的方法从“经常使用微信”的人中抽取6人,从这6人中 任选2人,求事件A“选出的2人均是青年人”的概率.

解:(3)从“经常使用微信”的人中抽取 6 人,青年人有

80 ×6=4 人, 120

中年人有 2 人,设 4 名青年人编号分别为 1,2,3,4,2 名中年人编号分别 为 5,6, 则“从这 6 人中任选 2 人”的基本事件为(1,2),(1,3),(1,4),(1,5), (1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6), (5,6)共 15 个,其中事件 A“选出的 2 人均是青年人”的基本事件为 (1,2),(1,3),(1,4),(2,3),(2,4),(3,4)共 6 个,故 P(A)=
2 . 5

方法技巧

以实际问题为背景,以统计图表为载体考查抽样方法、数字特

征、概率、独立性检验等知识是高考常考点,处理的关键是仔细阅读题目, 准确获取信息,成功地将应用问题转化为统计概率问题求解.

举一反三 4-1:某城市随机抽取一年(365 天)内 100 天的空气质量指数 AQI 的监测数据,结果统计如下: AQI 空气 质量 天数 [0,50] 优 4 (50, 100] 良 13 (100, 150] 轻微 污染 18 (150, 200] 轻度 污染 30 (200, 250] 中度 污染 9 (250, 300] 中重度 污染 11 >300 重度 污染 15

(1)若某企业每天由空气污染造成的经济损失 S(单位:元)与空气质量指
?0,0 ? w ? 100, ? 数 AQI(记为 w)的关系式为 S= ? 4 w ? 400,100 ? w ? 300, ? 2000, w ? 300, ?

试估计在本年内随机抽取一天,该天经济损失 S 大于 200 元且不超过 600 元的概率;

解:(1)设“在本年内随机抽取一天,该天经济损失 S 大于 200 元且不超过 600 元”为事件 A, 由 200<S≤600, 得 150<w≤250,频数为 39,P(A)=
39 . 100

(2)若本次抽取的样本数据有 30 天是在供暖季,其中有 8 天为重度污染.完成 下面 2×2 列联表,并判断能否有 95%的把握认为该市本年空气重度污染与供 暖有关? 非重度污染 供暖季 非供暖季 合计 附: P(K2 ≥k0) k0
2

重度污染

合计

100

0.25 1.323

0.15 2.072

0.10 2.706

0.05 3.841

0.025 5.024

0.010 6.635

0.005 7.879

0.001 10.828

n(ad ? bc) 2 K= (a ? b)(c ? d )(a ? c)(b ? d )

解:(2)根据题中数据得到如下列联表: 供暖季 非供暖季 合计
2

非重度污染 22 63 85

重度污染 8 7 15

合计 30 70 100

100 ? (8 ? 63 ? 7 ? 22) 2 K 的观测值 k= ≈4.575>3.841, 85 ? 15 ? 30 ? 70

所以有 95%的把握认为该市本年空气重度污染与供暖有关.

备选例题

【例 1】 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先 拟定的价格进行试销,得到如下数据: 单价 x(元) 销量 y(件) 8 90 8.2 84 8.4 83 8.6 80 8.8 75 9 68

? =-20, a ? x; ? =a ? x+ a ? ,其中 b ? = y -b (1)求回归直线方程 y 1 解:(1)由于 x = (8+8.2+8.4+8.6+8.8+9)=8.5. 6

y=

1 (90+84+83+80+75+68)=80, 6

? =-20, 又b
? x =80+20×8.5=250, ? = y -b 所以 a
? =-20x+250. 从而回归直线方程为 y

(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的 成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利 润=销售收入-成本) 解:(2)设工厂获得的利润为L元,依题意得

L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1000 =-20(x-8.25)2+361.25. 当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.

【例2】 已知某山区小学有100名四年级学生,将全体四年级学生随机按 00~99编号,并且按编号顺序平均分成10组.现要从中抽取10名学生,各 组内抽取的编号按依次增加10进行系统抽样.

(1)若抽出的一个号码为22,则此号码所在的组数是多少?据此写出所有
被抽出学生的号码; 解:(1)由题意,得抽出号码为22的组数为3. 因为2+10×(3-1)=22, 所以第1组抽出的号码应该为02, 抽出的10名学生的号码依次分别为

02,12,22,32,42,52,62,72,82,92.

(2)分别统计这10名学生的数学成绩,获得成绩数据的茎叶图如图所示,
求该样本的方差;

解:(2)这 10 名学生的平均成绩为
x=

1 ×(81+70+73+76+78+79+62+65+67+59)=71, 10 1 ×(102+12+22+52+72+82+92+62+42+122)=52. 10

故样本方差为 s2=

(3)在(2)的条件下,从这10名学生中随机抽取两名成绩不低于73分的学
生,求被抽取到的两名学生的成绩之和不小于154分的概率.

解:(3)从这 10 名学生中随机抽取两名成绩不低于 73 分的学生,共有 如下 10 种不同的取法: (73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81), (78,79),(78,81),(79,81). 其中成绩之和不小于 154 分的有如下 7 种:(73,81),(76,78),(76,79), (76,81),(78,79),(78,81),(79,81).故被抽取到的两名学生的成绩之 和不小于 154 分的概率为 P=
7 . 10

阅卷评析
非线性回归分析及应用 (2015 新课标全国卷Ⅰ,文 19)某公司为确定下一年度投入某种产品的宣 传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单 位:千元)的影响.对近 8 年的年宣传费 xi 和年销售量 yi(i=1,2,?,8)数据 作了初步处理,得到下面的散点图及一些统计量的值.

x

y

w

? ( xi ? x)
i ?1

8

2

? (wi ? w)
i ?1

8

2

? ( xi ? x)
i ?1

8

2

2 ( w ? w ) ? i i ?1

8

(yi- y ) 46. 6 56 3 6. 8 289.8 1.6 1469

(yi- y ) 108.8

1 8 表中 wi= xi , w = ? wi . 8 i ?1

(1)根据散点图判断,y=a+bx 与 y=c+d x 哪一个适宜作为年销售量 y 关于 年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由)

评分细则: (1)由散点图可以判断,y=c+d x 适宜作为年销售量 y 关于年宣传费 x 的 回归方程类型.…………………………………………………………2 分

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

评分细则: (2)令 w= x ,……………………………………………………3 分 先建立 y 关于 w 的线性回归方程.

?= 由于 d

? (w ? w)( y
i ?1 i 8 i ?1 i

8

i

? y)

? (w ? w)

=
2

108.8 =68. 1.6

? w =563-68×6.8=100.6,………………………………6 分 ?= y-d c ? =100.6+68w, 所以 y 关于 w 的线性回归方程为 y

? =100.6+68 x .…………………7 分 因此 y 关于 x 的回归方程为 y

(3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回 答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归直线 v=α +β u 的斜

?= 率和截距的最小二乘估计分别为 ?

? (u
i ?1 n

n

i

? u )(vi ? v)
i

? (u
i ?1

? u. ? =v-? ,?

? u )2

评分细则: (3)①由(2)知,当 x=49 时,年销售量 y 的预报值
? =100.6+68 49 =576.6,年利润 z 的预报值 y

? =576.6×0.2-49=66.32.…………………………………………9 分 z

②根据(2)的结果知,年利润 z 的预报值
? =0.2(100.6+68 x )-x=-x+13.6 x +20.12.…………………10 分 z

13.6 ? 取得最大值. 所以当 x = =6.8,即 x=46.24 时, z 2

故年宣传费为 46.24 千元时,年利润的预报值最大.………………12 分

【答题启示】 1.本题中 y 与 x 之间不具有线性回归关系,因而是非线性回归分析问题,通 过变量变换,即 w= x ,并通过散点图对 y 与 w 作相关性检验,判定出 y 与 w 之间具有较强的线性相关关系,求出 y 对 w 的回归直线方程,最后再回代 w= x ,得到 y 对 x 的回归方程.
? ,由于 a ? 的计算量大,计算 ? ,b ? ,b 2.求回归方程,关键在于正确求出系数 a

时应仔细谨慎,分层进行,避免因计算而产生错误.注意线性回归方程中一 ? ,常数项为 a ? ,这与一次函数的习惯表示不同. 次项系数为 b
3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散 点图大致呈线性时,求出的线性回归方程才有实际意义. 4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.



推荐相关:
网站首页 | 网站地图
All rights reserved Powered by 学霸学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com