tceic.com
简单学习网 让学习变简单
当前位置:首页 >> 数学 >>

第19讲 用样本估计总体及线性相关关系


普通高中课程标准实验教科书—数学

高三新数学第一轮复习教案(讲座 19)—用样本估计总体及线性 相关关系
一.课标要求:
1.用样本估计总体 ① 通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、 画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点; ② 通过实例理解样本数据标准差的意义和作用,学会计算数据标准

差; ③ 能根据实际问题的需求合理地选取样本, 从样本数据中提取基本的数字特征 (如平 均数、标准差) ,并作出合理的解释; ④ 在解决统计问题的过程中, 进一步体会用样本估计总体的思想, 会用样本的频率分 布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频 率分布和数字特征的随机性; ⑤ 会用随机抽样的基本方法和样本估计总体的思想, 解决一些简单的实际问题; 能通 过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性 思维的差异; ⑥ 形成对数据处理过程进行初步评价的意识。 2.变量的相关性 ① 通过收集现实问题中两个有关联变量的数据作出散点图, 并利用散点图直观认识变 量间的相关关系; ② 经历用不同估算方法描述两个变量线性相关的过程。 知道最小二乘法的思想, 能根 据给出的线性回归方程系数公式建立线性回归方程。

二.命题走向
“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分 布估计总体的分布,并会用样本的特征来估计总体的分布。 预测 2009 年高考对本讲的考察是: 1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题 为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力; 2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。

三.要点精讲
1.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数最多的数据叫做这组数据的众数; 将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中 间两位数据的平均数)叫做这组数据的中位数; (2)平均数与方差 如果这 n 个数据是 x1 , x2 ,......... xn ,那么 x ? ,

1 n ? xi 叫做这 n 个数据平均数; n i ?1

第 1 页 共 10 页

如果这 n 个数据是 x1 , x2 ,......... xn ,那么 S 2 ? ,

1 n ? ( xi ? x) 叫做这 n 个数据方差; n i ?1

同时 s ?

1 n ? ( xi ? x) 叫做这 n 个数据的标准差。 n i ?1

2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。所有数 据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、 茎叶图来表示。 频率分布直方图: 具体做法如下: (1)求极差(即一组数据中最大值与最小值的差) ; (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。 注:频率分布直方图中小正方形的面积=组距×

频率 =频率。 组距

折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。 总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此 光滑曲线为总体密度曲线。 3.线性回归 回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的 两个变量之间的关系叫相关关系或回归关系。 回归直线方程:设 x 与 y 是具有相关关系的两个变量,且相应于 n 个观测值的 n 个 点大致分布在某一条直线的附近,就可以认为 y 对 x 的回归函数的类型为直线型:

? y ? a ? bx 。其中 b ?

? (x
i ?1 n

n

i

? x)( y i ? y )
i

? (x
i ?1

?

?x y
i ?1 n i

n

i

? nx y
, a ? y ? b x 。我们称这个

? x)

2

?x
i ?1

2 i

? nx

2

方程为 y 对 x 的回归直线方程。

四.典例解析
题型 1:数字特征 例 1.为了检查一批手榴弹的杀伤半径,抽取了其中 20 颗做试验,得到这 20 颗手榴 弹的杀伤半径,并列表如下:

第 2 页 共 10 页

(1)在这个问题中,总体、个体、样本和样本容量各是什么? (2)求出这 20 颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的 平均杀伤半径. 解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的 杀伤半径;样本是所抽取的 20 颗手榴弹的杀伤半径;样本容量是 20。 (2)在 20 个数据中,10 出现了 6 次,次数最多,所以众数是 10(米) 。 20 个数据从小到大排列,第 10 个和第 11 个数据是最中间的两个数,分别为 9(米) 和 10(米) ,所以中位数是 样本平均数 x ?

1 (9+10)=9.5(米) 。 2

1 (7 ? 1 ? 8 ? 5 ? 9 ? 4 ? 10 ? 6 ? 11 ? 3 ? 12 ? 1) ? 9.4 (米) 20

所以,估计这批手榴弹的平均杀伤半径约为 9.4 米。 点评:(1)根据总体、个体、样本、样本容量的概念答题.要注意:总体、个体和样 本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的 杀伤半径。 (2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平 均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。 例 2.为估计一次性木质筷子的用量,1999 年从某县共 600 家高、中、低档饭店抽 取 10 家作样本,这些饭店每天消耗的一次性筷子盒数分别为: 0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0 (1)通过对样本的计算,估计该县 1999 年消耗了多少盒一次性筷子(每年按 350 个 营业日计算) ; (2)2001 年又对该县一次性木质筷子的用量以同样的方式作了抽样调查, 调查的结果 是 10 个样本饭店,每个饭店平均每天使用一次性筷子 2.42 盒.求该县 2000 年、2001 年这两年一次性木质筷子用量平均每年增长的百分率(2001 年该县饭店数、全年营业天 数均与 1999 年相同) ; (3)在(2)的条件下,若生产一套学生桌椅需木材 0.07m3,求该县 2001 年使用一次性 筷子的木材可以生产多少套学生桌椅。计算中需用的有关数据为:每盒筷子 100 双,每 双筷子的质量为 5g,所用木材的密度为 0.5×103kg/m3; (4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去 做,简要地用文字表述出来。 解析:(1) x ?

1 (0.6 ? 3.7 ? 2.2 ? 1.5 ? 2.8 ? 1.7 ? 1.2 ? 2.1 ? 3.2 ? 1.0) ? 2.0 10
第 3 页 共 10 页

所以,该县 1999 年消耗一次性筷子为 2×600×350=420000(盒) 。

(2)设平均每年增长的百分率为 X,则 2(1+X)2=2.42, 解得 X1=0.1=10%,X2=-2.1(不合题意,舍去) 。 所以,平均每年增长的百分率为 10%; (3)可以生产学生桌椅套数为

0.005 ? 2.42 ? 100 ? 600 ? 350 ? 7260 (套) 。 0.5 ? 10 3 ? 0.07

(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干 家饭店作样本,统计一次性筷子的用量. 点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解 决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题 的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法 来解.对于第(3)小题,用到了物理公式 m=ρv, 体现了各学科知识之间的联系,让学 生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能 够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要 注意简洁、明了、正确。 题型 2:数字特征的应用 例 3.甲、乙两种冬小麦试验品种连续 5 年的平均单位面积产量如下(单位:t / hm2) 品种 甲 乙 第1年 9.8 9.4 第2年 9.9 10.3 甲 第3年 10.1 10.8 。
1 5(

第4年 10 9.7

第5年 10.2 9.8

其中产量比较稳定的小麦品种是 解析:甲 = x ? = 10.0;
2 s甲 =

1 5(

9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,乙 = x ?

9.4 + 10.3 + 10.8 + 9.7 + 9.8)

1 5(

2 9.82 + ? + 10.22) – 102 = 0.02,s甲 =

1 5(

9.42 + ? + 9.82) – 102 = 0.244 >

0.02 。 点评:方差与平均数在反映样本的特征上一定要区分开。 例 4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 (A)9.4, 0.484 (B)9.4, 0.016 (C)9.5, 0.04 (D)9.5, 0.016 答案:D; 解析: 个数据中去掉一个最高分和一个最低分后, 7 余下的 5 个数为: 9.4, 9.4, 9.6, 9.4, 9.5。 则平均数为: x ? 方差为: s ?
2

9.4 ? 9.4 ? 9.6 ? 9.4 ? 9.5 ? 9.46 ? 9.5 ,即 x ? 9.5 。 5

1 [( 9.4 ? 9.5) 2 ? (9.4 ? 9.5) 2 ? ? ? ? ? (9.5 ? 9.5) 2 ] ? 0.016 5
第 4 页 共 10 页

即 s ? 0.016 ,故选 D。
2

点评:一定要根据实际的题意解决问题,并还原实际情景。 题型 3:频率分布直方图与条形图 例 5.为检测,某种产品的质量,抽取了一个容量为 30 的样本,检测结果为一级品 5 件, 而极品 8 件,三级品 13 件,次品 14 件. (1)列出样本频率分布表; (2)画出表示样本频率分布的条形图; (3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少 解析:(1)样本的频率分布表为
产品 一级晶 二级晶 三级晶 次品 频数 5 8 13 4 频率 0.17 0.27 0.43 0.13

(2)样本频率分布的条形图为:

(3)此种产品为二极品或三极品的概率约为 0.27+0.43=0.7。 点评:条形图中纵坐标一般是频数或频率。 例 6.为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为 17.5 岁-18岁的男生体重(kg) ,得到频率分布直方图如下:

第 5 页 共 10 页

根据上图可得这 100 名学生中体重在〔56.5,64.5〕的学生人数是 (A)20 (B)30 (C)40 (D)50 答案:C; 解析:根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为 2×0.03+2×0.05 +2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为 0.4×100=40。 点评:熟悉频率、频数、组距间的关系式。 例 7.某中学对高三年级进行身高统计,测量随机抽取的 40 名学生的身高,其结果 如下(单位:cm) 分 组 人 数 1 2 5 9 13 6 3 1 40 [140, 145) [145, 150) [150, 155) [155, 160) [160, 165) [165, 170) [170, 175) [175, 180) 合 计

(1)列出频率分布表; (2)画出频率分布直方图; (3)估计数据落在[150,170]范围内的概率。 解析: (1)根据题意可列出频率分布表: 分 值 频 1 2 5 9 13
第 6 页 共 10 页







[140,145] [145,150] [150,155] [155,160] [160,165]

0.025 0.050 0.125 0.225 0.325

[165,170] [170,175] [175,180] 合 计

6 3 1 40

0.15 0.075 0.025 1.00

(2)频率分布直方图如下:

(3)数据落在[150,170]范围内的概率约为 0.825。 题型 4:茎叶图 例 8.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。 1961 年扬基队外垒手马利斯打破了鲁斯的一个赛季打出 60 个全垒打的记录。下面 是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图: 鲁斯 马利斯 0 8 1 3 4 6 5 2 2 3 6 8 5 4 3 3 9 9 7 6 6 1 1 4 9 4 4 5 0 6 1 解析:鲁斯的成绩相对集中,稳定在 46 左右;马利斯成绩相对发散,成绩稳定在 26 左右。 题型 5:线性回归方程 例 9.由施肥量 x 与水稻产量 y 试验数据的关系,画出散点图,并指明相关性。

第 7 页 共 10 页

解析:散点图为:

通过图象可知是正相关。 例 10. 在某种产品表面进行腐蚀线实验, 得到腐蚀深度 y 与腐蚀时间 t 之间对应的一 组数据: 时间 t(s) 深度 y( ? m) 5 6 10 10 15 10 20 13 30 16 40 17 50 19 60 23 70 25 90 29 120 46

(1)画出散点图; (2)试求腐蚀深度 y 对时间 t 的回归直线方程。 略解: (1)散点图略,呈直线形。 (2)经计算可得

t =46.36, y =19.45, ? t i2 =36750, ? yi2 =5442, ? t i y i =13910。
i ?1 i ?1 i ?1

11

11

11

?t y
B=
i ?1 11 i

11

i

? 11? ty
=
2

?t
i ?1

2 i

? 11? t

13910 ? 11 ? 46.36 ? 19.45 ? 0.3. 36750 ? 11 ? 46.36 2

A= y -b t =19.45-03 ? 46.36 ? 5.542。 故所求的回归直线方程为 y =0.3t+5.542。 题型 6:创新题 例 11.把容量为 100 的某个样本数据分为 10 组,并填写频率分布表,若前七组的累 积频率为 0.79,而剩下三组的频数成公比大于 2 的整数等比数列,则剩下三组中频数最
第 8 页 共 10 页

?

高的一组的频数为___________. 答案:16 点评:已知前七组的累积频率为 0.79,而要研究后三组的问题,因此应先求出后三 组的频率之和为 1-0.79=0.21, 进而求出后三组的共有频数, 或者先求前七组共有频数后, 再计算后三组的共有频数。由已知知前七组的累积频数为 0.79×100=79,故后三组共有 的频数为 21,依题意
a1 ? (1 ? q 3 ) =21,a1(1+q+q2)=21.∴a1=1,q=4。∴后三组频数最 1? q

高的一组的频数为 16。 此题剖析只按第二种思路给出了解答, 你能按第一种思路来解吗? 例 12.某班学生在一次数学考试中成绩分布如下表:
分数段 人数 分数段 人数 分数段 人数 [0,80) 2 [100,110) 8 [130,140) 4 [80,90) 5 [110,120 ) 12 [140,150) 2 [90,100) 6 [120,130) 6

那 么 分 数 在 [ 100 , 110 ) 中 的 频 率 和 分 数 不 满 110 分 的 累 积 频 率 分 别 是 ______________、_______(精确到 0.01). 解析:由频率计算方法知:总人数=45. 分数在[100,110)中的频率为 分数不满 110 分的累积频率为 答案:0.18 0.47

8 =0.178≈0.18. 45

2 ? 5 ? 6 ? 8 21 = ≈0.47. 45 45

五.思维总结
1.统计是为了从数据中提取信息,学习时根据实际问题的需求选择不同的方法合理 地选取样本,并从样本数据中提取需要的数字特征。不应把统计处理成数字运算和画图 表。对统计中的概念(如"总体"、"样本"等)应结合具体问题进行描述性说明,不应追 求严格的形式化定义。 2.当总体中个体取不同值很少时,我们党用样本的频率分布标记频率分布梯形图取 估计总体体分布,总体分布排除了抽样造成的错误, 精确反映了总体取值的概率分布规律。 对于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来 表示相应的频率分布。当样本容量无限增大,分组的组距无限缩小时,频率分布直方 图无限接近一条光滑曲线——总体密度曲线.由于总体分布通常不易知道,往往是用 样本的频率分布估计总体分布。样本容量越大,估计就越精确。 3.相关关系 研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方 面加以认识: (1)相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。例如
第 9 页 共 10 页

正方形面积 S 与边长 x 之间的关系 S ? x 2 就是函数关系。即对于边长 x 的每一个确定的 值,都有面积 S 的惟一确定的值与之对应。相关关系是一种非确定性关系,即相关关系 是非随机变量与随机变量之间的关系。例如人的身高与年龄;商品的销售额与广告费等 等都是相关关系。 (2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。 例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系。然而学会新词并不 能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能 力会提高而且由于长大身高也会高些。 (3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。例如 正方形面积 S 与其边长 x 间虽然是一种确定性关系,但在每次测量边长时,由于测量误 差等原因,其数值大小又表现出一种随机性。而对于具有线性关系的两个变量来说,当 求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。 相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模 型,而相关关系是一种更为一般的情况。因此研究相关关系,不仅可使我们处理更为广 泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度。 4.好破势训练,为提高能力,运用变式题目,常规题向典型问题的转化,进行多种 解法训练,从不同角度,不同侧面对题目进行全面分析,结合典型的错解分析,查找思 维的缺陷,提高分析解决问题的能力。

第 10 页 共 10 页


推荐相关:

第19讲 用样本估计总体及线性相关关系

(讲座 19)—用样本估计总体及线性 数学第一轮复习教案 ) 相关关系一.课标要求: 课标要求: 1.用样本估计总体 ①通过实例体会分布的意义和作用,在表示样本数据的...


2017年普通高考数学科一轮复习精品学案 第19讲 用样本估计总体及线性相关关系

本资料来自于资源最齐全的21世纪教育网 www.21cnjy.com 2017 年普通高考数学科一轮复习精品学案第 19 讲 用样本估计总体及线性相关关系一.课标要求: 1.用样本...


高考数学一轮专题精讲19:用样本估计总体及线性相关关系

第19 讲 用样本估计总体及线性相关关系 一. 【课标要求】 1.用样本估计总体 ①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画 频率...


第11讲 空间中的垂直关系

第14讲 直线 圆的位置关系 第19讲 用样本估计总体及线...1/2 相关文档推荐...三.要点精讲 1.线线垂直 判断线线垂直的方法:所成的角是直角,两直线垂直;...


第12讲 空间中的夹角和距离

第14讲 直线 圆的位置关系 第15讲 算法的含义 程序框... 第16讲 基本算法语句 第17讲 算法案例 第18讲 随机抽样 第19讲 用样本估计总体及线... 第20讲...


第15讲 算法的含义

第09讲 空间几何体的表面... 第10讲 空间中的平行关系... 第11讲 空间中...第17讲 算法案例 第18讲 随机抽样 第19讲 用样本估计总体... 第20讲 随机...


第01讲_集合

第17讲___算法案例 第19讲___用样本估计总体... 第20讲_随机事件的概率...2 4 4 2 4 2 2 点评:该题考察了元素与集合、集合与集合之间的关系。首先...


第01讲 集合

第17讲 算法案例 第18讲 随机抽样 第19讲 用样本估计总体... 第20讲 随机...A 。 2 2 选项为 D; 点评:该题考察了元素与集合、集合与集合之间的关系。...


第04讲_基本初等函数

第17讲___算法案例 第19讲___用样本估计总体... 第20讲_随机事件的概率...数量关系的三种不同表示形式, b 因此在许多问题中需要熟练进行它们之间的相互...

网站首页 | 网站地图
All rights reserved Powered by 简单学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com