tceic.com
简单学习网 让学习变简单
相关文档
相关标签
当前位置:首页 >> 数学 >>

【数学导航】2016届高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文


【数学导航】2016 届高考数学大一轮复习 第十章 统计、统计案例与 算法初步同步练习 文
第一节 随机抽样

1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.

三种抽样方法 类别 简单随 机抽样 抽样过程中每 系统 抽样 个个体被抽取 的概率相等, 均属于不放回 分层

抽样 抽样 共同点 各自特点 从总体中逐个抽取 将总体均分成几部分,按事 先确定的规则在各部分中抽 取 将总体分成几层,分层进行 抽样 在起始部分抽 样时采用简单 随机抽样 各层抽样时采 用简单随机抽 样或系统抽样 相互联系 适用范围 总体中的个体 数较少 总体中的个体 数较多 总体由差异明 显的几部分组 成

两种抽样的步骤 (1)系统抽样的步骤 ①先将总体的 N 个个体编号; ②确定分段间隔 k(k∈N ),对编号进行分段.当 (n 是样本容量)是整数时,取 k= ; ③在第 1 段用简单随机抽样确定第 1 个个体编号 l(l≤k); ④按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号(l+k),再加 上 k 得到第 3 个个体编号(l+2k),依次进行下去,直到获取整个样本. (2)分层抽样的步骤 ①分层:按某种特征将总体分成若干部分; ②按比例确定每层抽取个体的个数; ③各层分别按简单随机抽样或系统抽样的方法抽取个体;
1
*

N n

N n

④综合每层抽样,组成样本.

1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)分层抽样就是按比例抽样.( ) ) )

(2)简单随机抽样是一种不放回抽样.(

(3)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( (4)系统抽样在起始部分抽样时采用简单随机抽样.( )

(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( 答案: (1)√ (2)√ (3)× (4)√ (5)×

)

2.(2013·江西卷)总体由编号为 01,02,?,19,20 的 20 个个体组成,利用下面的随机 数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次 选取两个数字,则选出来的第 5 个个体的编号为( 7816 3204 6572 9234 0802 4935 6314 8200 0702 3623 ) 4369 4869 9728 6938 0198 7481

A.08 C.02

B.07 D.01

解析: 由随机数表法的随机抽样的过程可知选出的 5 个个体是 08,02,14,07,01,所以 第 5 个个体的编号是 01. 答案: D 3.(2014·广东卷)为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容 量为 40 的样本,则分段的间隔为( A.50 C.25 ) B.40 D.20

1 000 解析: 由 =25,可得分段的间隔为 25.故选 C. 40 答案: C 4.(2014·湖北卷)甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法 从中抽取一个容量为 80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设 备生产的产品总数为________件. 解析: 设乙设备生产的产品总数为 x 件, 则甲设备生产的产品总数为(4 800-x)件. 由 50 4 800-x 分层抽样特点,结合题意可得 = ,解得 x=1 800. 80 4 800 答案: 1 800
2

5.为了解 1 200 名学生对学校某项教改实验的意见,打算从中抽取一个容量为 30 的样 本,考虑采取系统抽样,则分段的间隔 k 为________. 解析: 在系统抽样中,确定分段间隔 k,对编号进行分段,

N k= (N 为总体的容量,n 为样本的容量), n N 1 200 ∴k= = =40. n 30
答案: 40

简单随机抽样 自主练透型 1.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余 1 下的每个个体被抽到的概率为 ,则在整个抽样过程中,每个个体被抽到的概率为( 3 1 A. 3 1 C. 4 解析: 由题意知 答案: B 2.下列抽取样本的方式是简单随机抽样的有________个. ①从无限多个个体中抽取 50 个个体作为样本; ②箱子里有 100 支铅笔,今从中选取 10 支进行检验.在抽样操作时,从中任意拿出一支 检测后再放回箱子里; ③从 50 个个体中一次性抽取 5 个个体作为样本. 解析: ①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐 个抽取的特点. 答案: 0 解决简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅 匀.一般地,当总体容量和样本容量都较小时可用抽签法. (2)在使用随机数表时, 如遇到三位数或四位数时, 可从选择的随机数表中的某行某列的 数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的 数字舍去. 9 5 B. 14 10 D. 27 )

n-1 3

1 10 5 = ,∴n=28.∴P= = . 28 14

3

系统抽样 自主练透型 1.(2014·湖南卷)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、 系统抽样和分层抽样的三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1,

p2,p3,则(

) B.p2=p3<p1 D.p1=p2=p3

A.p1=p2<p3 C.p1=p3<p2

解析: 根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样,每 个个体被抽到的概率都是 p= ,故 p1=p2=p3,故选 D. 答案: D 2.(2013·陕西卷)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查, 将 840 人按 1,2, ?, 840 随机编号, 则抽取的 42 人中, 编号落入区间[481,720]的人数为( A.11 C.13 B.12 D.14 )

n N

840 解析: 抽样间隔为 =20.设在 1,2, ?, 20 中抽取号码 x0(x0∈[1,20]), 在[481,720] 42 之间抽取的号码记为 20k+x0,则 481≤20k+x0≤720,k∈N . 1 x0 ∴24 ≤k+ ≤36. 20 20 ∵
*

x0 ? 1 ? ∈? ,1?,∴k=24,25,26,?,35, 20 ?20 ?

∴k 值共有 35-24+1=12(个),即所求人数为 12. 答案: B 解决系统抽样应注意的问题 (1)适合元素个数较多且均衡的总体; (2)各个个体被抽到的机会均等; (3)样本的第一个个体用简单随机抽样. 分层抽样 自主练透型 1.(2014·重庆卷)某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况, 用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为( ) A.100 C.200 B.150 D.250

4

解析: 法一:由题意可得 法二:由题意,抽样比为 =100. 答案: A

70 3 500 = ,解得 n=100,故选 A. n-70 1 500

70 1 1 = ,总体容量为 3 500+1 500=5 000,故 n=5 000× 3 500 50 50

2.某高中在校学生有 2 000 人.为了响应“阳光体育运动”的号召,学校开展了跑步和 登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表: 高一年级 跑步 登山 高二年级 高三年级

a x

b y

c z

2 其中 a∶b∶c=2∶3∶5, 全校参与登山的人数占总人数的 .为了了解学生对本次活动的 5 满意程度,从中抽取一个 200 人的样本进行调查,则从高二年级参与跑步的学生中应抽取 ( ) A.36 人 C.24 人 B.60 人 D.30 人

3 解析: 根据题意可知样本中参与跑步的人数为 200× =120,所以从高二年级参与跑 5 3 步的学生中应抽取的人数为 120× =36. 2+3+5 答案: A 分层抽样问题的解题策略 (1)确定抽样比.可依据各层总数与样本数之比,确定抽样比. (2)求某一层的样本数或总体个数. 可依题意求出抽样比, 再由某层总体个数(或样本数) 确定该层的样本(或总体)数. (3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.

A 级 基础训练 1.(2014·大连市第一次模拟)某学校礼堂有 30 排座位,每排有 20 个座位,一次心理讲 座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是 15 的 30 名学生.这里运用 的抽样方法是( A.抽签法 C.系统抽样 ) B.随机数表法 D.分层抽样
5

解析: 抽 30 名学生分了 30 组(每排为一组),每组抽一个,符合系统抽样的定义,故 选 C. 答案: C 2.某班级有男生 20 人,女生 30 人,从中抽取 10 人作为样本,恰好抽到了 4 个男生、6 个女生,则下列命题正确的是( A.该抽样可能是简单随机抽样 B.该抽样一定不是系统抽样 C.该抽样中女生被抽到的概率大于男生被抽到的概率 D.该抽样中女生被抽到的概率小于男生被抽到的概率 解析: 本题看似是一道分层抽样的题,实际上每种抽样方法都可能出现这个结果,故 B 不正确.根据抽样的等概率性知 C,D 不正确. 答案: A 3.800 名学生中抽 50 名学生做牙齿健康检查.现将 800 名学生从 1 到 800 进行编号, 800 求得间隔数 k= =16,即每 16 人抽取一个人.在 1~16 中随机抽到一个数,如果抽到的 50 是 7,则从 33~48 这 16 个数中应取的数是( A.40 C.38 ) B.39 D.37 )

解析: 按系统抽样分组, 33~48 这 16 个数属第 3 组, 则这一组应抽到的数是 7+2×16 =39. 答案: B 4.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、 丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为 N,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12,21,25,43,则这四个社区 驾驶员的总人数 N 为( A.101 C.1 212 ) B.808 D.2 012

12 解析: 由题意知抽样比为 ,而四个社区一共抽取的驾驶员人数为 12+21+25+43= 96 12 101 101,故有 = ,解得 N=808. 96 N 答案: B 5.(2014·上海松江期末考试)某市共有 400 所学校,现要用系统抽样的方法抽取 20 所 学校作为样本,调查学生课外阅读的情况.把这 400 所学校编上 1~400 的号码,再从 1~20 中随机抽取一个号码,如果此时抽得的号码是 6,则在编号为 21 到 40 的学校中,应抽取的
6

学校的编号为( A.25 C.27

) B.26 D.以上都不是

解析: 系统抽样是把个体编号后,先抽取第一个,然后每次间隔相同的数依次抽取, 本题中每次间隔 20,第一个抽取的是 6 号,接下来应该抽取的是 26 号,故选 B. 答案: B 6. (2014·天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向, 拟采用分 层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查.已知该校 一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中 抽取________名学生. 解析: 学生. 答案: 60 7.(2014·江苏南通二调)从编号为 0,1,2,?,79 的 80 件产品中,采用系统抽样的方 法抽取容量是 5 的样本,若编号为 28 的产品在样本中,则该样本中产品的最大编号为 ________. 解析: 根据系统抽样的特点,共有 80 个产品,抽取 5 个样品,则可得组距为 80 =16, 5 由分层抽样的特点可得应该从一年级本科生中抽取 4 ×300=60(名) 4+5+5+6

又其中有 1 个为 28,则与之相邻的为 12 和 44,故所取 5 个依次为 12,28,44,60,76,即最大 的为 76. 答案: 76 8.某市有 A、B、C 三所学校,共有高三文科学生 1 500 人,且 A、B、C 三所学校的高三 文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科 学生中抽取容量为 n 的样本,进行成绩分析,若从 B 校学生中抽取 40 人,则 n=________. 解析: 设 A、B、C 三所学校学生人数分别为 x、y、z,由题知 x,y,z 成等差数列, 所以 x+z=2y, 又 x+y+z=1 500, 所以 y=500, 用分层抽样方法抽取 B 校学生人数为 1 500 ×500=40,得 n=120. 答案: 120 9.某初级中学共有学生 2 000 名,各年级男、女生人数如下表: 初一年级 女生 男生 373 377 初二年级 初三年级

n

x
370

y z

已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19.
7

(1)求 x 的值; (2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名? 解析: (1)∵ =0.19,∴x=380. 2 000 (2)初三年级人数为 y+z=2 000-(373+377+380+370)=500, 48 现用分层抽样的方法在全校抽取 48 名学生,应在初三年级抽取的人数为: ×500 2 000 =12 名. 10.一次数学模拟考试,共 12 道选择题,每题 5 分,共计 60 分,每道题有四个可供选 择的答案,仅有一个是正确的.学生小张只能确定其中 10 道题的正确答案,其余 2 道题完全 靠猜测回答. 小张所在班级共有 40 人,此次考试选择题得分情况统计表如下: 得分(分) 百分率 40 15% 45 10% 50 25% 55 40% 60 10%

x

现采用分层抽样的方法从此班级抽取 20 人的试卷进行选择题质量分析. (1)应抽取多少张选择题得 60 分的试卷? (2)若小张选择题得 60 分,求他的试卷被抽到的概率. 解析: (1)得 60 分的人数为 40×10%=4. 20 x 设抽取 x 张选择题得 60 分的试卷,则 = , 40 4 则 x=2,故应抽取 2 张选择题得 60 分的试卷. (2)设小张的试卷为 a1,另三名得 60 分的同学的试卷为 a2,a3,a4,所有抽取 60 分试卷 的方法为:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共 6 种,其中小张的 3 1 试卷被抽到的抽法共有 3 种,故小张的试卷被抽到的概率为 P= = . 6 2 B 级 能力提升 1 .在某大学数学专业的 160 名学生中开展一项社会调查,先将学 生随机编号为 01,02,03,?,160,采用系统抽样的方法抽取样本,已知抽取的学生中最小的两个编号为 07,23,那么抽取的学生中最大编号应该是( A.150 C.142 ) B.151 D.143

1 解析: 由最小的两个编号为 07,23 可知,抽样间距为 16,因此抽取人数的比例为 , 16 即抽取 10 名学生,其编号构成首项为 7,公差为 16 的等差数列,故抽取的学生中最大编号 为 7+9×16=151.

8

答案: B 2. 一个总体中的 80 个个体编号为 0,1,2, ?, 79, 并依次将其分为 8 个组, 组号为 0,1, ?, 7, 要用(错位)系统抽样的方法抽取一个容量为 8 的样本. 即规定先在第 0 组随机抽取一个号 码,记为 i,依次错位地得到后面各组的号码,即第 k 组中抽取个位数字为 i+k(当 i+k< 10)或 i+k-10(当 i+k≥10)的号码.在 i=6 时,所抽到的 8 个号码是________. 解析: 由题意得,在第 1 组抽取的号码的个位数字是 6+1=7,故应选 17;在第 2 组 抽取的号码的个位数字是 6+2=8,故应选 28,此次类推,应选 39,40,51,62,73. 答案: 6,17,28,39,40,51,62,73 3.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其 结果(人数分布)如下表: 学历 本科 研究生 35 岁以下 80 35~50 岁 30 20 50 岁以上 20

x

y

(1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 将该样本看成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概率; (2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁 以下 48 人,50 岁以上 10 人,再从这 N 个人中随机抽取出 1 人,此人的年龄为 50 岁以上的 5 概率为 ,求 x,y 的值. 39 解析: (1)用分层抽样的方法在 35~50 岁中抽取一个容量为 5 的样本,设抽取学历为 30 m 本科的人数为 m,∴ = ,解得 m=3. 50 5 抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1,B2,B3. 从中任取 2 人的所有等可能基本事件共有 10 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1), (S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3), 其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1),(S1,B2),(S1,B3),(S2,

B1),(S2,B2),(S2,B3),(S1,S2).
∴从中任取 2 人,至少有 1 人学历为研究生的概率为 10 5 (2)由题意,得 = ,解得 N=78. N 39 ∴35~50 岁中被抽取的人数为 78-48-10=20, ∴ 48 20 10 = = ,解得 x=40,y=5. 80+x 50 20+y 7 . 10

即 x,y 的值分别为 40,5.

9

4.某公路设计院有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取 n 个人参 加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如 果参会人数增加 1 个,则在采用系统抽样时,需要在总体中先剔除 1 个个体,求 n. 解析: 总体容量为 6+12+18=36. 36 n 当样本容量是 n 时,由题意知,系统抽样的间隔为 ,分层抽样的比例是 ,抽取的工 n 36 程师人数为 ×6= ,技术员人数为 ×12= ,技工人数为 ×18= ,所以 n 应是 6 的倍 36 6 36 3 36 2 数,36 的约数,即 n=6,12,18.由条件增加 1 人时知,只有 n=6 符合. 第二节 用样本估计总体

n

n

n

n

n

n

1. 了解分布的意义与作用, 能根据频率分布表画频率分布直方图、 频率折线图、 茎叶图, 体会它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 4. 会用样本的频率分布估计总体分布, 会用样本的基本数字特征估计总体的基本数字特 征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.

1.统计图表的含义 (1)频率分布表 ①含义:把反映总体频率分布的表格称为频率分布表. ②频率分布表的画法步骤: 极差 第一步:求极差,决定组数和组距,组距= ; 组数 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:能够反映样本的频率分布规律的直方图. (3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来, 就得到频率分布折线图. (4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线 图将趋于一条光滑曲线,即总体密度曲线.

10

(5)茎叶图的画法步骤 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数: 把 n 个数据按大小顺序排列, 处于最中间位置的一个数据叫做这组数据的中 位数. (3)平均数:把

a1+a2+?+an 称为 a1,a2,?,an 这 n 个数的平均数. n

(4)标准差与方差:设一组数据 x1,x2,x3,?,xn 的平均数为 x ,则这组数据的标准差 和方差分别是

s=
1

1 2 2 2 [?x1- x ? +?x2- x ? +?+?xn- x ? ]

n

s2= [(x1- x )2+(x2- x )2+?+(xn- x )2] n

1.标准差和方差的异同 相同点:标准差和方差描述了一组数据围绕平均数波动的大小. 不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然. 2.众数、中位数和平均数的异同 众数 相同点 与这组数据中的部分 不同点 数据有关,出现在这些 数据中 中位数 都是描述一组数据集中趋势的量 不一定在这些数据中出现.奇数个 时,在这组数值中出现;偶数时, 为中间两数平均值 不一定在这些数 值中出现 平均数

1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)在频率分布直方图中,小矩形的高表示频率.( (2)频率分布直方图中各个长方形的面积之和为 1.( ) )

(3)茎叶图一般左侧的叶按从大到小的顺序写, 右侧的叶按从小到大的顺序写, 相同的数 据可以只记一次.( ) )
11

(4)茎叶图只适用数据为两位数字.(

(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( 答案: (1)× (2)√ (3)× (4)× (5)√ 2.从一堆苹果中任取 10 只,称得它们的质量如下(单位:克): 125 120 122 105 130 114 116 95 120 ) 134

)

则样本数据落在[114.5,124.5)内的频率为( A.0.2 C.0.4

B.0.3 D.0.5

解析: 落在[114.5,124.5)内的样本数据为 120,122,116,120,共 4 个,故所求频率为 4 2 = =0.4. 10 5 答案: C 3. (2014·广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示. 为了解 该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和 抽取的高中生近视人数分别为( )

A.200,20 C.200,10 解析:

B.100,20 D.100,10

该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为 10

000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20,故选 A. 答案: A 4.甲、乙两个班各随机选出 15 名同学进行测验,所得成绩的茎叶图如图.从图中看, ________班的平均成绩较高.

解析: 结合茎叶图中成绩的情况可知,乙班平均成绩较高. 答案: 乙 5.某学员在一次射击测试中射靶 10 次,命中环数如下: 7,8,7,9,5,4,9,10,7,4.
12

则:(1)平均命中环数为________; (2)命中环数的标准差为________. 解析: (1) x = (2)s =
2 2

7+8+7+9+5+4+9+10+7+4 =7. 10

1 2 2 2 2 2 2 2 [(7-7) +(8-7) +(7-7) +(9-7) +(5-7) +(4-7) +(9-7) +(10- 10
2

7) +(7-7) +(4-7) ]=4,∴s=2. 答案: (1)7 (2)2

2

样本的数字特征 自主练透型 1. 某厂 10 名工人在一小时内生产零件的个数分别是 15,17,14,10,15,17,17,16,14,12, 设该组数据的平均数为 a,中位数为 b,众数为 c,则有( A.a>b>c C.c>a>b B.b>c>a D.c>b>a )

解析: 把该组数据按从小到大的顺序排列为 10,12,14,14,15,15,16,17,17,17,其平 1 15+15 均数 a= ×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数 b= =15, 10 2 众数 c=17,则 a<b<c. 答案: D 2.一个样本 a,3,5,7 的平均数是 b,且 a,b 是方程 x -5x+4=0 的两根,则这个样本 的方差是( A.3 C.5
2 2

) B.4 D.6

解析: 由 x -5x+4=0 两根分别为 1,4, ∴有?
?a=1 ? ? ?b=4

或?

?a=4 ? ? ?b=1

.

又 a,3,5,7 的平均数是 b. 即

a+3+5+7
4
? ?a=1 ?b=4 ?

=b,

a+15
4

=b,a+15=4b,

∴?

符合题意,则方差 s =5,故选 C.

2

答案: C 3.(2014·陕西卷)某公司 10 位员工的月工资(单位:元)为 x1,x2,?,x10,其均值和

13

方差分别为 x 和 s ,若从下月起每位员工的月工资增加 100 元,则这 10 位员工下月工资的 均值和方差分别为( A. x ,s +100 C. x ,s
2 2 2

2

) B. x +100,s +100 D. x +100,s
2 2 2

解析: 法一:对平均数和方差的意义深入理解可巧解.因为每个数据都加上了 100, 故平均数也增加 100,而离散程度应保持不变,故选 D. 1 2 2 2 2 法二:由题意知 x1+x2+?xn=n x ,s = [(x1- x ) +(x2- x ) +?+(xn- x ) ],

n

1 1 则所求均值 y = [(x1+100)+(x2+100)+?+(xn+100)]= (n x +n×100)= x +

n

n

100, 1 1 2 2 2 2 而所求方差 t = [(x1+100- y ) +(x2+100- y ) +?+(xn+100- y ) ]= [(x1-

n

n

x )2+(x2- x )2+?+(xn- x )2]=s2,故选 D.
答案: D 众数、中位数、平均数及方差的意义及计算方法 (1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、 众数描述其集中趋势,方差和标准差描述波动大小. (2)平均数、方差的公式推广 ①若数据 x1,x2,?,xn 的平均数为 x ,那么 mx1+a,mx2+a,mx3+a,?,mxn+a 的平 均数是 m x +a. ②数据 x1,x2,?,xn 的方差为 s . (ⅰ)数据 x1+a,x2+a,?,xn+a 的方差也为 s ; (ⅱ)数据 ax1,ax2,?,axn 的方差为 a s . (3)方差的简化计算公式
2 2 2 2 2 s2= [(x2 x 2],或写成 s2= (x2 1+x2+?+xn)-n 1+x2+?+xn)- x ,即方差等于原数 n n 2 2 2 2

1

1

据平方的平均数减去平均数的平方. 茎叶图 互动讲练型 (2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为 A 药,B 药)的 疗效, 随机地选取 20 位患者服用 A 药, 20 位患者服用 B 药, 这 40 位患者在服用一段时间后, 记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:

14

服用 A 药的 20 位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4

服用 B 药的 20 位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?

解析: (1)设 A 药观测数据的平均数为 x ,B 药观测数据的平均数为 y . 由观测结果可得

x = (0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7
+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,

1 20

y = (0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9
+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得 x > y ,因此可看出 A 药的疗效更好. (2)由观测结果可绘制茎叶图如图:

1 20

7 从以上茎叶图可以看出,A 药疗效的试验结果有 的叶集中在茎“2.”,“3.”上,而 B 10 7 药疗效的试验结果有 的叶集中在茎“0.”,“1.”上,由此可看出 A 药的疗效更好. 10

1.如图是根据《山东统计年鉴 2014》中的资料做成的 2004 年至 2013 年我省城镇居民百 户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位 数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到 2004 年至 2013 年我省城镇居民百户家庭人口的平均数为( )

15

A.304.6 C.302.6

B.303.6 D.301.6

解析: 由茎叶图可知,这一组数据的平均数

x=

290×4+300×2+310×4+15+8+13 =303.6. 10

答案: B 2.(2014·安徽省“江南十校”联考)一次数学测验后,从甲、乙两班各抽取 9 名同学的 成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为 ( )

A.8 C.4

B.5 D.2

解析: 甲、乙两班成绩按大小顺序排列,处在最中间的数分别为 87、89,故它们之差 的绝对值是 2. 答案: D 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置 的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位 置的数据. 频率分布直方图 分层深化型 (2014·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取 100 件,测量这些产品 的一项质量指标值,由测量结果得如下频数分布表: 质量指标值 分组 频数 [75,85) 6 [85,95) 26 [95,105) 38 [105,115) 22 [115,125) 8

(1)在下表作出这些数据的频率分布直方图:

16

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代 表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品 80%”的规定? 解析: (1)如图所示:

(2)质量指标值的样本平均数为

x =80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为:

s2=(-20)2×0.06+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104. (3)质量指标值不低于 95 的产品所占比例的估计值为 0.38+0.22+0.08=0.68. 由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品的 80%”的规定.

1.(2014·广东卷)随机观测生产某种零件的某工厂 25 名工人的日加工零件数(单位: 件 ) , 获 得 数 据 如 下 :

30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根据上述数据得到样本的频率分布表如下:

17

(1)确定样本频率分布表中 n1,n2,f1 和 f2 的值; (2)根据上述频率分布表,画出样本频率分布直方图; (3)根据样本频率分布直方图, 求在该厂任取 4 人, 至少有 1 人的日加工零件数落在区间 (30,35]的概率. 解析: (1)由所给数据知,落在区间(40,45]内的有 7 个,落在(45,50]内的有 2 个,故

n1=7,n2=2, n1 7 n2 2 所以 f1= = =0.28,f2= = =0.08. 25 25 25 25
(2)样本频率分布直方图如图.

(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为 0.2,设 所取的 4 人中,日加工零件数落在区间(30,35]的人数为 ξ ,则 ξ ~B(4,0.2),P(ξ ≥1)=1 -P(ξ =0)=1-(1-0.2) =1-0.409 6=0.590 4,所以在该厂任取 4 人,至少有 1 人的日 加工零件数落在区间(30,35]的概率为 0.590 4.
4

2.(2014·重庆卷)20 名学生某次数学考试成绩(单位:分)的频率分布直方图如下:

(1)求频率分布直方图中 a 的值; (2)分别求出成绩落在[50,60)与[60,70)中的学生人数; (3)从成绩在[50,70)的学生中任选 2 人,求此 2 人的成绩都在[60,70)中的概率. 解析: (1)据直方图知组距=10,
18

由(2a+3a+6a+7a+2a)×10=1, 1 解得 a= =0.005. 200 (2)成绩落在[50,60)中的学生人数为 2×0.005×10×20=2, 成绩落在[60,70)中的学生 人数为 3×0.005×10×20=3. (3)记成绩落在[50,60)中的 2 人为 A1,A2,成绩落在[60,70)中的 3 人为 B1,B2,B3,则 从成绩在[50,70)的学生中任选 2 人的基本事件共有 10 个: (A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,

B3),(B2,B3),
其中 2 人的成绩都在[60,70)中的基本事件有 3 个: 3 (B1,B2),(B1,B3),(B2,B3),故所求概率为 P= . 10

3. (2014·黑龙江大庆一中第二次阶段考试)某班同学利用寒假在 5 个居民小区内选择两 个小区逐户进行一次“低碳生活习惯”的调查,以计算每户的碳月排放量.若月排放量符合 低碳标准的称为“低碳族”,否则称为“非低碳族”.若小区内有至少 75%的住户属于“低 碳族”,则称这个小区为“低碳小区”,否则称为“非低碳小区”.已知备选的 5 个居民小 区中有三个非低碳小区,两个低碳小区. (1)求所选的两个小区恰有一个为“非低碳小区”的概率; 1 (2)假定选择的“非低碳小区”为小区 A, 调查显示其“低碳族”的比例为 , 数据如图 1 2 所示,经过同学们的大力宣传,三个月后,又进行了一次调查,数据如图 2 所示,问这时小 区 A 是否达到“低碳小区”的标准?

解析: (1)设三个“非低碳小区”为 B,C,D,两个“低碳小区”为 m,n,则从 5 个小

19

区中任选两个小区,所有可能的结果有 10 种,它们是(B,C),(B,D),(B,m),(B,n),(C,

D),(C,m),(C,n),(D,m),(D,n),(m,n),恰有一个为“非低碳小区”的结果有(B, m),(B,n),(C,m),(C,n),(D,m),(D,n),共 6 种,故所求概率为 P= = .
(2)由题图 1 可知月碳排放量不超过 300 千克的称为“低碳族”. 由题图 2 可知,三个月后的“低碳族”的比例为 0.07+0.23+0.46=0.76>0.75,所以 三个月后小区 A 达到了“低碳小区”的标准. 解决频率分布直方图问题时要抓住: (1)直方图中各小长方形的面积之和为 1. 频率 频率 (2)直方图中纵轴表示 ,故每组样本的频率为组距× ,即矩形的面积. 组距 组距 (3)直方图中每组样本的频数为频率×总体数. 6 3 10 5

A 级 基础训练 1. 把样本容量为 20 的数据分组, 分组区间与频数如下: [10,20), 2; [20,30), 3; [30,40), 4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( A.0.05 C.0.5 B.0.25 D.0.7 )

14 解析: 由题知,在区间[10,50)上的数据的频数是 2+3+4+5=14,故其频率为 = 20 0.7. 答案: D 2.(2014·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿 者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17], 将其按从左到右的顺序分别编号为第一组,第二组,?,第五组.如图是根据试验数据制成 的频率分布直方图.已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组 中有疗效的人数为( )

A.6 C.12

B.8 D.18
20

解析: 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验 20 共选取的志愿者有 =50 人.所以第三组共有 50×0.36=18 人,其中有疗效的人数为 18 0.40 -6=12. 答案: C 3.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了 n 位中学生进行调查, 根据所得数据画出样本的频率分布直方图,如图所示,且从左到右的第 1 个、第 4 个、第 2 个、第 3 个小长方形的面积依次构成公差为 0.1 的等差数列,又第一小组的频数是 10,则 n 等于( )

A.80 C.100 解析: 设第 1 个小长方形的面积为 S,

B.90 D.110

4×3 ? ×0.1? 则 4 个小长方形的面积之和为?4S+ ?, 2 ? ? 3 由题意知,4S+4× ×0.1=1, 2 10 故 S=0.1,又因为 =0.1,所以 n=100.

n

答案: C 4. 一个样本容量为 10 的样本数据, 它们组成一个公差不为 0 的等差数列{an}, 若 a3=8, 且 a1,a3,a7 成等比数列,则此样本的平均数和中位数分别是( A.13,12 C.12,13 解析: B.13,13 D.13,14 设等差数列{an}的公差为 d(d≠0),a3=8,a1a7=(a3) =64,(8-2d)(8+4d)
2 2

)

=64,(4-d)(2+d)=8,2d-d =0,又 d≠0,故 d=2,故样本数据为:4、6、8、10、12、 14、16、18、20、22,平均数为 答案: B 5.甲、 乙两名运动员在某项测试中的 6 次成绩的茎叶图如图所示, x 1、 x 2 分别表示甲、 乙两名运动员这项测试成绩的平均数,s1、s2 分别表示甲、乙两名运动员这项测试成绩的标

S10 ?4+22?×5
10 = 10

12+14 =13,中位数为 =13. 2

21

准差,则有(

)

A. x 1> x 2,s1<s2 C. x 1= x 2,s1<s2 解析: 37 3

B. x 1= x 2,s1=s2 D. x 1= x 2,s1>s2 53 3

2 x 1=15, x 2=15,s2 ,s2= . 1=

答案: C 6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________、________.

解析: 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为 45. 乙组数据为:29,34,35,42,46,48,53,55,67,中位数为 46. 答案: 45 46 7.(2014·江苏卷)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部 周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有________株树木的底部周长小于 100 cm.

解析: 由频率分布直方图可得树木底部周长小于 100 cm 的频率是(0.025+0.015)×10 =0.4,又样本容量是 60,所以频数是 0.4×60=24. 答案: 24 8.(2013·湖北卷)从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 至 350 度之间,频率分布直方图如图所示.

22

(1)直方图中 x 的值为________; (2)在这些用户中,用电量落在区间[100,250)内的户数为________. 解析: (1)根据频率和为 1, 得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50 =1,解得 x=0.004 4; (2)(0.003 6+0.006 0+0.004 4)×50×100=70. 答案: (1)0.004 4 (2)70 9.甲、乙两名战士在相同条件下各射靶 10 次,每次命中的环数分别是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一些. 解析: (1) x 甲= 1 10 1 (8+6+7+8+6+5+9+10+4+7)=7, 10

x 乙= (6+7+7+8+6+7+8+7+9+5)=7.
1 2 2 2 2 2 (2)由方差公式 s = [(x1- x ) +(x2- x ) +?+(xn- x ) ]可求得 s甲=3.0, s2 乙=1.2.

n

(3)由 x 甲= x 乙,说明甲、乙两战士的平均水平相当; 又∵s甲>s乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定. 10.(2014·北京卷)从某校随机抽取 100 名学生,获得了他们一周课外阅读时间(单位: 小时)的数据,整理得到数据分组及频数分布表和频率分布直方图: 组号 1 2 3 4 5 6 分组 [0,2) [2,4) [4,6) [6,8) [8,10) [10,12) 频数 6 8 17 22 25 12
23
2 2

7 8 9 合计

[12,14) [14,16) [16,18) 100

6 2 2

(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于 12 小时的概率; (2)求频率分布直方图中的 a,b 的值; (3)假设同一组中的每个数据可用该组区间的中点值代替, 试估计样本中的 100 名学生该 周课外阅读时间的平均数在第几组.(只需写出结论) 解析: (1)根据频数分布表,100 名学生中课外阅读时间不少于 12 小时的学生共有 6 10 +2+2=10 名,所以样本中的学生课外阅读时间少于 12 小时的频率是 1- =0.9. 100 从该校随机选取一名学生,估计其课外阅读时间少于 12 小时的概率为 0.9. 频率 0.17 (2)课外阅读时间落在组[4,6)的有 17 人,频率为 0.17,所以 a= = =0.085. 组距 2 频率 0.25 课外阅读时间落在组[8,10)的有 25 人,频率为 0.25,所以 b= = =0.125. 组距 2 (3)样本中的 100 名学生课外阅读时间的平均数在第 4 组. B 级 能力提升 1.在某次测量中得到的 A 样本数据如下:42,43,46,52,42,50,若 B 样本数据恰好是 A 样本数据每个都减 5 后所得数据,则 A、B 两样本的下列数字特征对应相同的是( A.平均数 C.众数 解析: A 样本数据的平均数 x = B.标准差 D.中位数 275 ,B 样本数据的平均数 x ′= x -5.A 样本数据 6 )

1 1 2 2 2 2 2 的方差 s = [(42- x ) +(43- x ) +?+(50- x ) ],B 样本数据的方差 s′ = [(42- 6 6

x )2+(43- x )2+?+(50- x )2],∴A、B 两样本的标准差相同,故选 B.
答案: B
24

2.将某选手的 9 个得分去掉 1 个最高分, 去掉 1 个最低分, 7 个剩余分数的平均分为 91, 现场作的 9 个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以 x 表示,则 7 个剩余 分数的方差为________.

解析: 根据茎叶图,去掉 1 个最低分 87,1 个最高分 99, 1 则 [87+94+90+91+90+(90+x)+91]=91, 7 ∴x=4. 1 2 2 2 2 2 2 2 ∴s = [(87-91) +(94-91) +(90-91) +(91-91) +(90-91) +(94-91) +(91- 7 36 2 91) ]= . 7 答案: 36 7

3. (2014·通化模拟)某学科在市模考后从全年级抽出 100 名学生的学科成绩作为样本进 行分析,得到样本频率分布直方图如图所示. (1)利用组中值估计该次考试该学科的平均成绩. (2)估计该学科成绩在[100,130)之间的概率. (3)为详细了解每题的答题情况, 从样本中成绩在 80~100 之间的试卷中任选 2 份进行分 析,求至少有 1 人成绩在 80~90 之间的概率.

解析: 124.4 分.

(1) 用每组的组中值作为该组的平均值,算得该次考试该学科的平均成绩为

(2) 样本中学生成绩在 [100,130) 之间的频率为 0.58 ,故由频率估计该学科成绩在 [100,130)之间的概率 P1=0.58. (3)样本中成绩在 80~90 之间有 2 人,设其编号为①②;样本中成绩在 90~100 之间有 4 人,设其编号为③④⑤⑥.从上述 6 人中任取 2 人的所有选取可能为:①②,①③,①④, ①⑤,①⑥,②③,②④,②⑤,②⑥,③④,③⑤,③⑥,④⑤,④⑥,⑤⑥. 故从样本中成绩在 80~100 之间任选 2 人所有可能结果数为 15,

25

至少有 1 人成绩在 80~90 之间可能结果数为 9,因此,所求概率为 P2=0.6. 4.(2014·唐山调研)在数学趣味知识培训活动中,甲、乙两名学生的 6 次培训成绩如茎 叶图所示:

(1)从甲、 乙两人中选择一人参加数学趣味知识竞赛, 你会选哪位?请运用统计学的知识 说明理由; (2)从乙的 6 次成绩中随机选择 2 个成绩,试求选到 123 分的概率. 解析: (1) x 甲= 99+107+108+115+119+124 =112, 6

x 乙=
1 6

102+105+112+113+117+123 =112, 6

2 2 2 2 2 s2 甲 = [(99 - 112) + (107 - 112) + (108 - 112) + (115 - 112) + (119 - 112) + (124 -

206 2 112) ]= , 3
2 2 2 2 2 s2 乙 = [(102 - 112) + (105 -112) + (112 - 112) + (113 - 112) + (117 - 112) +(123 -

1 6

148 2 112) ]= , 3 ∴ x 甲= x 乙,s甲>s乙, 说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,则选择乙同学. (2)从 6 个成绩中随机选择 2 个,共有 15 个基本事件,分别是: {102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113}, {105,117}, {105,123}, {112,113}, {112,117}, {112,123}, {113,117}, {113,123}, {117,123}, 5 1 其中满足条件的基本事件有 5 个,故所求概率 P= = . 15 3 第三节 变量间的相关关系、统计案例
2 2

1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用.
26

4.了解回归分析的基本思想、方法及其简单应用.

1.相关关系与回归方程 (1)相关关系的分类: ①正相关:从散点图上看,点散布在从左下角到右上角的区域内; ②负相关:从散点图上看,点散布在从左上角到右下角的区域内. (2)线性相关关系: 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间 具有线性相关关系,这条直线叫回归直线. (3)回归方程: ①最小二乘法: 使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法. ②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),?,(xn,
n
∧ ∧ ∧ ∧

n

? ?xi- x ??yi- y ? i ? xiyi-n x i=1 =1 yn),其回归方程为y=bx+a,则b= = n n 2 ? ? x ? x2 i- x ? i-n x i=1 i=1
∧ ∧ ∧ ∧

y

2

a= y -b x ,其中,b是回归方程的斜率,a是在 y 轴上的截距.
(4)样本相关系数:
n

r=

? ?xi- x ??yi- y ? i=1
n
2

n

,用它来衡量两个变量间的线性相关关系.
2

i=1

? ?xi- x ? i ? ?yi- y ? =1

①当 r>0 时,表明两个变量正相关; ②当 r<0 时,表明两个变量负相关. ③r 的绝对值越接近于 1,表明两个变量的线性相关性越强,r 的绝对值越接近于 0,表 明两个变量之间几乎不存在线性相关关系.通常当|r|大于 0.75 时,认为两个变量有很强的 线性相关性. 2.独立性检验 (1)2×2 列联表 假设有两个分类变量 X 和 Y, 它们的取值分别为{x1, x2}和{y1, y2}, 其样本频数列联表(称 2×2 列联表)为:

y1 x1 x2
总计

y2 b d b+d

总计

a c a+c

a+b c+d a+b+c+d

27

(2)K 统计量:

2

K2=

n?ad-bc?2 .(其中 n=a+b+c+d 为样本容量) ?a+b??c+d??a+c??b+d?

1.线性回归直线方程的求法
∧ ∧ ∧

求解回归方程关键是确定回归系数a,b,因求解b的公式计算量太大,一般题目中给出 相关的量,如 x , y , ?xi, ?yi等,便可直接代入求解.充分利用回归直线过样本中心点
2 2

n

n

i=1

i=1







( x , y ),即有 y =b x +a,可确定a. 2.独立性检验思想的理解 独立性检验的思想类似于反证法,即要确定“两个变量 X 与 Y 有关系”这一结论成立的 可信度,首先假设结论不成立,即它们之间没有关系,也就是它们是相互独立的,利用概率 的 乘 法 公 式 可 推 知 , (ad - bc) 接 近 于 零 , 也 就 是 随 机 变 量

K2 =

n?ad-bc?2 2 应该很小,如果计算出来的 K 的观测值 k 不是很小,通 ?a+b??c+d??a+c??b+d?
过查表 P(K ≥k0)的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可 以肯定地断言 X 与 Y 之间有关系.
2

1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )

n?ab-cd? 2 (2)K = .( ?a+b??a+d??a+c??b+d?

2

)
2

(3)事件 X,Y 关系越密切,则由观测数据计算得到的 K 的观测值越大.( (4)任何一组数据都对应着一个回归直线方程.( 答案: (1)× (2)× (3)√ (4)× 2.有关线性回归的说法,不正确的是( A.具有相关关系的两个变量是非确定关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.散点图中的点越集中,两个变量的相关性越强 答案: D ) )

)

3. 某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系, 运

28

用 2×2 列联表进行独立性检验,经计算 K =7.069,则所得到的统计学结论是:有多少的把 握认为“学生性别与支持该活动有关系”.( 附: )

2

P(K2≥k0) k0

0.100 2.706

0.050 3.841

0.025 5.024

0.010 6.635

0.001 10.828

A.0.1% C.99%

B.1% D.99.9%

解析: 因为 7.069 与附表中的 6.635 最接近,所以得到的统计学结论是:有 1-0.010 =0.99=99%的把握认为“学生性别与支持该活动有关系”. 答案: C 4.下面是一个 2×2 列联表

y1 x1 x2
总计

y2
21 25 46

总计 73 27

a
2

b

则表中 a、b 处的值分别为________. 解析: ∵a+21=73,∴a=52. 又∵a+2=b,∴b=54. 答案: 52、54 5.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查 显示年收入 x 与年饮食支出 y 具有线性相关关系, 并由调查数据得到 y 对 x 的回归直线方程:


y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加
________万元. 解析: 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 答案: 0.254

相关关系的判断 自主练透型 1.在一组样本数据(x1,y1),(x2,y2),?,(xn,yn)(n≥2,x1,x2,?,xn 不全相等) 1 的散点图中,若所有样本点(xi,yi)(i=1,2,?,n)都在直线 y= x+1 上,则这组样本数 2 据的样本相关系数为( A.-1 ) B.0
29

1 C. 2

D.1

解析: 所有样本点均在直线上,则样本相关系数最大即为 1,故选 D. 答案: D 2.(2013·湖北卷)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求 得回归直线方程,分别得到以下四个结论:


①y 与 x 负相关且y=2.347x-6.423;


②y 与 x 负相关且y=-3.476x+5.648;


③y 与 x 正相关且y=5.437x+8.493;


④y 与 x 正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是( A.①② C.③④ ) B.②③ D.①④

解析: 正相关指的是 y 随 x 的增大而增大,负相关指的是 y 随 x 的增大而减小,故不 正确的为①④,故选 D. 答案: D 1.函数关系中的两个变量间是一种确定性关系.例如,正方形面积 S 与 边长 x 之间的关系 S=x 就是函数关系. 2.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例 如,商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提. 线性回归方程 互动讲练型 (2014·新课标全国卷Ⅱ)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单 位:千元)的数据如下表: 年份 年份代号 t 人均纯收入 y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9
2

(1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变 化情况,并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:

30

?


n

?ti- t ??yi- y ?
∧ ∧

i=1

b=

,a= y -b t .

?
i=1

n

?ti- t ?

2

1 解析: (1)由所给数据计算得 t = ×(1+2+3+4+5+6+7)=4, 7

y = ×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,

1 7

? (ti- t )2=9+4+1+0+1+4+9=28,
i=1

7

? (ti- t )(yi- y
i=1

7

)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+

1×0.5+2×0.9+3×1.6=14,

?


7

?ti- t ??yi- y ?
7

i=1

b=

?
i=1
∧ ∧

14 = =0.5, 28 ?ti- t ?
2

a= y -b t =4.3-0.5×4=2.3,


所求回归方程为y=0.5t+2.3.


(2)由(1)知, b=0.5>0, 故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加, 平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得


y=0.5×9+2.3=6.8,
故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.

某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销, 得到如下数据: 单价 x(元) 销量 y(件)
∧ ∧ ∧

8 90


8.2 84

8.4 83


8.6 80

8.8 75

9 68

(1)求回归直线方程y=bx+a,其中b=-20,a= y -b x ; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是 4 元/
31

件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 1 解析: (1)由于 x = (8+8.2+8.4+8.6+8.8+9)=8.5, 6

y = (90+84+83+80+75+68)=80,又b=-20,


1 6



a= y -b x =80+20×8.5=250,


从而回归直线方程为y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得

L=x(-20x+250)-4(-20x+250)
=-20x +330x-1 000 =-20(x-8.25) +361.25. 当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润. 求线性回归方程的基本步骤 (1)先把数据制成表,从表中计算出 x 、 y ,x1+x2+?+xn、x1y1+x2y2+?+xnyn 的值;
∧ ∧ 2 2 2 2 2

(2)计算回归系数a,b;
∧ ∧ ∧

(3)写出线性回归方程y=bx+a. 注:回归方程一定过点( x , y ). 独立性检验 互动讲练型 (2014·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量 的关系,随机抽查了 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最 大的变量是( 表1 )

成绩 性别 男 女 总计

不及格 6 10 16

及格 14 22 36

总计 20 32 52

表2

32

视力 性别 男 女 总计

好 4 12 16

差 16 20 36

总计 20 32 52

表3

智商 性别 男 女 总计

偏高 8 8 16

正常 12 24 36

总计 20 32 52

表4

阅读量 性别 男 女 总计

丰富 14 2 16

不丰富 6 30 36

总计 20 32 52

A.成绩 B.智商

B.视力 D.阅读量
2

52×?6×22-14×10? 2 解析: 因为 K1= 16×36×32×20 = 52×8 , 16×36×32×20 52×?4×20-16×12? 16×36×32×20
2 2 2

K2 2=

2 3

52×112 , 16×36×32×20
2

52×?8×24-12×8? K= 16×36×32×20

33



52×96 , 16×36×32×20 52×?14×30-6×2? 16×36×32×20
2 2

2

K2 4=

52×408 2 2 2 2 = ,则 K4>K2>K3>K1,所以阅读量与性别有关联的可能性最大. 16×36×32×20 答案: D

(2014·辽宁卷)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽 样调查,调查结果如下表所示: 喜欢甜品 南方学生 北方学生 合计 60 10 70 不喜欢甜品 20 10 30 合计 80 20 100

根据表中数据,问是否有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯 方面有差异”. 解析: 将 2×2 列联表中的数据代入公式计算,得 100×?60×10-20×10? 100 K= = ≈4.762. 70×30×80×20 21
2 2

由于 4.762>3.841, 所以有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. 独立性检验的一般步骤 (1)根据样本数据制成 2×2 列联表;

n?ad-bc? 2 2 (2)根据公式 K = 计算 K 的值; ?a+b??c+d??a+c??b+d?
(3)查表比较 K 与临界值的大小关系,作统计判断.
2

2

A 级 基础训练 1.已知变量 x,y 呈线性相关关系,线性回归方程为 y=0.5+2x,则变量 x,y 是( A.线性正相关关系 B.由回归方程无法判断其正负相关 C.线性负相关关系 D.不存在线性相关关系 解析: 随着变量 x 增大,变量 y 有增大的趋势,则 x,y 称为正相关.
34

)

答案: A - - 2.(2014·重庆卷)已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x =3, y = 3.5,则由该观测数据算得的线性回归方程可能是(
∧ ∧

)

A.y=0.4x+2.3


B.y=2x-2.4


C.y=-2x+9.5 解析: 由正相关的理解可排除 C,D,

D.y=-0.3x+4.4

- - 由回归直线方程恒过点( x , y ),可知排除 B. 答案: A 3.登山族为了了解某山高 y(km)与气温 x(℃)之间的关系,随机统计了 4 次山高与相应 的气温,并制作了对照表: 气温(℃) 山高(km)


18 24


13 34


10 38

-1 64

由表中数据,得到线性回归方程y=-2x+a (a∈R).由此估计山高为 72(km)处气温的 度数为( A.-10 C.-6 解析: ∵ x =10, y =40, ∴样本中心点为(10,40). ∵回归直线过样本中心点,
∧ ∧

) B.-8 D.-4

∴40=-20+a,即a=60,


∴线性回归方程为y=-2x+60, ∴山高为 72(km)处气温的度数为-6,故选 C. 答案: C 4.(2014·山东东营模拟)已知变量 x 与 y 之间的回归直线方程为y=-3+2x,若 ?xi
i=1
∧ 10

=17,则 ?yi 的值等于(
i=1

10

) B.4 D.40

A.3 C.0.4 17 解析: 依题意 x = =1.7, 10

35



而直线y=-3+2x 一定经过( x , y ), 所以 y =-3+2 x =-3+2×1.7=0.4, ∴ ?yi=0.4×10=4.
i=1
10

答案: B 5.(2014·长春市第二次调研)以下四个命题: ①在匀速传递的产品生产流水线上, 质检员每 10 分钟从中抽取一件产品进行某项指标检 测,这样的抽样是分层抽样;②若两个变量的线性相关性越强,则它们的相关系数的绝对值 越接近于 1;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; ④对分类变量 X 与 Y 的随机变量 K 的观测值 k 来说,k 越小,判断“X 与 Y 有关系”的把握 越大.其中真命题的序号是( A.①④ C.①③ ) B.②④ D.②③
2

解析: ①应为系统(等距)抽样;②线性相关系数 r 的绝对值越接近于 1,两变量间线 性关系越强;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; ④显然错误.故选 D. 答案: D 6.(2014·忻州联考)已知 x,y 的取值如下表:

x y

2 2.2

3 3.8

4 5.5


5 6.5
∧ ∧

从散点图分析,y 与 x 线性相关,且回归方程为y=1.46x+a,则实数a的值为________. 解析:

x=

2+3+4+5 2.2+3.8+5.5+6.5 =3.5, y = =4.5,回归方程必过样本 4 4


的中心点( x , y ).把(3.5,4.5)代入回归方程,计算得a=-0.61. 答案: -0.61 7.(2014·厦门诊断)为考察棉花种子经过处理跟生病之间的关系得到下表数据: 种子处理 得病 不得病 总计 32 61 93 种子未处理 101 213 314 总计 133 274 407

根据以上数据,则种子经过处理与是否生病________(填“有”或“无”)关.

36

解析:

在假设无关的情况下,根据题意 K =

2

n?ad-bc?2 ?a+b??c+d??a+c??b+d?

≈0.16,可以得到无关的概率大于 50%,所以种子经过处理跟是否生病有关的概率小于 50%, 所以可以认为种子经过处理与是否生病无关. 答案: 无 8. (2014·山东菏泽调研)某医疗研究所为了检验某种血清预防感冒的作用, 把 500 名使 用血清的人与另外 500 名未用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清 不能起到预防感冒的作用”,利用 2×2 列联表计算得 K ≈3.918,经查对临界值表知
2

P(K2≥3.841)≈0.05.对此,四名同学做出了以下的判断: p:有 95%的把握认为“这种血清能起到预防感冒的作用”; q:若某人未使用该血清,那么他在一年中有 95%的可能性得感冒; r:这种血清预防感冒的有效率为 95%; s:这种血清预防感冒的有效率为 5%.
则下列命题中,真命题的序号是________.(把你认为正确的命题序号都填上) ①p∧ ?q;②?p∧q;③(?p∧ ?q)∧(r∨s);④(p∨?r)∧(?q∨s). 解析: 由题意,得 K ≈3.918,P(K ≥3.841)≈0.05,所以只有第一位同学的判断正确, 即有 95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题. 答案: ①④ 9.在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所 有的数据合成一个分数.满分 100 分,按照大于等于 80 分为优秀,小于 80 分为合格.为了 解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有 60 名学生,得到 如下的列联表. 优秀 男生 女生 总计 1 已知在该班随机抽取 1 人测评结果为优秀的概率为 . 3 (1)请完成上面的列联表; (2)能否在犯错误的概率不超过 0.10 的前提下认为性别与测评结果有关系? 解析: (1) 优秀 男生 女生 6 14 合格 22 18 总计 28 22 6 18 60 合格 总计
2 2

37

总计

20

40

60
2

60×?6×18-22×14? 2 (2)提出统计假设:性别与测评结果没有关系,则 K = ≈3.348 40×20×32×28 >2.706.

P(K2>2.706)<0.10.
因此,在犯错误的概率不超过 0.10 的前提下认为“性别与测评结果有关系”. 10. (2013·重庆卷)从某居民区随机抽取 10 个家庭, 获得第 i 个家庭的月收入 xi(单位: 千元)与月储蓄 yi(单位:千元)的数据资料,算得 ?xi=80, ?yi=20, ?xiyi=184, ?xi=
2 10 10 10 10

i=1

i=1

i=1

i=1

720.
∧ ∧ ∧

(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程y=bx+a; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄.

?xiyi-n x y
∧ ∧ ∧ ∧

n

i=1





附:线性回归方程y=bx+a中,b=
i-n x ?x2 i=1 n
2

,a= y -b x ,其中 x , y 为样

本平均值. 解析: (1)由题意知 n=10, x = 1

xi= =8, ni? 10 =1

n

80

y=

1

yi= =2, n? 10
i=1 n

n

20

又 lxx= ?xi-n x =720-10×8 =80,
2 2 2

i=1

lxy= ?xiyi-n x
i=1


n

y =184-10×8×2=24,

由此得b=

∧ ∧ lxy 24 = =0.3,a= y -b x =2-0.3×8=-0.4, lxx 80 ∧

故所求线性回归方程为y=0.3x-0.4.


(2)由于变量 y 的值随 x 值的增加而增加(b=0.3>0),故 x 与 y 之间是正相关.


(3)将 x=7 代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
38

B 级 能力提升 1.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问 100 名性别不 同的居民是否能做到“光盘”行动,得到如下的列联表: 做不到“光盘” 男 女 附: 45 30 能做到“光盘” 10 15

P(K2≥k) k K2=

0.10 2.706

0.05 3.841

0.025 5.024

n?ad-bc?2 ?a+b??c+d??a+c??b+d?
)

参照附表,得到的正确结论是(

A. 在犯错误的概率不超过 1%的前提下, 认为“该市居民能否做到‘光盘’与性别有关” B. 在犯错误的概率不超过 1%的前提下, 认为“该市居民能否做到‘光盘’与性别无关” C.有 90%以上的把握认为“该市居民能否做到‘光盘’与性别有关” D.有 90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 解析:

n?ad-bc?2 由公式可计算 K 的观测值 k= = ?a+b??c+d??a+c??b+d?
2 2

100?45×15-30×10? ≈3.03> 2.706,所以有 90%以上的把握认为“该市居民能否做到 55×45×75×25 ‘光盘’与性别有关”,故选 C. 答案: C 2. (2015·广东梅州一模)在 2015 年 1 月 15 日那天, 某市物价部门对本市的 5 家商场的 某商品的一天销售量及其价格进行调查,5 家商场的售价 x 元和销售量 y 件之间的一组数据 如下表所示: 价格 x 销售量 y 9 11 9.5

m
8

10.5 6

11 5

n

由散点图可知, 销售量 y 与价格 x 之间有较强的线性相关关系, 其线性回归直线方程是:


y=-3.2x+40,且 m+n=20,则其中的 n=________.
解析:

x=

9+9.5+m+10.5+11 m 11+n+8+6+5 n =8+ , y = =6+ ,线性回归直 5 5 5 5

线一定经过样本中心( x , y ),即 6+ =-3.2?8+ ?+40,即 3.2m+n=42, 5 ? 5?

n

?

m?

39

?3.2m+n=42, ? 又∵m+n=20,即? ?m+n=20, ?

解得?

?m=10, ? ?n=10. ?

故 n=10.

答案: 10 3.(2014·安徽卷)某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人.为 调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周平 均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所 示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计 该校学生每周平均体育运动时间超过 4 小时的概率; (3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 小时,请完成每周平均 体育运动时间与性别列联表,并判断是否有 95%的把握认为“该校学生的每周平均体育运动 时间与性别有关”.

n?ad-bc? 2 附:K = ?a+b??c+d??a+c??b+d? P(K2≥k0) k0
0.10 2.706 0.05 3.841 0.010 6.635 0.005 7.879

2

4 500 解析: (1)300× =90,所以应收集 90 位女生的样本数据. 15 000 (2)由频率分布直方图得 1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运 动时间超过 4 小时的概率的估计值为 0.75. (3)由(2)知,300 位学生中有 300×0.75=225 人的每周平均体育运动时间超过 4 小时, 75 人的每周平均体育运动时间不超过 4 小时.又因为样本数据中有 210 份是关于男生的,90 份是关于女生的,所以每周平均体育运动时间与性别列联表如下: 男生 每周平均体育运动时间不超过 4 小时 每周平均体育运动时间超过 4 小时 总计
2

女生 30 60 90

总计 75 225 300

45 165 210

300×?2 250? 100 2 结合列联表可算得 K = = ≈4.762>3.841. 75×225×210×90 21
40

所以,有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 4.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从 4 月份的 30 天中随 机挑选了 5 天进行研究,且分别记录了每天昼夜温差与每天 100 颗种子浸泡后的发芽数,得 到如下表格: 日期 温差 x(℃) 发芽数 y(颗) 4月1日 10 23 4月7日 11 25 4 月 15 日 13 30 4 月 21 日 12 26 4 月 30 日 8 16

(1)从这 5 天中任选 2 天,记发芽的种子数分别为 m,n,求事件“m,n 均不小于 25”的 概率; (2)从这 5 天中任选 2 天,若选取的是 4 月 1 日与 4 月 30 日的两组数据,请根据这 5 天
∧ ∧ ∧

中的另 3 天的数据,求出 y 关于 x 的线性回归方程y=bx+a; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗, 则认为 得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?

?xiyi-n x y


n

i=1





(参考公式:b=

,a= y -b x )

x2 i-n ?x2
i=1

n

解析: (1)所有的基本事件为(23,25), (23,30), (23,26), (23,16), (25,30), (25,26), (25,16),(30,26),(30,16),(26,16),共 10 个. 设“m, n 均不小于 25”为事件 A, 则事件 A 包含的基本事件为(25,30), (25,26), (30,26), 共 3 个. 3 所以 P(A)= . 10 (2)由数据得,另 3 天的平均数 x =12, y =27,3 x 3 x =432, ?xiyi=977, ?xi=434,
2 2 3 3

y =972,

i=1

i=1



所以b=

977-972 5 ∧ 5 = ,a=27- ×12=-3, 434-432 2 2

∧ 5 所以 y 关于 x 的线性回归方程为y= x-3. 2 ∧

(3)依题意得,当 x=10 时,y=22,|22-23|<2;


当 x=8 时,y=17,|17-16|<2, 所以(2)中所得到的线性回归方程是可靠的.
41

第四节

算法初步

1.了解算法的含义,了解算法的思想. 2.理解程序框图的三种基本逻辑结构:顺序结构、条件结构、循环结构. 3.了解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的 含义.

1.三种基本逻辑结构 (1)顺序结构 ①定义: 由若干个依次执行的步骤组成的结构, 这是任何一个算法都离不开的基本结构. ②结构形式

(2)条件结构 ①定义:算法的流程根据条件是否成立有不同的流向,条件结构就是处理这种过程的结 构. ②结构形式

(3)循环结构 ①定义:从某处开始,按照一定的条件反复执行某些步骤的情况,这就是循环结构,反 复执行的步骤称为循环体. ②结构形式

42

2.三种算法语句的格式与应用 (1)输入语句、输出语句和赋值语句 语句 输入语句 输出语句 赋值语句 (2)条件语句 ①功能:实现条件结构. ②条件语句的格式及框图: a.IF-THEN 格式 一般格式 INPUT“提示内容”;变量 PRINT“提示内容”;表达式 变量=表达式 功能 输入信息 输出常量、变量的值和系统信息 将表达式代表的值赋给变量

b.IF-THEN-ELSE 格式

(3)循环语句 ①功能:实现程序框图中的循环结构. ②循环语句的格式及框图: a.UNTIL 语句 DO 循环体 LOOP UNTIL条件 b.WHILE 语句 WHILE条件 循环体 WEND

程序框图的画法 在画程序框图时首先要进行结构的选择.若所要解决的问题不需要分情况讨论,只用顺 序结构就能解决;若所要解决的问题要分若干种情况讨论时,就必须引入条件结构;若所要
43

解决的问题要进行许多重复的步骤,且这些步骤之间又有相同的规律时,就必须引入变量, 应用循环结构.

1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)算法只能解决一个问题,不能重复使用.( (2)程序框图中的图形符号可以由个人来确定.( ) ) ) )

(3)输入框只能紧接开始框,输出框只能紧接结束框.(

(4)条件结构的出口有两个,但在执行时,只有一个出口是有效的.( 答案: (1)× (2)× (3)× (4)√ 2.阅读如图的程序框图,若输出的 y=1,则输入的 x 的值可能是( )

A.± 2和 2 C.± 2

B.- 2和 2 D.2
2

解析: 由程序框图可知,当 x>2 时,log2x=1? x=2,舍去;当 x≤2 时,x -1=1,

x=± 2.
答案: C 3.(2014·全国卷Ⅰ)执行下面的程序框图,若输入的 a,b,k 分别为 1,2,3,则输出的

M=(

)

44

20 A. 3 7 C. 2

16 B. 5 15 D. 8

1 3 3 解析: 当 n=1 时,M=1+ = ,a=2,b= ; 2 2 2 2 8 3 8 当 n=2 时,M=2+ = ,a= ,b= ; 3 3 2 3 3 3 15 8 15 当 n=3 时,M= + = ,a= ,b= ; 2 8 8 3 8

n=4 时,终止循环,输出 M= .
答案: D 4.如图是一个算法流程图,则输出的 k 的值是________.

15 8

解析: 根据程序框图可知,k=1 时,1 -1×6+5≤0;k=2 时,2 -2×6+5≤0;k =3 时,3 -3×6+5≤0;k=4 时,4 -4×6+5≤0;k=5 时,5 -5×6+5≤0;k=6 时, 6 -6×6+5>0. 故输出的 k 的值是 6. 答案: 6 5.如图所示的框图,已知集合 A={x|框图中输出的 x 值},集合 B={y|框图中输出的 y
2 2 2 2

2

2

45

值},全集 U=Z,Z 为整数集,则当 x=-1 时,(綂 UA)∩B=________.

解析: 依题意得, 当 x=-1 时, A={0,1,2,3,4,5,6}, B={-3, -1,1,3,5,7,9}, (綂
U

A)∩B={-3,-1,7,9}.
答案: {-3,-1,7,9}

顺序结构与条件结构 自主练透型 1.阅读如图所示的程序框图,若输入的 a,b,c 分别是 21,32,75,则输出的 a,b,c 分别是( )

A.75,21,32 C.32,21,75

B.21,32,75 D.75,32,21

解析: 由程序框图中的各个赋值语句可得 x=21,a=75,c=32,b=21,故 a,b,c 分别是 75,21,32. 答案: A 2.(2014·四川卷)执行如图所示的程序框图,如果输入的 x,y∈R,那么输出的 S 的最 大值为( A.0 C.2 ) B.1 D.3
46

x≥0, ? ? 解析: 当?y≥0, ? ?x+y≤1

时,由线性规划的图解法知,目标函数 S=2x+y 的最大值为

2,否则,S 的值为 1,所以输出的 S 的最大值为 2. 答案: C 顺序结构和条件结构的应用 (1)顺序结构 顺序结构是最简单的算法结构,语句与语句之间、框与框之间是按从上到下的顺序进行 的. (2)条件结构 利用条件结构解决算法问题时,重点是判断框,判断框内的条件不同,对应的下一图框 中的内容和操作要相应地进行变化,故要重点分析判断框内的条件是否满足. 循环结构 分层深化型 (1)(2014·湖南卷)执行如图所示的程序框图,如果输入的 t∈[-2,2],则输出 的 S 属于( )

A.[-6,-2] B.[-4,5]

B.[-5,-1] D.[-3,6]

(2)(2014·山东卷)执行如图所示的程序框图,若输入的 x 的值为 1,则输出的 n 的值为

47

________.

解析:

?2t -2,t∈[-2,0? ? (1)由程序框图可知 S 是分段函数,且 S=? ?t-3,t∈[0,2] ?

2

其值域为(-2,6]∪[-3,-1]=[-3,6],故选 D. (2)1 -4×1+3≤0,x=2,n=1;2 -4×2+3≤0,x=3,n=2;3 -4×3+3≤0,x =4,n=3;4 -4×4+3>0,跳出循环,此时输出 n=3. 答案: (1)D (2)3
2 2 2 2

1.(2014·北京卷)执行如图所示的程序框图,则输出的 S 值为(

)

A.1 C.7 解析: 程序框图运行如下:

B.3 D.15

k=0<3,S=0+20=1,k=1<3;S=1+21=3,k=2<3; S=3+22=7,k=3.输出 S=7.
答案: C 2.(2014·北京西城一模)执行如图所示的程序框图,如果输入 a=2,b=2,那么输出 的 a 值为( )

48

A.4 C.256

B.16 D.log316
2

解析: log32>4 不成立,执行第一次循环,a=2 =4; log34>4 不成立,执行第二次循环,a=4 =16; log316>4=log33 =log381 不成立, 执行第三次循环,a=16 =256; log3256>4=log381 成立,跳出循环体,输出 a 的值为 256,故选 C. 答案: C
2 4 2

1 3.已知某程序框图如图所示,当输入的 x 的值为 5 时,输出的 y 的值恰好是 ,则在空 3 白的赋值框处应填入的关系式可以是( )

A.y=x C.y=3

3

1 B.y=x 3 D.y=3
-x

x

解析: 由程序框图可知,当输入的 x 的值为 5 时,第一次运行,x=5-2=3;第二次 运行,x=3-2=1;第三次运行,x=1-2=-1,此时 x≤0,退出循环,要使输出的 y 的值 1 x 为 ,只有 C 中的函数 y=3 符合要求. 3 答案: C 4. (2014·辽宁沈阳教学质量监测(五))如图所示的程序框图, 则该程序框图表示的算法 功能是( )

49

A.输出使 1×2×4×?×i≥1 000 成立的最小整数 i B.输出使 1×2×4×?×i≥1 000 成立的最大整数 i C.输出使 1×2×4×?×i≥1 000 成立的最大整数 i+2 D.输出使 1×2×4×?×i≥1 000 成立的最小整数 i+2 解析: 该程序框图表示的算法功能是输出使 1×2×4×?×i≥1 000 成立的最小整数

i+2,选 D.
答案: D

5.已知实数 a,b,c 满足 a+b+c=0,a +b +c =1,则 a 的最大值为________.

2

2

2

解析: 因为 a+b+c=0,所以 b+c=-a. 因为 a +b +c =1, 所以-a +1=b +c =(b+c) -2bc=a -2bc, 所以 2a -1=2bc≤b +c =1-a , 2 6 6 6 2 2 所以 3a ≤2,所以 a ≤ ,所以- ≤a≤ .所以 amax= . 3 3 3 3 答案: 6 3 利用循环结构表示算法的步骤 利用循环结构表示算法, 第一要先确定是利用当型循环结构, 还是利用直到型循环结构; 第二要选择准确的表示累计的变量;第三要注意在哪一步开始循环,满足什么条件不再执行 循环体. 基本算法语句 互动讲练型 (2013·陕西卷)根据下列算法语句,当输入 x 为 60 时,输出 y 的值为( )
2 2 2 2 2 2 2 2 2 2 2 2

50

A.25 C.31

B.30 D.61

解析: 由算法语句读出其功能,进一步利用分段函数的解析式求函数值.
? ?0.5x,x≤50, 由题意,得 y=? ?25+0.6?x-50?,x>50. ?

当 x=60 时,y=25+0.6×(60-50)=31. ∴输出 y 的值为 31. 答案: C

下列程序执行后输出的结果是________. i=11 S=1 DO S=S*i i=i-1 LOOP UNTIL i<9 PRINT S END 解析: 程序反映出的算法过程为 i=11? S=11×1,i=10;i=10? S=11×10,i=9;

i=9? S=11×10×9,i=8; i=8<9 退出循环.执行“PRINT S”.
故 S=990. 答案: 990 使用算法语句的注意点 (1)输入、输出语句 在输入、输出语句中加提示信息时,要加引号,变量之间用逗号隔开. (2)赋值语句 左、右两边不能对换,赋值号左边只能是变量.
51

(3)条件语句 条件语句中包含条件语句时,要分清内外条件结构,保证结构完整性. (4)循环语句 分清 WHILE—WEND 和 DO—LOOP UNTIL 的格式不能混用.

A 级 基础训练 1.(2014·重庆卷)执行如图所示的程序框图,若输出 k 的值为 6,则判断框内可填入的 条件是( )

1 A.s> 2 7 C.s> 10

3 B.s> 5 4 D.s> 5

9 9 9 解析: 第一次执行循环:s=1× = ,k=8,s= 应满足条件; 10 10 10 9 8 8 8 第二次执行循环:s= × = ,k=7,s= 应满足条件,排除选项 D;第三次执行循 10 9 10 10 8 7 7 环:s= × = ,k=6,正是输出的结果,故这时程序不再满足条件,结束循环,而选项 10 8 10 A 和 B 都满足条件,故排除 A 和 B,故选 C. 答案: C 2.(2014·河北唐山高三统一考试)执行如图所示的程序框图,则输出的 n 是( )

52

A.4 C.6

B.5 D.7

解析: 由程序框图可知 x=1,a=1,b=1,不满足条件,

n=2,x=0,a=1,b=0,不满足条件, n=3,x=-1,a=0,b=-1,不满足条件, n=4,x=-1,a=-1,b=-1,不满足条件, n=5,x=0,a=-1,b=0,不满足条件, n=6,x=1,a=0,b=1,符合条件,结束循环.
故输出的 n=6. 答案: C 1 1 1 3.(2014·河南三市第一次调研考试)如图给出的是计算 + +?+ 的值的一个程序 2 4 100 框图,则图中判断框内和执行框中应填的语句分别是( )

A.i>100,n=n+1 C.i>50,n=n+2

B.i>100,n=n+2 D.i≤50,n=n+2

1 1 1 解析: 因为 , ,?, 共 50 个数,所以程序框图应运行 50 次,所以变量 i 应满足 2 4 100

i>50,因为是求偶数的倒数和,所以应使变量 n 满足 n=n+2,故选 C.
答案: C 4.(2014·陕西卷)根据如图所示的框图,对大于 2 的整数 N,输出的数列的通项公式是 ( )

53

A.an=2n C.an=2
n

B.an=2(n-1) D.an=2
n-1

解析: 由初始值的特征可知,输出的数列首项为 2,又 ai=2×S,S=ai,i=i+1, ∴

ai+1 n =2,则输出的数列是首项为 2,公比为 2 的等比数列,则通项公式为 an=2 . ai
答案: C 5.给出一个如图所示的程序框图,若要使输入的 x 值与输出的 y 值相等,则这样的 x

值的个数是(

)

A.1 C.3

B.2 D.4

解析: 由程序框图得到如下分段函数:

? ?2x-3,2<x≤5, y=? 1 ? ?x,x>5.
当 x≤2 时,y=x =x,解得 x1=0,x2=1; 当 2<x≤5 时,y=2x-3=x,解得 x=3; 1 当 x>5 时,y= =x,解得 x=±1(舍去),
2

x2,x≤2,

x

故 x 可为 0,1,3.
54

答案: C 6.(2014·湖北七市联合考试)阅读如图所示的程序框图,则输出结果 s 的值为( )

1 A. 2 C. 3 16

1 B. 8 1 D. 16 π ,n=2;s 9

解析: 程序在执行过程中,s,n 的值依次为:s=1,n=1;s=1×cos =1×cos

π 2π π 2π 3π π ×cos , n=3; s=1×cos ×cos ×cos , n=4; s=1×cos ×cos 9 9 9 9 9 9

2π 3π 4π ×cos ×cos ,n=5, 9 9 9 输出 s=1×cos 2sin = π 2π 3π 4π ×cos ×cos ×cos 9 9 9 9

π π 2π 3π 4π ×cos ×cos ×cos ×cos 9 9 9 9 9 1 = . π 16 2sin 9

答案: D 7. (2014·海淀区第二学期期中练习)李强用流程图把早上上班前需要做的事情做了如下 几种方案,则所用时间最少的方案是________. 方案一:

方案二:

方案三:

55

解析: 方案一所用时间为 8+5+13+7+15+6=54.方案二所用时间为 8+15+7=30. 方案三所用时间为 8+13+7=28.所以所用时间最少的是方案三. 答案: 方案三 8.(2014·浙江杭州一模)输入 x=5,运行如图所示的程序之后得到的 y 等于________.

??x+1? ,x<0, ? 解析: y=f(x)=? 2 ? ??x-1? ,x≥0,

2

∴f(5)=(5-1) =16. 答案: 16
?-x,1<x≤4, ? 9.关于函数 f(x)=? ? ?cos x,-1≤x≤1

2

的流程图如图,现输入区间[a,b],则输出的

区间是________.

解析: 由程序框图的第一个判断条件为 f(x)>0, 当 f(x)=cos x, x∈[-1,1]时满足. 然 后进入第二个判断框,需要解不等式 f′(x)=-sin x≤0,即 0≤x≤1.故输出区间为[0,1]. 答案: [0,1] 10.(2014·山东青岛 3 月质量检测)如图是某算法的程序框图,若任意输入[1,19]中的
56

实数 x,则输出的 x 大于 49 的概率为________.

解析: 运行第一次得 x=2x-1,n=2; 运行第二次得 x=2(2x-1)-1=4x-3,n=3; 运行第三次得 x=2(4x-3)-1=8x-7,n=4, 结束循环,输出 8x-7. 19-7 2 由 8x-7>49 得 x>7, 所以当输入的 x∈[1,19]时, 输出的 x 大于 49 的概率为 = . 19-1 3 答案: 2 3 B 级 能力提升 1.(2014·江西卷)阅读如下程序框图,运行相应的程序,则程序运行后输出的结果为 ( )

A.7 C.10

B.9 D.11

1 解析: i=1,S=0,第 1 次运行,S=0+lg =-lg 3>-1;第 2 次运行,i=3,S 3 1 3 1 1 5 1 =lg +lg =lg =-lg 5>-1;第 3 次运行,i=5,S=lg +lg =lg =-lg 7= 3 5 5 5 7 7 1 7 1 -1;第 4 次运行,i=7,S=lg +lg =lg =-lg 9>-1;第 5 次运行,i=9,S=lg 7 9 9 1 9 1 +lg =lg =-lg 11<-1,跳出循环,输出 i=9. 9 11 11 答案: B 2.某程序框图如图所示,则该程序运行后输出的 S 的值为________.

57

解析: 依题意得,运行程序后输出的是数列{an}的第 2 013 项,其中数列{an}满足: 2an,an<1 ? ? a1=1,an+1=?1 an,an≥1 ? ?8 1 1 1 .注意到 a2= ,a3= ,a4= , 8 4 2

a5=1,a6= ,?,
该数列中的项以 4 为周期重复性地出现,且 2 013=4×503+1,因此 a2 013=a1=1,运 行程序后输出的 S 的值为 1. 答案: 1 3. (2014·成都模拟)已知某算法的程序框图如图所示, 若将输出的(x, y)值依次记为(x1,

1 8

y1),(x2,y2),?(xn,yn),?
(1)若程序运行中输出的一个数组是(9,t),求 t 的值; (2)程序结束时,共输出(x,y)的组数为多少?

解析: (1)由程序框图可知,当 x=1 时,y=0; 当 x=3 时,y=-2; 当 x=9 时,y=-4,所以 t=-4. (2)当 n=1 时,输出一对,当 n=3 时,又输出一对,?,当 n=2 009 时,输出最后一
58

对,共输出(x,y)的组数为 1 005. 4.(2014·河南郑州市第二次预测)每年的三月十二日,是中国的植树节.林管部门在植 树前,为保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了 10 株树苗的高度,规定高于 128 厘米的树苗为“良种树苗”,测得高度如下(单位:厘米): 甲:137,121,131,120,129,119,132,123,125,133; 乙:110,130,147,127,146,114,126,110,144,146. (1)根据抽测结果,画出甲、乙两种树苗高度的茎叶图,并根据你填写的茎叶图,对甲、 乙两种树苗的高度作比较,写出对两种树苗高度的统计结论; (2)设抽测的 10 株甲种树苗高度平均值为 x ,将这 10 株树苗的高度依次输入按程序框 图进行运算(如图),问输出的 S 大小为多少?并说明 S 的统计学意义.

解析: (1)茎叶图如图所示: 统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度; ②甲种树苗比乙种树苗长得更整齐; ③甲种树苗高度的中位数为 127,乙种树苗高度的中位数为 128.5; ④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布 较为分散. (2)依题意, x =127,S=35.

59

S 表示 10 株甲种树苗高度的方差,是描述树苗高度的离散程度的量. S 值越小,表示树苗长得越整齐,S 值越大,表示树苗长得越参差不齐.

60


推荐相关:

【数学导航】2016届高考数学大一轮复习 第十章 统计、统计案例与算法初步同步练习 文

【数学导航】2016届高考数学大一轮复习 第十章 统计统计案例与算法初步同步练习 文_数学_高中教育_教育专区。【数学导航】2016 届高考数学大一轮复习 第十章 ...


2017届高考数学大一轮总复习 第十章 统计、统计案例及算法初步 计时双基练70 随机抽样 理

2017届高考数学大一轮总复习 第十章 统计统计案例算法初步 计时双基练70 ...【数学导航】2016届高考... 暂无评价 60页 2下载券 高考数学一轮 知识点各...


2017届高考数学大一轮总复习 统计、统计案例及算法初步 计时双基练72 变量间的相关关系、统计案例 理

2017届高考数学大一轮总复习 统计统计案例算法初步 计时双基练72 变量间的相关关系、统计案例 理_数学_高中教育_教育专区。计时双基练七十二 变量间的相关关系...


2015《创新大课堂》高三人教版数学(理)一轮复习课时作业 第九章 统计、统计案例、算法初步 第一节

2015《创新大课堂》高三人教版数学(理)一轮复习课时作业 第九章 统计统计案例算法初步 第一节_高三数学_数学_高中教育_教育专区。课时作业一、选择题 1.(...


2015《创新大课堂》高三人教版数学(理)一轮复习课时作业 第九章 统计、统计案例、算法初步 第二节

2015《创新大课堂》高三人教版数学(理)一轮复习课时作业 第九章 统计统计案例算法初步 第二节_高三数学_数学_高中教育_教育专区。课时作业一、选择题 1 . ...


2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步、统计、统计案例 第4节]

2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步统计统计案例 第4节]_高中教育_教育专区。2015届高考数学(人教,理科)大一轮配套练透:第10章 算...


【走向高考(新课标)高考数学一轮复习 第九章 算法初步、统计、统计案例 第讲 随机抽样习题-课件

【走向高考(新课标)高考数学轮复习 第九章 算法初步统计统计案例 第讲 随机抽样习题-课件_数学_高中教育_教育专区。2017 高考数学轮复习 第九章 算法初步...


2016高考新课标数学算法初步统计与统计案例 单元质量检测

2016高考新课标数学算法初步统计与统计案例 单元质量检测_高三数学_数学_高中教育_教育专区。第九章单元质量检测时间:90 分钟 分值:100 分 一、选择题(每小题 4 ...


2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步、统计、统计案例 第3节]

2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步统计统计案例 第3节]_高中教育_教育专区。2015届高考数学(人教,理科)大一轮配套练透:第10章 算...


2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步、统计、统计案例 第2节]

2015届高考数学(人教,理科)大一轮配套练透:第10章 算法初步统计统计案例 第2节]_高中教育_教育专区。2015届高考数学(人教,理科)大一轮配套练透:第10章 算...

网站首页 | 网站地图
All rights reserved Powered by 简单学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com