一、选择题 1.下列两个变量具有相关关系的是( A.正方体的体积与边长 B.匀速行驶的车辆的行驶距离与行驶时间 C.人的身高与体重 D.人的身高与视力 【解析】 系. 【答案】 C A、B 是函数关系,D 无相关关系.相关关系是一种不确定的关 )
2.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则 y 与 x 之间的 回归直线方程为( A.y=x+1 C.y=2x+1 【解析】 x= ) B.y=x+2 D.y=x-1 1+2+3+4 5 2+3+4+5 7 = , y = =2. 4 2 4
因为回归直线一定过点( x , y ),所以 A 项符合要求. 【答案】 A
3.设(x1,y1),(x2,y2),…,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是 由这些样本点通过最小二乘法得到的线性回归直线(如图 1-1-1),以下结论正 确的是( )
图 1-1-1 A.直线 l 过点( x , y )
B.x 和 y 的相关系数为直线 l 的斜率 C.x 和 y 的相关系数在 0 到 1 之间 D.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 【解析】 由样本的中心( x , y )落在回归直线上可知 A 正确;x 和 y 的相 关系数表示为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 B 错;x 和 y 的相关系数应在-1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数 并不绝对平均,无论样本点个数是奇数还是偶数,故 D 错. 【答案】 A
4.为了考查两个变量 x 和 y 之间的线性相关性,甲、乙两名同学各自独立 地做了 10 次试验和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1 和 l2.已知两个人在试验中发现对变量 x 的观测数据的平均数都为 s,对变量 y 的 观测数据的平均数都为 t,那么下列说法中正确的是( A.直线 l1 和 l2 都过点(s,t) B.直线 l1 和 l2 相交,但交点不一定是(s,t) C.直线 l1 和 l2 必平行 D.直线 l1 和 l2 必重合 【解析】 (s,t). 【答案】 A 线性回归方程 y=bx+a 恒过点( x , y ),故直线 l1 和 l2 都过点 )
5.若已知∑(xi- x )2 是∑(yi- y )2 的两倍,∑(xi- x )(yi- y )是∑(yi- y )2 的 1.2 倍,则相关系数 r 的值是( 2 A.1.2 C.0.92 ) B. 1.2 2
D.0.65
? ?xi- x ??yi- y ?
【解析】 由题意知 r=
i=1 n n
n
? ?xi- x ?2 ? ?yi- y ?2
i=1 i=1
1.2 ? ?yi- y ?2 =
n i=1 i =1 n
n
=
i=1
2 ? ?yi- y ?2· ? ?yi- y ?2
1.2 . 2
【答案】 二、填空题
B
6.已知变量 y 对 x 的线性回归方程为 y=-0.81+0.50x,则当 x=25 时,y 的估计值为________. 【解析】 【答案】 当 x=25 时,y 的估计值为-0.81+0.50×25=11.69. 11.69
7.某单位为了了解用电量 y(度)与气温 x(℃)之间的关系,随机统计了某 4 天的用电量与当天气温,并制作了对照表: 气温(℃) 用电量(度) 18 24 13 34 10 38 -1 64
由表中数据得线性回归方程 y=bx+a 中 b=-2, 预测当天气温为-4 ℃时, 用电量约为________. 【解析】 ∵x= 18+13+10-1 =10, 4
y=
24+34+38+64 =40,y=-2x+a 过(10,40), 4
∴a=40+2×10=60,∴y=-2x+60. 当 x=-4 时,y=-2×(-4)+60=68. 【答案】 68 度
8.若回归直线方程中的回归系数 b=0,则相关系数 r=________. 【解析】
n i=1 n
对比线性相关系数和线性回归方程系数 b 的求解公式: r =
n
∑ xiyi-n x
n
y 和 b= y ?
2
i=1
∑ xiyi-n x
n
y , 可以发现其分子相同, 故b
2
? ∑ xi2-n i=1
x
2
?? ∑ yi2-n i =1
∑ x2 i -n i=1
x
=0,可推得 r=0. 【答案】 三、解答题 9.某连锁经营公司所属的 5 个零售店某月的销售额和利润情况如下表: 0
商店名称 销售额 x/千万元 利润 y/百万元
A 3 2
B 5 3
C 6 3
D 7 4
E 9 5
判断销售额与利润是否具有相关性;若销售额和利润具有线性相关关系,用 最小二乘法计算利润 y 对销售额 x 的线性回归方程.(判断相关性利用两种方法) 【解】 判断相关性先利用散点图大体观察是否具有相关性,散点图如下:
通过散点图可知, 两个变量具有相关性,下面通过计算再次明确是否具有相 关性(根据上表数据,可以算出: x =6, y =3.4),其他数据见下表:
xi A B C D 3 5 6 7
yi 2 3 3 4
xi2 9 25 36 49
yi2 4 9 9 16
xiyi 6 15 18 28
E 合计 进而可求得 r=
9 30
5 17
81 200
25 63
45 112
112-5×6×3.4 200-5×62
≈0.98,相关系数非常接近 1, 63-5×3.42 112-5×6×3.4 200-5×62 =0.5,a=3.4-0.5×6
因此两个变量具有显著的线性相关性,b=
=0.4,故所求线性回归方程为 y=0.5x+0.4. 10. 某小卖部为了解雪糕销售量与气温之间的关系,随机统计并制作了卖出 雪糕数与当天气温的对照表: 气温 x(℃) 卖出雪糕数 y(根) 20 16 23 24 25 30 27 34 29 38 31 42 34 50 35 64
求出线性回归方程,并预测气温为 37 ℃时卖出雪糕的数量. 【解】
8
由表中数据可得:
8
?xi2=6 466, ?xiyi=8 884, x =28, y =37.25,
i=1 i =1
进而可以求得
?xiyi-8 x
b=
i=1
8
y
?xi2-8 x 2
i =1
8
=
8 884-8×28×37.25 6 466-8×282
≈2.78,
a= y -b x ≈37.25-2.78×28=-40.59. ∴线性回归方程为 y=-40.59+2.78x. 把 x=37 代入,得 y≈62,
∴预测气温为 37 ℃时,卖出雪糕的数量约为 62 根. 11.某种图书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据 如下:
x y
1 10.15
2 5.52
3 4.08
5 2.85
10 2.11
20 1.62
30 1.41
50 1.30
100 1.21
200 1.15
1 检测每册书的成本费 y 与印刷册数的倒数x 之间是否具有线性相关关系,如 有,求出 y 对 x 的回归方程. 【解】 1 首先作变量转换 u=x,题目所给数据变成如下表所示的数据:
i ui yi
1 1 10.15
2 0.5 5.52
3 0.33 4.08
10 i=1 10 i=1
4 0.2 2.85
5 0.1 2.11
6 0.05 1.62
7 0.03 1.41
8 0.02 1.30
9 0.01 1.21
10 0.005 1.15
∑ ?ui- u ??yi- y ?
10 i=1
可以求得,r=
≈0.999 8.
∑ ?ui- u ?2 ∑ ?yi- y ?2
因此,变量 y 与 u 之间具有较强的线性相关关系. 1 8.973 经计算得 b≈8.973,a≈1.125,最后回代 u=x可得,y=1.125+ x .