tceic.com
学霸学习网 这下你爽了
赞助商链接
当前位置:首页 >> 数学 >>

2 回归分析例题习题


第二讲 回归分析例、习题

2013-7-19

数理统计应用

1

统计工具箱中的回归分析命令

1、多元线性回归
2、多项式回归 3、非线性回归 4、逐步回归

2013-7-19

数理统计应用

2

多元线性回归
y ? ? 0 ? ?1 x1 ? ... ? ? p x p

1、确定回归系数的点估计值:

b=regress( Y, X )
? Y1 ? ?Y ? Y ? ? 2? ? ... ? ? ? ?Yn ?

? ??0 ? ? ? ? ? b?? 1? ? ... ? ? ? ? ?? p ? ? ?

? 1 x11 ?1 x 21 X ?? ?... ... ? ? 1 x n1 ?

x12 x 22 ... xn 2

x1 p ? ... x 2 p ? ? ... ... ? ? ... x np ? ? ...

对一元线性回归,取 p=1 即可

2013-7-19

数理统计应用

3

2、求回归系数的点估计和区间估计、并检验回归模型: [b, bint,r,rint,stats]=regress(Y,X,alpha)
回 归 系 数 的 区 间 估 计 残 差 置 信 区 间 用于检验回归模型的统计量, 有三个数值:相关系数r2、 F值、与F对应的概率p ( 缺 省显 时著 为性 0 水 平 05 )

.

相关系数 r2 越接近 1,说明回归方程越显著; F > F1-α (k,n-k-1)时拒绝 H0,F 越大,说明回归方程越显著; 与 F 对应的概率 p? ? 时拒绝 H0 ,回归模型成立.

3、画出残差及其置信区间:
2013-7-19

rcoplot(r,rint)
4

数理统计应用

例1 测16名成年女子的身高与腿长所得数据如下:
身高 腿长
143 88 145 85 146 88 147 91 149 92 150 93 153 93 154 95 155 96 156 98 157 97 158 96 159 98 160 99 162 100 164 102

以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102 100 98 96 94 92 90 88 86 84 140 145 150 155 160 165

y ? ? 0 ? ?1 x ? ?

2013-7-19

散点图

数理统计应用

5

例1 解:1、输入数据: x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]'; X=[ones(16,1) x]; Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]'; 2、回归分析及检验: [b,bint,r,rint,stats]=regress(Y,X) b,bint,stats
得结果:b = -16.0730 0.7194 stats = 0.9282 180.9531 0.0000 的置信区间为[0.6047,0.834];
? ? ? ? ? 即 ? 0 ? ?16.073, ? 1 ? 0.7194 ; ? 0 的置信区间为[-33.7017,1.5612],1

To MATLAB(liti11)
1.5612

bint = -33.7071 0.6047 0.8340

r2=0.9282, F=180.9531, p=0.0000 p<0.05, 可知回归模型 y=-16.073+0.7194x 成立.
2013-7-19 数理统计应用 6

3、残差分析,作残差图: rcoplot(r,rint) 从残差图可以看出,除第二个数据外,其余数据的残 差离零点均较近,且残差的置信区间均包含零点,这说明 回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第 二个数据可视为异常点.
Residual Case Order Plot 4

4、预测及作图: z=b(1)+b(2)*x plot(x,Y,'k+',x,z,'r')

3 2 1
Residuals

0 -1 -2 -3 -4 -5 2 4 6 8 10 Case Number 12 14 16

To MATLAB(liti12)
2013-7-19 数理统计应用 7

多项式回归 (一)一元多项式回归 y=a1xm+a2xm-1+…+amx+am+1 1、回归: (1)确定多项式系数的命令:[p,S]=polyfit(x,y,m) 其中 x=(x1,x2,?,xn) ,y=(y1,y2,?,yn) ; p=(a1,a2,?,am+1)是多项式 y=a1xm+a2xm-1+?+amx+am+1 的系数;S 是一个矩阵,用来估计预测误差. (2)一元多项式回归命令:polytool(x,y,m) 2、预测和预测误差估计: (1)Y=polyval(p,x)求polyfit所得的回归多项式在x处 的预 测值Y; (2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得 的回归多项式在x处的预测值Y及预测值的显著性为1alpha的置信区间Y? DELTA;alpha缺省时为0.5.
2013-7-19 数理统计应用 8

例 2 观测物体降落的距离 s 与时间 t 的关系,得到数据如下表,求 s 2 ? 关于 t 的回归方程 s ? a ? bt ? ct .
t s t s (s) (cm) (s) (cm) 1/30 11.86 8/30 61.49 2/30 15.67 9/30 72.90 3/30 20.60 10/30 85.44 4/30 26.69 11/30 99.08 5/30 33.71 12/30 113.77 6/30 41.93 13/30 129.54 7/30 51.13 14/30 146.48

法一 直接作二次多项式回归: t=1/30:1/30:14/30; s=[11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48]; [p,S]=polyfit(t,s,2) To MATLAB(liti21) 得回归模型为 : ? s ? 489 .2946 t 2 ? 65.8896 t ? 9.1329
2013-7-19 数理统计应用 9

法二 化为多元线性回归: To MATLAB(liti22) t=1/30:1/30:14/30; s=[11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48]; T=[ones(14,1) t' (t.^2)']; [b,bint,r,rint,stats]=regress(s',T); b,stats 得回归模型为 : ? s ? 9.1329 ? 65.8896 t ? 489 .2946 t 2

预测及作图
Y=polyconf(p,t,S) plot(t,s,'k+',t,Y,'r')
2013-7-19

To MATLAB(liti23)

数理统计应用

10

(二)多元二项式回归
命令:rstool(x,y,’model’, alpha) n?m矩阵 n维列向量

显著性水平 (缺省时为0.05)

由下列 4 个模型中选择 1 个(用字符串输入,缺省时为线性模型): linear(线性): y ? ? 0 ? ? 1 x1 ? ? ? ? m x m purequadratic(纯二次): interaction(交叉): y ?

y ? ? 0 ? ? 1 x1 ? ? ? ? m x m ? ? ? jj x 2 j
j ?1

n

? 0 ? ? 1 x1 ? ? ? ? m x m ?

1? j ? k ? m

?

? jk x j x k ? jk x j x k

quadratic(完全二次): y ?

? 0 ? ? 1 x1 ? ? ? ? m x m ?

1? j , k ? m

?

2013-7-19

数理统计应用

11

例3 设某商品的需求量与消费者的平均收入、商品价格的统计数 据如下,建立回归模型,预测平均收入为1000、价格为6时 的商品需求量.
需求量 收入 价格 100 1000 5 75 600 7 80 1200 6 70 500 6 50 300 8 65 400 7 90 1300 5 100 1100 4 110 1300 3 60 300 9

2 2 选择纯二次模型,即 y ? ? 0 ? ?1 x1 ? ? 2 x 2 ? ? 11 x1 ? ? 22 x 2

法一 直接用多元二项式回归: x1=[1000 600 1200 500 300 400 1300 1100 1300 300]; x2=[5 7 6 6 8 7 5 4 3 9]; y=[100 75 80 70 50 65 90 100 110 60]'; x=[x1' x2']; rstool(x,y,'purequadratic')

2013-7-19

数理统计应用

12

在左边图形下方的方框中输入1000,右边图形下方的方框中输入6。 则画面左边的“Predicted Y”下方的数据变为88.47981,即预测 出平均收入为1000、价格为6时的商品需求量为88.4791. 在画面左下方的下拉式菜单中选”all”, 则beta、rmse和residuals都 传送到Matlab工作区中.

2013-7-19

数理统计应用

13

在Matlab工作区中输入命令: beta, rmse
得结果:beta = 110.5313 0.1464 -26.5709 -0.0001 1.8475 rmse = 4.5362
2 x2 故回归模型为: y ? 110.5313? 0.1464x1 ? 26.5709x 2 ? 0.0001 1 ? 1.8475x 2

剩余标准差为 4.5362, 说明此回归模型的显著性较好.

To MATLAB(liti31)

2013-7-19

数理统计应用

14

法二
2 2 y ? ? 0 ? ? 1 x1 ? ? 2 x 2 ? ? 11 x1 ? ? 22 x 2 将 化为多元线性回归: X=[ones(10,1) x1' x2' (x1.^2)' (x2.^2)']; [b,bint,r,rint,stats]=regress(y,X); b,stats To MATLAB(liti32) 结果为: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 返回 0.9702 40.6656 0.0005
2013-7-19 15

数理统计应用

非线性回 归 1、回归:

是事先用m-文件定 义的非线性函数

(1)确定回归系数的命令: [beta,r,J]=nlinfit(x,y,’model’, beta0) 估计出的 回归系数 残差 输入数据x、y分别为 n? m矩阵和n维列向 量,对一元非线性回 归,x为n维列向量。 回归系数 的初值

Jacobian矩阵

(2)非线性回归命令:nlintool(x,y,’model’, beta0,alpha) 2、预测和预测误差估计: [Y,DELTA]=nlpredci(’model’, x,beta,r,J) 求nlinfit 或nlintool所得的回归函数在x处的预测值Y及预测值的显 著性为1-alpha的置信区间Y ? DELTA.
2013-7-19 数理统计应用 16

例4 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表:
使用次数 2 3 4 5 6 7 8 9 增大容积 6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99 使用次数 10 11 12 13 14 15 16 增大容积 10.49 10.59 10.60 10.80 10.60 10.90 10.76

2013-7-19

数理统计应用

17

11 10.5 10 9.5 9 8.5 8 7.5 7 6.5 6 2 4 6 8 10 12 14 16

散 点 图

此即非线性回归或曲线回归 问题(需要配曲线) 配曲线的一般方法是:
先对两个变量 x 和 y 作 n 次试验观察得 ( x i , y i ), i ? 1,2,..., n 画出散点图, 根据散点图确定须配曲线的类型.然后由 n 对试验数据确定每一类曲线的未知 参数 a 和 b.采用的方法是通过变量代换把非线性回归化成线性回归,即采用 非线性回归线性化的方法.
2013-7-19 数理统计应用 18

通常选择的六类曲线如下:
1 b (1)双曲线 ? a ? y x
x (2)幂函数曲线 y=a b , 其中 x>0,a>0

(3)指数曲线 y=a e bx 其中参数 a>0.
b/ x (4)倒指数曲线 y=ae 其中 a>0,

(5)对数曲线 y=a+blogx,x>0

(6)S 型曲线 y ?

1 a ? be ? x

eb / x 解例 2.由散点图我们选配倒指数曲线 y=a

? ? 根据线性化方法,算得 b ? ?1.1107 , A ? 2.4587

返回
2013-7-19

由此

? a ? e A ? 11 .6789
? 1.1107 x

?

最后得 y ? 11 .6789 e 数理统计应用

19

1、对将要拟合的非线性模型 y=ae b / x ,建立 m-文件 volum.m 如下: function yhat=volum(beta,x) yhat=beta(1)*exp(beta(2)./x);

2、输入数据: x=2:16; y=[6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76]; beta0=[8 2]'; To MATLAB(liti41) 3、求回归系数: [beta,r ,J]=nlinfit(x',y','volum',beta0); beta 即得回归模型为: 得结果:beta = 1.10641 11.6036 ? y ? 11.6036 e x -1.0641
2013-7-19 数理统计应用

20

4、预测及作图: [YY,delta]=nlpredci('volum',x',beta,r ,J); plot(x,y,'k+',x,YY,'r') To MATLAB(liti42)

2013-7-19

数理统计应用

21

例5 财政收入预测问题:财政收入与国民收入、工业总产值、 农业总产值、总人口、就业人口、固定资产投资等因素有关。 下表列出了1952-1981年的原始数据,试构造预测模型。

解 设国民收入、工业总产值、农业总产值、总人口、就业 人口、固定资产投资分别为x1、x2、x3、x4、x5、x6,财政收 入为y,设变量之间的关系为: y= ax1+bx2+cx3+dx4+ex5+fx6 使用非线性回归方法求解。

2013-7-19

数理统计应用

22

1. 对回归模型建立M文件model.m如下: function yy=model(beta0,X) a=beta0(1); b=beta0(2); c=beta0(3); d=beta0(4); e=beta0(5); f=beta0(6); x1=X(:,1); x2=X(:,2); x3=X(:,3); x4=X(:,4); x5=X(:,5); x6=X(:,6); yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;
2013-7-19 数理统计应用 23

2. 主程序liti6.m如下: X=[598.00 349.00 461.00 57482.00 20729.00 44.00 ………………………………………………………….. 2927.00 6862.00 1273.00 100072.0 43280.00 496.00]; y=[184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00 ... 271.00 230.00 266.00 323.00 393.00 466.00 352.00 303.00 447.00 ... 564.00 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00 ... 890.00 826.00 810.0]'; beta0=[0.50 -0.03 -0.60 0.01 -0.02 0.35]; betafit = nlinfit(X,y,'model',beta0) To MATLAB(liti6)
2013-7-19 数理统计应用 24

结果为:

betafit = 0.5243 -0.0294 -0.6304 0.0112 -0.0230 0.3658

即y= 0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230x5+0.3658x6

2013-7-19

数理统计应用

25

逐步回归

显著性水平(缺省时为0.5)

逐步回归的命令是: stepwise(x,y,inmodel,alpha)
自变量数据, n? m 阶矩阵

因变量数据, n ?1 阶矩阵

矩阵的列数的指标,给出初 始模型中包括的子集(缺省 时设定为全部自变量)

运行stepwise命令时产生三个图形窗口:Stepwise Plot, Stepwise Table,Stepwise History. 在Stepwise Plot窗口,显示出各项的回归系数及其置信区间.

Stepwise Table 窗口中列出了一个统计表,包括回归系数及 其置信区间,以及模型的统计量剩余标准差(RMSE)、相关系 数(R-square)、F值、与F对应的概率P.

2013-7-19

数理统计应用

26

例6 水泥凝固时放出的热量y与水泥中4种化学成分x1、x2、x3、 x4 有关,今测得一组数据如下,试用逐步回归法确定一个 线性模 型.
序号

1 7 26 6 60
78.5

2 1 29 15 52
74.3

3 11 56 8 20
104.3

4 11 31 8 47
87.6

5 7 52 6 33
95.9

6 11 55 9 22
109.2

7 3 71 17 6
102.7

8 1 31 22 44
72.5

9 2 54 18 22
93.1

10 21 47 4 26
115.9

11 1 40 23 34
83.8

12 11 66 9 12
113.3

13 10 68 8 12
109.4

x1 x2 x3 x4
y

1、数据输入: x1=[7 1 11 11 7 11 3 1 2 21 1 11 10]'; x2=[26 29 56 31 52 55 71 31 54 47 40 66 68]'; x3=[6 15 8 8 6 9 17 22 18 4 23 9 8]'; x4=[60 52 20 47 33 22 6 44 22 26 34 12 12]'; y=[78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4]'; x=[x1 x2 x3 x4];
2013-7-19 数理统计应用 27

2、逐步回归: (1)先在初始模型中取全部自变量: stepwise(x,y) 得图Stepwise Plot 和表Stepwise Table 图Stepwise Plot中四条直线都是虚 线,说明模型的显著性不好 从表Stepwise Table中看出变 量x3和x4的显著性最差.

2013-7-19

数理统计应用

28

(2)在图Stepwise Plot中点击直线3和直线4,移去变量x3和x4 移去变量x3和x4后模型具有显著性.

虽然剩余标准差(RMSE)没 有太大的变化,但是统计量F的 值明显增大,因此新的回归模型 更好.

To MATLAB(liti51)
2013-7-19 数理统计应用 29

(3)对变量y和x1、x2作线性回归: X=[ones(13,1) x1 x2]; To MATLAB(liti52) b=regress(y,X) 得结果:b = 52.5773 1.4683 0.6623 故最终模型为:y=52.5773+1.4683x1+0.6623x2

2013-7-19

数理统计应用

30

1、考察温度x对产量y的影响,测得下列10组数据:
温度(℃) 20 产量(kg) 13.2 25 15.1 30 16.4 35 17.1 40 17.9 45 18.7 50 19.6 55 21.2 60 22.5 65 24.3

求y关于x的线性回归方程,检验回归效果是否显著,并预测 x=42℃时产量的估值及预测区间(置信度95%). 2、某零件上有一段曲线,为了在程序控制机床上加工这一零 件,需要求这段曲线的解析表达式,在曲线横坐标xi处测得纵 坐标yi共11对数据如下:
xi yi 0 0.6 2 2.0 4 4.4 6 7.5 8 11.8 10 17.1 12 23.3 14 31.2 16 39.6 18 49.7 20 61.7

求这段曲线的纵坐标y关于横坐标x的二次多项式回归方程.
2013-7-19 数理统计应用 31

3、 在研究化学动力学反应过程中,建立了一个反应速度和反应物 x3 ?1 x2 ? ?5 含量的数学模型,形式为 y ? 1 ? ? 2 x1 ? ? 3 x 2 ? ? 4 x 3 其中 ? 1 , ? , ? 5 是未知参数,x1 , x 2 , x3 是三种反应物(氢,n 戊烷, 异构戊烷)的含量,y 是反应速度.今测得一组数据如表 4,试由 此确定参数 ? 1 , ? , ? 5 ,并给出置信区间.? 1 , ? , ? 5 的参考值为 (1,0.05, 0.02, 0.1, 2).
序号 反应速度 y 1 8.55 2 3.79 3 4.82 4 0.02 5 2.75 6 14.39 7 2.54 8 4.35 9 13.00 10 8.50 11 0.05 12 11.32 132013-7-19 3.13 氢 x1 n 戊烷 x2 470 300 285 80 470 300 470 80 470 80 100 190 100 80 470 190 100 300 100 300 100 80 285 300 285 数理统计应用 190 异构戊烷 x3 10 10 120 120 10 10 65 65 54 120 120 10 120

32

4、混凝土的抗压强度随养护时间的延长而增加,现将一批 混凝土作成12个试块,记录了养护日期x(日)及抗压强度y (kg/cm2)的数据:
养护时间 x 抗压强度 y

2 35

3 42

4 47

5 53

7 59

9 65

12 68

14 73

17 76

21 82

28 86

56 99

? 试求 y ? a ? b ln x 型回归方程.

2013-7-19

数理统计应用

33



推荐相关:

多元回归分析习题

第四章回归分析习题 1页 2下载券喜欢此文档的还喜欢 影响铁路客运量的因素分... 10页 2下载券多​元​回​归​分​析​习​题 ...


回归分析SPSS习题答案

1/2 相关文档推荐 回归分析SPSS习题 2页 10财富值 回归分析例题SPSS求解过程 ...1. 解: (1)变量间的相关性分析 利用 SPSS 软件构造所有变量的散点图矩阵和...


应用回归分析试题(2套)

应用回归分析试题(2套)_数学_高中教育_教育专区。应用回归复习试题 应用回归分析试题(一)一、选择题.(每题 3 分,共 15 分)题号 答案 1 2 3 4 5 1、...


应用回归分析试题(二)

应用回归分析试题()_数学_高中教育_教育专区。应用回归分析试题()一、选择题 1. 在对两个变量 x , y 进行线性回归分析时,有下列步骤: y ①对所求出的...


回归分析习题

回归分析习题_理学_高等教育_教育专区。选修 2-3 一、选择题 1.有下列说法: 3.1 回归分析的基本思想及其初步应用 ①线性回归分析就是由样本点去寻找一条直线贴近...


人教A版选修【2-3】3.1.2《回归分析的应用》习题及答案

人教A版选修【2-3】3.1.2回归分析的应用》习题及答案_数学_高中教育_教育专区。数学· 选修 2-3(人教 A 版) 统计案例 3.1.2 回归分析的应用 一、选择题...


回归分析SPSS习题

与其余 6 个变量的线性回归方程; ②求出拟合优度 r 2 、σ 2 的无偏估计...回归分析SPSS习题答案 15页 免费 SPSS练习题及解答 5页 免费 回归分析练习题(...


高二文数学回归分析测试题

回归分析测试题 一、 选择题: 1.炼钢时钢水的含碳量与冶炼时间有( ) A.确定性关系 B.相关关系 C.函数关系 D.无任何关系 2.对相关性的描述正确的是( )...


应用回归分析_第6章课后习题答案 2

应用回归分析_第6章课后习题答案 2 应用回归分析应用回归分析隐藏>> 第6章 6.1 试举一个产生多重共线性的经济实例。 答: 例如有人建立某地区粮食产量回归模型...


应用回归分析试卷

(6 分) 应用回归分析试题()一、选择题 1. 某同学由 x 与 y 之间的一组数据求得两个变量间的线性回归方程为 y ? bx ? a ,已知: 数据 x 的平均值...

网站首页 | 网站地图
All rights reserved Powered by 学霸学习网 www.tceic.com
copyright ©right 2010-2021。
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@126.com