13.2 一元线性回归分析 变量之间存在着某种联系,但又不能用一个函数表达式确切地表示出来,变量之间的这种关系,称为相关关系.回归分析就是处理相关关系的数学方法. 13.2.1 一元线性回归 对于有一定联系的两个变量:X与Y,在试验中得到若干对数据. (x1,y1),…,(xn,yn). 如何获得这两个变量之间的经验公式呢? 例1 某公司研究产量与生产费用之间的关系,从公司内部随机抽取了8个部门作样本,得到数据如下: 将这8对数据都描绘在平面直角坐标系中,这是平面上的8个点,易见这8个点大体在一条带状区域内.故可认为x与y之间有线性关系存在,设有关系式 yabx. (13.2.1) 然而这8个点并不都严格在一条直线上,对同一个xi,由(13.2.1)式就确定一个axib,它与观测值yi之间存在误差i,则 yiabxii,i1,2,…,8. (13.2.2) 其中xi与yi是已知的,a,b,i是未知的,i为误差项,我们的目的就是利用这8对数据求出a,b的值,即得到(13.2.1)式,使误差最小,使用的方法是最小二乘法. 13.2.2 最小二乘法 设实测值为(x1,y1),…,(xn,yn),则式(13.2.2)可改写为 iyiabxi,i=1,2, …,n. 取全部误差的平方和 Q(a,b)(yiabxi)2. (13.2.3) i1in2in由二元函数的极值原理,应有 nQ2(yiabxi)0,ai1 nQ2(yiabxi)xi0.i1b整理 nanbxny, nn2maxbxixiyi.i1i1从中解出a,b的最大值点,记作a,b. b(xix)(yiy)/(xix)2 i1i1nnaybx. 为了方便记忆,引入记号 lxx(xix)xi2nx, i1ni1n2n2lxy(xix)(yiy)xiyinxy. i1i1n于是有 blxy/lxx,aybx. (13.2.4) 确定a,b的方法称为最小二乘法.我们把abx的估计值记作y,于是得到回归方程(或称经验公式) yabx. (13.2.5) 现在我们求例1中的回归直线方程.为了求出a,b,可采用列表的方法计算. 于是可以计算出 x10.5y9.5, blxy/lxx82/781.05, aybx9.51.0510.51.525. 故回归直线方程为 yabx1.52510.5x. 13.2.3 检验与预测 对于任意两个变量的一组观测数据(xi,yi),(i1,2,,n),都可以用最小二乘法形式上求出回归直线方程yabx,于是就产生下面两个问题: 1.回归方程yabx是否总有意义?即自变量x的变化是否真的对因变量y有线性影响? 2.如果回归方程yabx有意义,则可用y来预测y的值,那么y与真实的y有多大的偏差? (1)检验 1.平方和分解 将yiyi称为残差(或剩余), yiyi (回归值)+ (yiyi)(残差) 本文来源:https://www.wddqw.com/doc/bff803ebb90d4a7302768e9951e79b8968026862.html