回归方程怎么做

回归方程怎么做,第1张

回归直线方程指在一组具有相关关系的变量的数据(x与Y)间,一条最好地反映x与y之间的关系直线。

离差作为表示Xi对应的回归直线纵坐标y与观察值Yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。数学表达:Yi-y^=Yi-a-bXi。
总离差不能用n个离差之和来表示,通常是用离差的平方和,即(Yi-a-bXi)^2计算。
要确定回归直线方程①,只要确定a与回归系数b。回归直线的求法通常是最小二乘法:离差作为表示xi对应的回归直线纵坐标y与观察值yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。

回归直线方程指在一组具有相关关系的变量的数据(x与Y)间,一条最好地反映x与y之间的关系直线。

离差作为表示Xi对应的回归直线纵坐标y与观察值Yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。数学表达:Yi-y^=Yi-a-bXi。
总离差不能用n个离差之和来表示,通常是用离差的平方和,即(Yi-a-bXi)^2计算。
要确定回归直线方程①,只要确定a与回归系数b。回归直线的求法通常是最小二乘法:离差作为表示xi对应的回归直线纵坐标y与观察值yi的差,其几何意义可用点与其在回归直线竖直方向上的投影间的距离来描述。

以此题为例讲解:以下是某地搜集到得新房屋的销售价格y和房屋的面积x的数据:\x0d\房屋面积115,110,80,135,105 \x0d\销售价格:248 216 184 292 22\x0d\①求回归方程,并在散点图中加上回归直线; 回归方程 ^y = 18166 + 01962x \x0d\计算过程:\x0d\从散点图(题目有给吧)看出x和y呈线性相关,题中给出的一组数据就是相关变量x、y的总体中的一个样本,我们根据这组数据算出回归方程的两个参数,便可以得到样本回归直线,即与散点图上各点最相配合的直线。\x0d\下面是运用最小二乘法估计一元线性方程^y = a + bx的参数a和b:\x0d\(a为样本回归直线y的截距,它是样本回归直线通过纵轴的点的y坐标;b为样本回归直线的斜率,它表示当x增加一个单位时y的平均增加数量,b又称回归系数)\x0d\首先列表求出解题需要的数据\x0d\ n 1 2 3 4 5 ∑(求和) \x0d\房屋面积 x 115 110 80 135 105 545\x0d\销售价格 y 248 216 184 292 22 116\x0d\ x^2(x的平方) 13225 12100 6400 18225 11025 60975 \x0d\ y^2(y的平方) 61504 46656 33856 85264 484 27568\x0d\ xy 2852 2376 1472 3942 2310 12952\x0d\套公式计算参数a和b:\x0d\ Lxy = ∑xy - 1/n∑x∑y = 308 \x0d\ Lxx = ∑x^2 - 1/n(∑x)^2 = 1570 \x0d\ Lyy = ∑y^2 - 1/n(∑y)^2 = 656 \x0d\ x~(x的平均数) = ∑x/n = 109 \x0d\ y~ = ∑y/n = 232 \x0d\ b = Lxy/Lxx = 0196178344 \x0d\ a = y~ - bx~ = 181656051 \x0d\回归方程 ^y = a + bx \x0d\代入参数得:^y = 18166 + 01962x \x0d\ 直线就不画了 \x0d\ 该题是最基本的一元线性回归分析题,套公式即可解答。至于公式是怎么推导出来的,请参见应用统计学教科书。。回归分析章节。。

第一:用所给样本求出两个相关变量的(算术)平均值:
x_=(x1+x2+x3++xn)/n
y_=(y1+y2+y3++yn)/n 

第二:分别计算分子和分母:(两个公式任选其一)
分子=(x1y1+x2y2+x3y3++xnyn)-nx_Y_
分母=(x1^2+x2^2+x3^2++xn^2)-nx_^2

第三:计算  b   :   b=分子  /  分母

用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零,得方程组解为

其中 ,且为观测值的样本方差线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线顺便指出,将来还需用到,其中为观测值的样本方差

先求x,y的平均值X,Y

再用公式代入求解:b=(x1y1+x2y2+xnyn-nXY)/(x1+x2+xn-nX)

后把x,y的平均数X,Y代入a=Y-bX

求出a并代入总的公式y=bx+a得到线性回归方程

(X为xi的平均数,Y为yi的平均数)

扩展资料

分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。

如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

参考资料:

线性回归方程的百度百科

回归线方程式求法如下:

线性回归方程公式:b=(x1y1+x2y2+xnyn-nXY)/(x1+x2+xn-nX)。线性回归方程是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,应用十分广泛。

一、概念

线性回归方程中变量的相关关系最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点,将散布在某一直线周围。因此,可以认为关于的回归函数的类型为线性函数。

分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示。

这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

二、计算方法

线性回归方程公式求法:

第一:用所给样本求出两个相关变量的(算术)平均值:

x_=(x1+x2+x3++xn)/n

y_=(y1+y2+y3++yn)/n

第二:分别计算分子和分母:(两个公式任选其一)

分子=(x1y1+x2y2+x3y3++xnyn)-nx_Y_

分母=(x1^2+x2^2+x3^2++xn^2)-nx_^2

第三:计算b:b=分子/分母

用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零,得方程组解为

其中,且为观测值的样本方差线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线顺便指出,将来还需用到,其中为观测值的样本方差。

先求x,y的平均值X,Y

再用公式代入求解:b=(x1y1+x2y2+xnyn-nXY)/(x1+x2+xn-nX)

后把x,y的平均数X,Y代入a=Y-bX

求出a并代入总的公式y=bx+a得到线性回归方程

(X为xi的平均数,Y为yi的平均数)

三、应用

线性回归方程是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。

线性回归有很多实际用途。分为以下两大类:

如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。

给定一个变量y和一些变量X1,,Xp,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的Xj,并识别出哪些Xj的子集包含了关于y的冗余信息。

在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。

计算方法:

y = Ax + B:a = sigma[(yi-y均值)(xi-x均值)] / sigma[(xi-x均值)的平方];b = y均值 - ax均值。

知识拓展

最小二乘法求回归直线方程的推导过程

这里的是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为观察值),当x取值(i=1,2,3……n)时,Y的观察值为,近似值为(或者说对应的纵坐标是)。
其中式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程,我们只需确定a与回归系数b即可。
设x,Y的一组观察值为:
i = 1,2,3……n
其回归直线方程为:
当x取值(i=1,2,3……n)时,Y的观察值为,差刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,见下图:

实际上我们希望这n个离差构成的总离差越小越好,只有如此才能使直线最贴近已知点。换句话说,我们求回归直线方程的过程其实就是求离差最小值的过程。
一个很自然的想法是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:
一般做法是我们用离差的平方和,即:

作为总离差 ,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法。
用最小二乘法求回归直线方程中的a、b的公式如下:
其中,、为和的均值,a、b的上方加“︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。
当然,我们肯定不能满足于直接得到公式,我们只有理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:

接着是第二个公式:

基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:

至此,公式变形部分结束,从最终式子我们可以看到后两项

与a、b无关,属于常数项,我们只需

即可得到最小的Q值,因此:

(1)用所给样本求出两个相关变量的(算术)平均值: x_=(x1+x2+x3++xn)/n y_=(y1+y2+y3++yn)/n ;(2)分别计算分子和分母:(两个公式任选其一) 分子=(x1y1+x2y2+x3y3++xnyn)-nx_Y_ 分母=(x1^2+x2^2+x3^2++xn^2)-nx_^2 3)来计算 b。

:线性回归方程是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一。  线性回归也是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。按自变量个数可分为一元线性回归分析方程和多元线性回归分析方程。

b=分子  /  分母  用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零,得方程组解。其中 ,且为观测值的样本方差线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线顺便指出,将来还需用到,其中为观测值的样本方差。

     
     

线性回归方程模型:1、线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在回归中最小化最小二乘损失函数的乘法。2、相反,最小二乘逼近可以用来拟合那些非线性的模型。因此,尽管最小二乘法和线性模型是紧密相连的,但他们是不能划等号的。

     
     

线性回归方程的求法:

第一:用所给样本求出两个相关变量的(算术)平均值

第二:分别计算分子和分母

第三:计算b:b=分子/分母用最小二乘法估计参数b,设服从正态分布,分别求对a、b的偏导数并令它们等于零。先求x,y的平均值X,Y。再用公式代入求解:b=(x1y1+x2y2+xnyn-nXY)/(x1+x2+xn-nX)。后把x,y的平均数X,Y代入a=Y-bX。求出a并代入总的公式y=bx+a得到线性回归方程(X为xi的平均数,Y为yi的平均数)

     
     

个人建议:线性回归是利用数理统计中的回归分析来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,是变量间的相关关系中最重要的一部分,主要考查概率与统计知识,考察学生的阅读能力、数据处理能力及运算能力,题目难度中等,应用广泛


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13017956.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存