根据道客巴巴资料,残差图帮助我们诊断回归效果与样本数据的质量,并检查模型是否满足基本假设,可以通过绘制标准化残差序列的带正态曲线的直方图或累计概率图来分析,确定残差是否接近正态。
残差图是以某种残差为纵坐标,以其他适宜的两位横坐标的散点图。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。它应符合模型的假设条件,且具有误差的一些性质。利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性称为残差分析。残差有多种形式,上述为普通残差。为了更深入地研究某一自变量与因变量的关系,人们还引进了偏残差。此外, 还有学生化残差、预测残差等。以某种残差为纵坐标,其它变量为横坐标作散点图,即残差图 ,它是残差分析的重要方法之一。通常横坐标的选择有三种:(1) 因变量的拟合值;(2)自变量;(3)当因变量的观测值为一时间序列时,横坐标可取观测时间或观测序号。残差图的分布趋势可以帮助判明所拟合的线性模型是否满足有关假设。如残差是否近似正态分布、是否方差齐次,变量间是否有其它非线性关系及是否还有重要自变量未进入模型等。当判明有某种假设条件欠缺时, 进一步的问题就是加以校正或补救。需分析具体情况,探索合适的校正方案,如非线性处理,引入新自变量,或考察误差是否有自相关性。
在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ表示。
δ遵从标准正态分布N(0,1)。实验点的标准化残差落在(-2,2)区间以外的概率≤005。若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归直线拟合。
显然,有多少对数据,就有多少个残差。残差分析就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰。
扩展资料:
其内容一般包括:异常值检验、方差齐性检验、误差的正态性检验、相关性检验以及相伴随的方差稳定化变换,正态化变换等修正方法。
若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。显然,有多少对数据,就有多少个残差。
参考资料来源:百度百科-残差
计算学生化残差要用到标准化残差
标准化残差是指内部的残差为了减少内部差异性(unconstant variance)而标准化的残差,便于观察其标准化后的残差做出相应的模型假设判断(model fitting assumptions [SLM/MLM/GLM/GAM])Guassian : residuals 1, normality; 2, constant variance; 3, independnt (no autocorrelation) [time series or spatial case]; 3, mean equals to zero (从图中判断就是randomly around zero line, no clear pattern)
学生化的目的是为了减少outliers (influential point)对模型拟合后的残差带来的影响。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)