可决系数计算公式:R2=SSR/SST。
可决系数的计算式:回归平方和(ESS)在总变差(TSS)中所占的比重称为可决系数,可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。
可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数小,说明模型对样本观测值的拟合程度越差。
特点:
1.可决系数是非负的统计量。
2.可决系数的取值范围:0<=R^2<=1。
3.可决系数是样本观测值的函数,可决系数R^2是随机抽样而变动的随机变量。为此,对可决系数的统计可靠性也应进行检验。
1.可决系数是模型解释的变差和总变差的比,取值在0到1之间,可决系数越大,说明模型解释的变差占总变差的比例越高,说明回归线和观测值越接近,模型的拟合优度越好。
2.反之,可决系数越小,说明模型的拟合优度越差。
3.拟合优度是指这个模型对于数据来说,解释变量能够解释被解释变量的程度,F说明的是整个模型中所有的解释变量的显著程度,和T值是对应的。
可决系数是在拟合回归方程后进一步评价它的解释作用,而回归分析有其具体目的和假定前提。相关系数直接用于相关分析,它只描述变量间协变关系的密切程度,而不问哪个是自变量,哪个是因变量。
(1) X和Y均为随机变量。
(2) X和Y均服从正态分布,两者不必相互独立。
(3) 对于X所有取值,Y值的标准差都相等;对于Y所有取值,X值的标准差也都相等。
这样看来,可决系数和相关系数所描述的问题性质不尽相同。
扩展资料:
可决系数取已解释变差对总变差的比率形式,在运算上有直接的解释意义。相关系数是沿交叉乘积和——协方差——相关系数的思想开发出来的,其最终公式形式不好作直接的解释。尽管如此,在许多应用中,如果两者都可以出现,我们还是更多地注意到r值
在求得可决系数的基础上计算相关系数,方法是将可决系数开平方,至于平方根的符号,则取与回归方程斜率b相同的符号。正是因为存在这样的关系,我们用r2作为可决系数的符号,而没有另用别的字母。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)