另外相关系数的相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
相关系数r的计算公式是:
r值的绝对值介于0~1之间。通常来说,r越接近1,表示x与y两个量之间的相关程度就越强,反之,r越接近于0,x与y两个量之间的相关程度就越弱,一般认为:
变量间的这种相互关系,称为具有不确定性的相关关系。
⑴完全相关:两个变量之间的关系,一个变量的数量变化由另一个变量的数量变化所惟一确定,即函数关系。
⑵不完全相关:两个变量之间的关系介于不相关和完全相关之间。
⑶不相关:如果两个变量彼此的数量变化互相独立,没有关系。
常见的相关系数为简单相关系数,简单相关系数又称皮尔逊相关系数或者线性相关系数。线性相关系数计算公式如图所示:
r值的绝对值介于0~1之间。通常来说,r越接近1,表示x与y两个量之间的相关程度就越强,反之,r越接近于0,x与y两个量之间的相关程度就越弱。
线性相关系数性质:
(1)定理: | ρXY | = 1的充要条件是,存在常数a,b,使得P{Y=a+bX}=1。
相关系数ρXY取值在-1到1之间,ρXY = 0时。
称X,Y不相关; | ρXY | = 1时,称X,Y完全相关,此时,X,Y之间具有线性函数关系; | ρXY | < 1时,X的变动引起Y的部分变动,ρXY的绝对值越大,X的变动引起Y的变动就越大, | ρXY | > 08时称为高度相关,当 | ρXY | < 03时称为低度相关,其它时候为中度相关。
(2)推论:若Y=a+bX,则有。
证明: 令E(X) = μ,D(X) = σ。
则E(Y) = bμ + a,D(Y) = bσ。
E(XY) = E(aX + bX) = aμ + b(σ + μ)。
Cov(X,Y) = E(XY) − E(X)E(Y) = bσ。
若b≠0,则ρXY ≠ 0。
若b=0,则ρXY = 0。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)