从中文看,"协"是什么意思?相互的意思,自己与自己就是方差,和别人就是协方差,即D(X)=Cov(X,X)。从数据角度看,因为D(X)=E(X-EX)^2,即变量X与其中心点EX距离的平方的均值,所以变量X的取值越分散,即X-EX越大,所以方差DX越大,即方差反应了X的离散程度。至于协方差,其本意是用来描述两个随机变量之间关系的一个量。
方差:
方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。
proc corr cov data=r;var x y;
run;
同时计算出来的还有相关系数 简单统计量什么的,如果是多个变量,得到的会是一个协方差矩阵
,
相关系数和协方差所表示的意义区别:含义不同,作用不同。
一、含义不同:
协方差是一个用于测量投资组合中某一具体投资项目相对于另一投资项目风险的统计指标,通俗点就是投资组合中两个项目间收益率的相关程度,正数说明两个项目一个收益率上升,另一个也上升,收益率呈同方向变化。如果是负数,则一个上升另一个下降,表明收益率是反方向变化。
二、作用不同:
协方差的绝对值越大,表示这两种资产收益率关系越密切;绝对值越小表明这两种资产收益率的关系越疏远。
由于协方差比较难理解,所以将协方差除以两个投资方案投资收益率的标准差之积,得出一个与协方差具有相同性质却没有量化的数。这个数就是相关系数。计算公式为相关系数=协方差/两个项目标准差之积。
表示
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
百度百科-相关系数
X:{x1,x2,,xn}-----均值:ex标准差:σxY:{y1,y2,,yn}-----均值:ey标准差:σy
协方差: cov(x,y) = E[(xi-ex)(yi-ey)]/σxσy(1)
当 E[(xi-ex)(yi-ey)] < 0 时,协方差为负值!
特别当X,Y 均值为零时,若 E[XY]<0, 则协方差为负值!没有确切的意义。应该反映两个随机变量的相关性的一种度量吧。不过受数值量级的影响,因此单位化后可通过相关系数来反映两个随机变量线性相关的程度。
你也可对比单个随机变量的方差来理解。
协方差是一种统计指标,用于衡量投资组合中特定投资项目相对于另一投资项目的风险。流行的观点是投资组合中两个项目的收益率的相关程度。正数表示两种产品的收益率增加,另一种产品的收益率也增加,收益率的变化方向相同。如果它是负的,一个上升,另一个下降,表明收益率在向相反的方向移动。协方差的绝对值越大,这两种资产的收益率越接近。绝对值越小,表明两种资产回报之间的关系越疏远。协方差很难理解,协方差除以两个投资方案的投资收益的标准差的乘积,得到一个与协方差具有相同性质但没有量化的数字。这个数字就是相关系数。计算公式为相关系数=协方差/两项标准差的乘积。
协方差,你变大我变大,这意味着两个变量方向相同,协方差为正。你变大,我变小,这意味着两个变量的变化方向相反,协方差是负的。从数值上看,协方差值越大,两个变量在同一方向上的程度越大。反之亦然。公式翻译很简单:如果你有X, Y,两个变量,每一时刻的“X”值而不是平均值之间的差乘以“Y值和它的平均值之间的差”的乘积,再次到这个每次的和和平均值的乘积(实际上是“希望”,但没有扩展太多的新概念,简单的想法是平均值)。
相关系数,我们从它的公式开始。一般情况下,取X和Y的协方差除以X的标准差和Y的标准差,因此相关系数也可以看成协方差:去掉两个变量的维度影响后标准化的一种特殊协方差。它是一种特殊的协方差,也可以反映两个变量是在同一个方向上变化,还是在相反的方向上变化。同一方向的变化是正的,相反方向的变化是负的。这是一个标准化的协方差,一个更重要的特性出现了:它消除了两个变量变化幅度的影响,简单地反映了两个变量在单位变化中是多么相似。
当相关系数为1时,说明这两个变量的正相似性变化最大,即你变大了一倍,我也变大了一倍;你比我小一倍,我比你小一倍。换句话说,X和Y之间的关系是完全正的(如果你用X和Y作为纵轴和横轴,你可以画一条斜率为正的直线,所以X和Y是线性的)。随着相关系数的减小,两个变量的相似性变小。当相关系数为0时,两个变量的变化过程不存在相似性,即两个变量不相关。当相关系数继续减小且小于0时,两个变量开始呈现反向相似。随着相关系数的不断减小,反向相似度将逐渐增大。当相关系数为-1时,说明两个变量变化的反向相似度最大,即你变大一倍,我变小一倍;你比我小两倍,我比你大两倍。换句话说,它是完全负相关的。
为了便于理解和验证,可以参考一下, >欢迎分享,转载请注明来源:内存溢出
评论列表(0条)