如何用sas分析两个因变量和一个自变量之间的关系

如何用sas分析两个因变量和一个自变量之间的关系,第1张

典型相关分析

第1节 方法的概述

研究2组变量之间的相关性,是许多实际问题的需要。例如,研究病人的各种临床症状(X1、… 、Xp)与所患各种疾病(Y1、… 、Yq)之间的相关性;研究原料的主要质量指标(X1、… 、Xp) 与其相应产品的主要质量指标(Y1、… 、Yq)之间的相关性;研究居民的营养状况的一组指标(X1、… 、Xp)与其健康状况的另一组指标(Y1、… 、Yq)之间的相关性等等。当p=q=1时,就是2个变量之间的简单相关分析问题;当p>1、q=1时,就是1个因变量与多个自变量之间的多元相关分析问题;当p、q均大于1时,就是研究2组多变量之间的相关性,称为典型相关分析(Canonical Correlation Analysis)。

利用主成分的思想,可以把多个变量之间的相关化为两个变量之间的相关。胀是找1组系高举差数A=(a1、… 、ap)'及B=(b1、… 、bq)',使得新变量与 

之间有最大可能的相关系数, 称(V1, W1)为第1对典型相关变量,它们之间的相关系数r(V1,W1)简记为r1;同理,可求得第2、第3、 …、第K(K小于等于p, q中较小者)对典型相关变量以及与之对应的相关系数r2、… 、rk。各对典型相关变量所包括的相关信息互不交叉,且满足:

③各Vi和Wi的均数都为0,方差都为1。

求出典袖量对和典型相关系数后,把具有显著意义的典型相关系数所对应的典袖量对保留下来,并给予合理的解释,是典型相关分析作得好坏的关键。

第2节 用CANCORR过程实现典型相关分析

[例6.6.1] 某医学院对MEFV(最大呼气流速─容量)曲线进行研究,测定了103例50~79岁正常男性的MEFV曲线资料,这里挑选其中的6项指标,把它们分为2组:一组为2个(p=2)反映用力肺活量指标─X1(用力肺活量(L))和X2(第1秒用力肺活量(L));另一组为4个 (q=4)反映呼气流速的指标─Y1(最大呼气中期流速(L/S))、Y2(用力呼气后期流速(L/S))、Y3(呼出50%肺容量时最大流速 (L/S))、Y4(呼出75%肺容量时最大流速(L/S))。试作MEFV曲线中这两组指标的典型相关分析。

6项指标构成的相关矩阵见[D6P15.PRG],其中行与列的指标顺序依次为X1、X2、Y1至Y4,如X1与Y4的简单相关系数为0.3019。

[SAS程序]──[D6P15.PRG]

DATA FGH(TYPE=CORR)

INPUT _NAME_$ 1-2 (X1 X2 Y1-Y4) (8.)

_TYPE_='CORR'

CARDS

X1 1.0 0.8491 0.5106 0.2497 0.5285 0.3019

X2 0.8491 1.0 0.8062 0.5438 0.7887 0.6064

Y1 0.5106 0.8062 1.0 0.7833 0.9284 0.8364

Y2 0.2497 0.5438 0.7833 1.0 0.6457 0.9051

Y3 0.5285 0.7887 0.9284 0.6457 1.0 0.7079

Y4 0.3019 0.6064 0.8364 0.9051 0.7079 1.0

PROC CANCORR EDF=102

VAR X1 X2WITH Y1-Y4RUN

[程序修改指导] 在数据集名FGH后用TYPE=CORR注明数据的类型为相关矩阵,而不是原始数据。INPUT语句中用“_NAME_contentrdquo读取左侧的变量名,“1-2”表示变量名的字符落在第1、2列上,“(X1 X2 Y1-Y4)”表示各列数据所对应的变量名,“(8.)”表示读取答枯数据的宽度均为8列(注∶相关系数占6位,其后的空戚皮格占2位),_TYPE_= 'CORR'表示数据类型为相关矩阵。

选择项EDF=N-1,为典型相关分析提供一个计算误差自由度的参考值, 因为该过程中没有合适的选择项可以将原始数据的样本含量N准确地送入。 如果忽略这一选择项,将以缺省值N=10000作为样本含量参与有关计算和统计检验,不够妥当。

如果输入的是原始数据, 则程序可改写成下面的形式∶

DATA FGH

INPUT X1 X2 Y1-Y4  CARDS

3.3460 2.4104 2.3893 0.4263 2.9515 0.9338

…… (注: 省略号处还有N-1行数据)

PROC CANCORR

VAR X1 X2 WITH Y1-Y4 RUN

[输出结果及其解释] Canonical Correlation Analysis

Adjusted Approx Squared

CanonicalCanonical  Standard  Canonical

Correlation Correlation  ErrorCorrelation

1 0.873549 0.869170  0.0234580.763089

2 0.286114 0.256837  0.0909090.081861

求得第1对典袖量(V1,W1)之间的典型相关系数r1=0.873549,校正值为0.869170、标准误差为0.023458、典型相关系数的平为0.763089第2行是第2对典袖量(V2,W2)的有关结果。

Eigenvalues of INV(E)*H

= CanRsq/(1-CanRsq)

Eigenvalue Difference Proportion Cumulative

1 3.2210 3.1318 0.9731 0.9731

2 0.0892  . 0.0269 1.0000

这是与r2/(1-r2)相对应的2个特征值,依次为3.2210和0.0892。r2为典型相关系数之平。

Test of H0: The canonical correlations in the current

row and all that follow are zero

Likelihood

RatioApprox F  Num DF  Den DFPr >F

1 0.21751744  27.74548 1940.0001

2 0.918138552.91263  980.0382

SPSS执行典型相关性分析出现错误主要 原因如下:

1. 文件-新建-语法-输入宏程序

(例如:INCLUDE 'C:\Program Files\SPSSInc\Canonical correlation.sps'.

CANCORR SET1=X1 X2 X3/SET2=Y1 Y2.)凯链需要注意的是末尾的点表示程序结束,不能省略。

2.需要注意的是末尾的点表示程序结束,不能省略;路径选择很重要,首先安装Canonical correlation程序,其腊羡次运行时选择正确轮孙拍的路径;INCLUDE为典型相关分析宏程序,CANCORR为组变量名称调用;

SAS程序来员日常的工作为原始数据处理工作和数据统计分析。

SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理(sas 的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成sas数据格式.要注意与其他软件的配套使用);数据呈现;

数据分析。当前(2016年)软件最高版本为SAS9.4。其中Base SAS模块是SAS系统的核心。其它各模块均在Base SAS提供的环境中运行。用户可选择需要的模块与Base SAS一起构成一个用户化的SAS系统。

扩展资料:

SAS/STAT覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件。SAS/STAT提供了八十多个过程,可进行各种不同模型或不同 特点数据的回归分析,如正交回归/面回归、响应面回归、logistic回归、非线性回归等,且具有多种模型手纳选择方法。 可处理的数据有实型数据、有序数据和属性数据,并能产生各种有用的统计量和诊断信息。

在方差分析方面, SAS/STAT为多种试验设计模型提供了方差分析工具。

另外,它还有处理一般线性模型和广义毕燃没线性模型的专用过程。在多变量统计方面, SAS/STAT为主成分分析、典型相关分析、判别分析和因子分析提供了许多专用过程。SAS/STAT还包含多种聚类准则的聚类分析方法段轿。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12505390.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存