分类变量资料能不能进行相关分析?

分类变量资料能不能进行相关分析?,第1张

可以。

变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析。

若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析(资料是根据临床数据得出)。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。

扩展资料

分类变量,根据取值特征而分类的一种定性变量。分类变量,其取值的各类别之间存在着程度上的差别,给人以“半定量”的感觉,为等级变量,如学历(文盲、小学、初中、高中、大学、研究生等)。

对于分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料为等级资料。有序多分类变量为很常见的变量形式,通常在变量中有多个可能会出现的取值,各取值之间还存在等级关系。

参考资料来源:百度百科-有序分类变量

参考资料来源:百度百科-分类变量

应该用logistic回归。前提是设计好变量类型。使用有序Logistic进行回归分析时,需要考虑4个假设:

假设1:因变量唯一,且为有序多分类变量,如血压水平可以分为高、中、低;某病的治疗效果分为痊愈、有效、无效等。

假设2:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。

假设3:自变量之间无多重共线性。

假设4:模型满足比例优势假设。意思是无论因变量的分割点在什么位置,模型中各个自变量对因变量的影响不变,也就是自变量对因变量的回归系数与分割点无关。有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归。

例如本例中因变量患者满意度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs 2+3)和(0+1+2 vs 3),均是较低级与较高级对比。在有序多分类Logistic回归中,假设几个二元Logistic回归的自变量系数相等,仅常数项不等。

结果也只输出一组自变量的系数。因此,有序多分类的Logistic回归模型,必须对自变量系数相等的假设(即比例优势假设)进行检验(又称平行线检验)。如果不满足该假设,则考虑使用无序多分类Logistic回归。

假设1-2都是对研究设计的假设,需要研究者根据研究设计进行判断。经过分析,本研究符合假设1和假设2,那么应该如何检验假设3、假设4,并进行有序Logistic回归呢?

分类变量是指地理位置、人口统计等方面的变量,其作用是将调查响应者分群。描述变量是描述某一个客户群与其他客户群的区别。大部分分类变量也就是描述变量。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;
若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析(资料是根据临床数据得出)。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。

扩展资料:


无序分类变量(unordered
categorical
variable)是指所分类别或属性之间无程度和顺序的差别。,它又可分为:
①二项分类,如性别(男、女),药物反应(阴性和阳性)等;
②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
有序分类变量(ordinal
categorical
variable)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。
对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。

参考资料:

百度百科-分类变量


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/13007155.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存