分类变量资料能不能进行相关分析？_安全

可以。

变量类型不是一成不变的，根据研究目的的需要，各类变量之间可以进行转化。例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时，可按二项分类资料分析。

若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时，可按等级资料分析（资料是根据临床数据得出）。有时亦可将分类资料数量化，如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。

扩展资料

分类变量，根据取值特征而分类的一种定性变量。分类变量，其取值的各类别之间存在着程度上的差别，给人以“半定量”的感觉，为等级变量，如学历（文盲、小学、初中、高中、大学、研究生等）。

对于分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表，所得资料为等级资料。有序多分类变量为很常见的变量形式，通常在变量中有多个可能会出现的取值，各取值之间还存在等级关系。

参考资料来源：百度百科-有序分类变量

参考资料来源：百度百科-分类变量

应该用logistic回归。前提是设计好变量类型。使用有序Logistic进行回归分析时，需要考虑4个假设：

假设1：因变量唯一，且为有序多分类变量，如血压水平可以分为高、中、低；某病的治疗效果分为痊愈、有效、无效等。

假设2：存在一个或多个自变量，可为连续、有序多分类或无序分类变量。

假设3：自变量之间无多重共线性。

假设4：模型满足比例优势假设。意思是无论因变量的分割点在什么位置，模型中各个自变量对因变量的影响不变，也就是自变量对因变量的回归系数与分割点无关。有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归。

例如本例中因变量患者满意度有4个等级，分析时拆分为三个二元Logistic回归，分别为(0 vs 1+2+3) 、(0+1 vs 2+3)和(0+1+2 vs 3)，均是较低级与较高级对比。在有序多分类Logistic回归中，假设几个二元Logistic回归的自变量系数相等，仅常数项不等。

结果也只输出一组自变量的系数。因此，有序多分类的Logistic回归模型，必须对自变量系数相等的假设（即比例优势假设）进行检验（又称平行线检验）。如果不满足该假设，则考虑使用无序多分类Logistic回归。

假设1-2都是对研究设计的假设，需要研究者根据研究设计进行判断。经过分析，本研究符合假设1和假设2，那么应该如何检验假设3、假设4，并进行有序Logistic回归呢？

分类变量是指地理位置、人口统计等方面的变量，其作用是将调查响应者分群。描述变量是描述某一个客户群与其他客户群的区别。大部分分类变量也就是描述变量。
变量类型不是一成不变的，根据研究目的的需要，各类变量之间可以进行转化。例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时，可按二项分类资料分析；
若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时，可按等级资料分析（资料是根据临床数据得出）。有时亦可将分类资料数量化，如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。

扩展资料：

无序分类变量（unordered
categorical
variable）是指所分类别或属性之间无程度和顺序的差别。，它又可分为：
①二项分类，如性别（男、女），药物反应（阴性和阳性）等；
②多项分类，如血型（O、A、B、AB），职业（工、农、商、学、兵）等。对于无序分类变量的分析，应先按类别分组，清点各组的观察单位数，编制分类变量的频数表，所得资料为无序分类资料，亦称计数资料。
有序分类变量（ordinal
categorical
variable）各类别之间有程度的差别。如尿糖化验结果按－、±、+、++、+++分类；疗效按治愈、显效、好转、无效分类。
对于有序分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表，所得资料称为等级资料。

参考资料：

百度百科-分类变量

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/yw/13007155.html

分类变量资料能不能进行相关分析？

发表评论

评论列表（0条）