我不同意其他观点。
虽然 您可以对二进制数据 (例如,单热编码数据) 使用PCA, 但这并不意味着它是一件好事,否则它将非常有效。
PCA被设计用于 连续 变量。它试图最小化方差(=平方偏差)。当您拥有二进制变量时,平方差的概念会破裂。
是的,您可以使用PCA。是的,您会得到一个输出。它甚至是最小二乘的输出-好像PCA不会对此类数据进行分段处理。它可以工作,但 意义
远不如您希望的那样。并且据认为比例如频繁模式挖掘更没有意义。
欢迎分享,转载请注明来源:内存溢出
我不同意其他观点。
虽然 您可以对二进制数据 (例如,单热编码数据) 使用PCA, 但这并不意味着它是一件好事,否则它将非常有效。
PCA被设计用于 连续 变量。它试图最小化方差(=平方偏差)。当您拥有二进制变量时,平方差的概念会破裂。
是的,您可以使用PCA。是的,您会得到一个输出。它甚至是最小二乘的输出-好像PCA不会对此类数据进行分段处理。它可以工作,但 意义
远不如您希望的那样。并且据认为比例如频繁模式挖掘更没有意义。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)