上图提供了两种方式,哪一种投影方式更好呢?从图上可以直观的看出右边的比左边的投影后分类的效果好,因此右边的投影方式是一种更好地降维方式。
上图直观的给出了LDA分类的主要思想,下图通过数学公式来推导如何得到这个最佳的投影方式。
为了方便解释LDA的原理,我们以二分类为例。
假设现有数据集 D = {(x 1 , y 1 ), (x 1 , y 1 ), ... ,(x m , y m )},其中任意样本x i 为n维向量。定义N j 为第j类样本的个数,X j 为第j类样本的集合,而μ j 为第j类样本的均值向量,Σ
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)