判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。
判别分析和聚类分析都是要求对样本进行分类,但两者的分析内容和要求是不一样的。 聚类分析 是给定数量的样品,但样品应划分出怎样的类别还不清楚,需要聚类分析来判别。 判别分析 是已知样品应分为怎样的类别,判断每一个样品应属于怎样的类别。
距离判别是以给定样品与各总体之间的距离的计算值为准则进行类别判断的一种方法。由于马氏距离不受量纲的影响,因此,在距离判别法中,也采用马氏距离作为类别判断的依据。
(1)若ω(x)>0 则x属于G₁
(2)若ω(x)<0 则x属于G₂
(3)若ω(x)=0 则待判
其中,ω(x)为x的线性函数:(推导过程略)
故常称ω(x)为线性判别函数
协方差阵相同时:
判别函数为:
相应的判别规则为:
协方差阵不同时:
判别函数为:
相应的判别规则为:
该法是按照类内方差尽量小,类间方差尽量大的准则来要求判别函数。组与组的分开借用了方差分析的思想。
从两个总体中抽取p个指标的样品观测数据,根据方差分析的思想构造一个判别函数:
其中系数确定的原则是使两组间的区别最大,而使每个组内部的离差最小。
有了判别式以后,对于一个新的样品,将它的p个指标带入判别函数中求出y值。然后与判别临界值进行比较,就可以判断它属于哪一个总体。
分析过程:
设有k个总体G₁,G₂,…,Gk,从中抽取的样品数为n₁,n₂,…,nk,令n=n₁+n₂+…+nk。设判别函数为:
其中,
在多总体情况下继续选取系数向量c即可。
注:一般来说,对经验样品回判率大于80%就可以使用Fisher判别。
贝叶斯判别的基本思想是认为所有G个类别都是空间中 互斥 的子域,每个观测都是空间中的一个点。
在考虑先验概率的前提下,利用Bayes公式按照一定的准则构建一个判别函数,分别计算该样品落入各个子域的概率,所有概率中最大的一类就被认为是样品所属的类别。
Bayes判别的数学推导略,其数学模型的建立可参考:[百度文库](>1、首先,打开SPSS软件,导入需要进行数据处理和分析的数据文件,选择“转换数据”选项,打开数据转换的窗口。
2、接着,在数据转换窗口中,选择需要进行数据处理的变量,选择“计算变量”选项,输入需要计算的变量的名称,并输入计算公式。
3、然后,点击“确定”按钮,完成变量的计算,在数据分析窗口中,选择需要进行分析的变量和分析方法,点击“分析”按钮,进行数据分析。
4、最后,在数据分析结果中,可以根据3sigma原则来判断数据的异常值。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)