2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离.
3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛.
4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.
5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.
【Step1】
单击【文件】→【数据】→【打开】菜单,也可以在“数据编辑器中”直接单击【打开】按钮。
【Step
2】
设定相应的【查找位置】:数据文件存放的文件夹。【文件类型】选择【Excel】后,选择“网友名单.xls”。
【Step
3】
由于本例数据文件第一行为变量名,因此勾选了【从第一行数据中读取变量名】,反之应取消勾选。本例读取的【工作表】为Sheet1.
【Step
4】
单击【确定】即可将Excel文件导入SPSS中,导入后的数据能够自动识别成相应的变量类型,如“数值”、“日期”、“字符串等。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)