算法流程:
1.选择聚类的个数k(kmeans算法传递超参数的时候,只需设置最大的K值)2.任意产生k个聚类,然后确定聚类中心,或者直接生成k个中心。3.对每个点确定其聚类中心点。4.再计算其聚类新中心。5.重复以上步骤直到满足收敛要求。(通常就是确定的中心点不再改变。)
优点:1、原理简单(靠近中心点) ,实现容易2、聚类效果中上(依赖K的选择)3、空间复杂度o(N)时间复杂度o(IKN)N为样本点个数,K为中心点个数,I为迭代次数缺点:1、对离群点, 噪声敏感 (中心点易偏移)2、很难发现大小差别很大的簇及进行增量计算3、结果不一定是全局最优,只能保证局部最优(与K的个数及初值选取有关)
K的选择:https://blog.csdn.net/sinat_30353259/article/details/80887779#K_49
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)