知道什么是k_随笔

知道什么是k

算法流程：

1.选择聚类的个数k（kmeans算法传递超参数的时候，只需设置最大的K值）2.任意产生k个聚类，然后确定聚类中心，或者直接生成k个中心。3.对每个点确定其聚类中心点。4.再计算其聚类新中心。5.重复以上步骤直到满足收敛要求。（通常就是确定的中心点不再改变。）

优点：1、原理简单（靠近中心点），实现容易2、聚类效果中上（依赖K的选择）3、空间复杂度o(N)时间复杂度o(IKN)N为样本点个数，K为中心点个数，I为迭代次数缺点：1、对离群点，噪声敏感（中心点易偏移）2、很难发现大小差别很大的簇及进行增量计算3、结果不一定是全局最优，只能保证局部最优（与K的个数及初值选取有关）

K的选择：https://blog.csdn.net/sinat_30353259/article/details/80887779#K_49

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4880864.html

知道什么是k

发表评论

评论列表（0条）