知道什么是k

知道什么是k,第1张

知道什么是k

算法流程:

1.选择聚类的个数k(kmeans算法传递超参数的时候,只需设置最大的K值)2.任意产生k个聚类,然后确定聚类中心,或者直接生成k个中心。3.对每个点确定其聚类中心点。4.再计算其聚类新中心。5.重复以上步骤直到满足收敛要求。(通常就是确定的中心点不再改变。)

优点:1、原理简单(靠近中心点) ,实现容易2、聚类效果中上(依赖K的选择)3、空间复杂度o(N)时间复杂度o(IKN)N为样本点个数,K为中心点个数,I为迭代次数缺点:1、对离群点, 噪声敏感 (中心点易偏移)2、很难发现大小差别很大的簇及进行增量计算3、结果不一定是全局最优,只能保证局部最优(与K的个数及初值选取有关)

K的选择:https://blog.csdn.net/sinat_30353259/article/details/80887779#K_49

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4880864.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-11
下一篇 2022-11-11

发表评论

登录后才能评论

评论列表(0条)

保存