在评估准确性方面。您应该记住,k均值 不是分类工具 ,因此分析准确性不是一个好主意。您可以执行此 *** 作,但这不是k-
means的目的。它应该找到一组最大的集群间距离的数据,而不使用您的标签进行训练。因此,通常使用RandIndex和其他聚类指标来测试k均值。为了使准确性最大化,您应该适合实际的分类器,例如kNN,逻辑回归,SVM等。
就代码本身而言,
k_means.predict(X_test)返回 标签,它不更新内部
labels_字段,您应该这样做
print(k_means.predict(X_test))
此外,在python中,您不必(也不应该)用于
[:]打印数组,只需执行
print(k_means.labels_)print(y_test)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)