我认为您需要一种分层的集聚技术,而不是k均值。如果您的算法正确,则可以在拥有正确数量的集群时停止该算法。正如其他人提到的那样,您可以使用先前的解决方案为后续的群集提供种子,这可能会给您带来明显的性能改进。
您可能需要仔细查看所使用的距离函数,尤其是在问题具有高维的情况下。欧氏距离是最容易理解的,但可能不是最好的距离,请看诸如马哈拉诺比斯之类的替代方案。
我以为您的真正问题与送报纸无关…
欢迎分享,转载请注明来源:内存溢出
我认为您需要一种分层的集聚技术,而不是k均值。如果您的算法正确,则可以在拥有正确数量的集群时停止该算法。正如其他人提到的那样,您可以使用先前的解决方案为后续的群集提供种子,这可能会给您带来明显的性能改进。
您可能需要仔细查看所使用的距离函数,尤其是在问题具有高维的情况下。欧氏距离是最容易理解的,但可能不是最好的距离,请看诸如马哈拉诺比斯之类的替代方案。
我以为您的真正问题与送报纸无关…
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)