英文官方教程链接如下:
https://scikit-learn.org/stable/tutorial/statistical_inference/unsupervised_learning.htmlhttps://scikit-learn.org/stable/tutorial/statistical_inference/unsupervised_learning.html如有侵权,务必联系删除。
这又是一个新的开始,关于探究有关无监督学习的数据表征的内容,大家一起加油吧。
Clustering: grouping observations together
我对这个的理解是,既然没有标签,那么我们就将判断出的属于同一类(或者是相似类别)的图像或数据归为同一类,将它们放到一起。我感觉好像是一个又一个部落一样。
下面是作者说的最简单的一种聚簇算法:k-means (不得不说,前辈的最简单对我来说也是个巨大的困难啊),代码如下:
from sklearn import datasets,cluster import matplotlib.pyplot as plt wine_x,wine_y = datasets.load_wine(return_X_y=True) k_means = cluster.KMeans(n_clusters=3) fit = k_means.fit(wine_x) labels = k_means.labels_ #这上面的基本上都是一句官网给出的 for index,point in enumerate(labels): if point == 0: plt.plot(index,point,'c^') elif point == 1: plt.plot(index,point,'b8') else: plt.plot(index,point,'mp') plt.show() #这是我将聚簇的结果可视化了一下
嘿嘿,我的技术水平不高,大家就凑合看吧。我来解释一下,相同的类放在一起,从图中我们可以看出,横坐标相邻且值一样的,是同一种鸢尾花,而横坐标相邻但是值不一样的那些(穿插其中的),那些要不就不是同一类,要么就是聚簇的结果错了。总的来说效果还是很好的。
后间有一些我没看懂的,大家就自己去学习吧。因为我怕误导你们,抱歉。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)