matlab作矩阵的聚类并做出图形

matlab作矩阵的聚类并做出图形,第1张

%生成随机数据

clearclc

a=10*(1:2:9)

b=[0,sort(randint(1,4,[1,199])),200]

idx=randperm(200)

for n=1:5

X(idx((b(n)+1):b(n+1)),:)=unifrnd(a(n),a(n)+10,b(n+1)-b(n),3)

end

%聚类

Z=clusterdata(X,'maxclust',5)

%绘袭衫图

for n=1:5

Y(n,:)=mean(X(Z==n,:))

end

scatter3(X(:,1),X(:,2),X(:,3),10,Z)

hold on

plot3(Y(:,1),Y(:,2),Y(:,3),'rp'拍肢腔饥迟,'markerfacecolor','r','markersize',10)

可能我很快回答不了你的问题。还需要细细回味一下。

但是我觉得你的问题是一个比较明显的短文本聚类问题,这个问题应该在国际上都是比较难的吧。

如果还涉及到中文,中文的相关处理又不能照抄英文短文本聚类的方法,相关资料更加少了。

我倒是建议你 多看一些短文本聚类相关的文章。

问题一:技术上python矩阵表示的话:你可以使用python包,如下:

from numpy import matrix

A = matrix( [[1,2,3],[11,12,13],[21,22,23]])

这样你需要额外规定化:行i表示文档编号i的文档,列j表示词j出现次数,A[i][j]表示在文档i中词j的出现频率

或者

如同那篇文章所说的采用dict表示法:A = [{'额外':1},{'每天':1,'回帖':1},......]表示整个文档集合。

问题二:如同这样的问题本质一样,短文本聚类是否还适合传统的分词,去除副词...等处局睁理步骤,

如何选择合适的模型来表示这类问题,我觉得你还是参考一些这方面的文章,最好中文的。

比如现在很火的微博,也会有好多的人尝试对其中成干上万评论进行聚类。很多进行二类或者三类聚类/分类:支持-中立-反对。

论坛的评论应该很早以前就有研究聚类/分类.我觉得去那里参考会更好.如果不是特别面向指定目的的聚类,我觉得采用一些使用宽泛的方法就行了。感觉结果不会很好。

问题三:EM算法感觉像纯数学的东西,学术功侍雀底不够深,我也不好发表看法。

感觉这个问题的本质已经超出我的知桐谈岁识范畴。最简单文档聚类无非:分词-文本预处理[同义词之类]-文档与词计频矩阵表示-(TF-IDF预处理)-kmeans跑起来-输出结果.

在相似度矩阵上聚类的方法如下:

对于P-1AP=B设A,B和C是任意同阶方阵,则有:

1、反身性:A~ A。两者的秩相等;

2、对称性:若A~ B,则 B~ A。两者的行列式值相等;

3、传递性:若A~ B,B~ C,则A~ C。两者的迹数相等;

4、若A~ B,则r(A)=r(B),|A|=|B|,tr(A)=tr(B)。两者拥有同样的特征值,尽管相应的特征向量一般不同;

5、若A~ B,且A可逆,则B也可逆,且B~ A。两者拥有同样的特征多项式;

6、若A~ B,则A与B。两者拥有同样的初等羡裂因子。

7、袜肢若A与对角矩阵相似,则称A为可对角化矩阵,若n阶方阵A有n个线性无关的特征向量,则称A为单纯矩阵。

8、相似矩阵具有相同的可逆性,当它们可逆时,则它们的逆矩阵也相似。

扩展资料:

定理

n阶矩阵A与对角矩阵相似的充分必要条件为矩阵A有n个线性无关的特征向量。求告派世出的特征向量恰好为矩阵的各个线性无关的特征向量。若n阶矩阵A有n个相异的特征值,则A与对角矩阵相似。若n阶矩阵A有n个相异的特征值,则A与对角矩阵相似。

对于n阶方阵A,若存在可逆矩阵P, 使其为对角阵,则称方阵A可对角化。n阶矩阵A可对角化的充要条件是对应于A的每个特征值的线性无关的特征向量的个数恰好等于该特征值的重数,即设是矩阵A的重特征值。

对任意一个n阶矩阵A,都存在n阶可逆矩阵T使得即任一n阶矩阵A都与n阶约当矩阵J相似。

参考资料来源:百度百科-相似矩阵


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12212457.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存