% FCMClust.m 采用模糊C均值对数据集data聚为cluster_n类
%
% 用法:
% 1. [center,U,obj_fcn] = FCMClust(Data,N_cluster,options)
% 2. [center,U,obj_fcn] = FCMClust(Data,N_cluster)
%
% 输入:
% data---- nxm矩阵,表示n个样本,每个样本具有m的维特征值
% N_cluster ---- 标量,表示聚合中心数目,即类别数
% options ---- 4x1矩阵,其中
% options(1): 隶属度矩阵U的指数,>1 (缺省值: 2.0)
% options(2): 最大迭代次数 (缺省值: 100)
% options(3): 隶属度最小变化量,迭代终止条件 (缺省值: 1e-5)
% options(4): 每次迭代是否输出信息标志(缺省值: 1)
% 输出:
% center ---- 聚类中心
% U ---- 隶属度矩阵
% obj_fcn ---- 目标函数值
% Example:
% data = rand(100,2)
% [center,U,obj_fcn] = FCMClust(data,2)
% plot(data(:,1), data(:,2),'o')
% hold on
% maxU = max(U)
% index1 = find(U(1,:) == maxU)
% index2 = find(U(2,:) == maxU)
% line(data(index1,1),data(index1,2),'marker','*','color','g')
% line(data(index2,1),data(index2,2),'marker','*','color','r')
% plot([center([1 2],1)],[center([1 2],2)],'*','color','k')
% hold off
if nargin ~= 2 &nargin ~= 3,%判断输入参数个数只能是2个或3个
error('Too many or too few input arguments!')
end
data_n = size(data, 1)% 求出data的第一维(rows)数,即样本个数
in_n = size(data, 2) % 求出data的第二维(columns)数,即特征值长度
% 默认 *** 作参数
default_options = [2% 隶属度矩阵U的指数
100 % 最大迭代次数
1e-5 % 隶属度最小变化量,迭代终止条件
1]% 每次迭代是否输出信息标志
if nargin == 2,
options = default_options
else %分析有options做参数时候的情况
% 如果输入参数个数是二那么就调用默认的option
if length(options) <4, %如果用户给的opition数少于4个那么其他用默认值
tmp = default_options
tmp(1:length(options)) = options
options = tmp
end
% 返回options中是数的值为0(如NaN),不是数时为1
nan_index = find(isnan(options)==1)
%将denfault_options中对应位置的参数赋值给options中不是数的位置.
options(nan_index) = default_options(nan_index)
if options(1) <= 1, %如果模糊矩阵的指数小于等于1
error('The exponent should be greater than 1!')
end
end
%将options 中的分量分别赋值给四个变量
expo = options(1) % 隶属度矩阵U的指数
max_iter = options(2) % 最大迭代次数
min_impro = options(3) % 隶属度最小变化量,迭代终止条件
display = options(4) % 每次迭代是否输出信息标志
obj_fcn = zeros(max_iter, 1)% 初始化输出参数obj_fcn
U = initfcm(cluster_n, data_n)% 初始化模糊分配矩阵,使U满足列上相加为1,
% Main loop 主要循环
for i = 1:max_iter,
%在第k步循环中改变聚类中心ceneter,和分配函数U的隶属度值
[U, center, obj_fcn(i)] = stepfcm(data, U, cluster_n, expo)
if display,
fprintf('FCM:Iteration count = %d, obj. fcn = %f\n', i, obj_fcn(i))
end
% 终止条件判别
if i >1,
if abs(obj_fcn(i) - obj_fcn(i-1)) <min_impro,
break
end,
end
end
iter_n = i% 实际迭代次数
obj_fcn(iter_n+1:max_iter) = []
% 子函数
function U = initfcm(cluster_n, data_n)
% 初始化fcm的隶属度函数矩阵
% 输入:
% cluster_n ---- 聚类中心个数
% data_n ---- 样本点数
% 输出:
% U ---- 初始化的隶属度矩阵
U = rand(cluster_n, data_n)
col_sum = sum(U)
U = U./col_sum(ones(cluster_n, 1), :)
% 子函数
function [U_new, center, obj_fcn] = stepfcm(data, U, cluster_n, expo)
% 模糊C均值聚类时迭代的一步
% 输入:
% data---- nxm矩阵,表示n个样本,每个样本具有m的维特征值
% U ---- 隶属度矩阵
% cluster_n ---- 标量,表示聚合中心数目,即类别数
% expo---- 隶属度矩阵U的指数
% 输出:
% U_new ---- 迭代计算出的新的隶属度矩阵
% center ---- 迭代计算出的新的聚类中心
% obj_fcn ---- 目标函数值
mf = U.^expo % 隶属度矩阵进行指数运算结果
center = mf*data./((ones(size(data, 2), 1)*sum(mf'))')% 新聚类中心(5.4)式
dist = distfcm(center, data) % 计算距离矩阵
obj_fcn = sum(sum((dist.^2).*mf)) % 计算目标函数值 (5.1)式
tmp = dist.^(-2/(expo-1))
U_new = tmp./(ones(cluster_n, 1)*sum(tmp)) % 计算新的隶属度矩阵 (5.3)式
% 子函数
function out = distfcm(center, data)
% 计算样本点距离聚类中心的距离
% 输入:
% center ---- 聚类中心
% data ---- 样本点
% 输出:
% out---- 距离
out = zeros(size(center, 1), size(data, 1))
for k = 1:size(center, 1), % 对每一个聚类中心
% 每一次循环求得所有样本点到一个聚类中心的距离
out(k, :) = sqrt(sum(((data-ones(size(data,1),1)*center(k,:)).^2)',1))
end
仅供参考~
#define MAX_VERTEX_NUM 100 //最大顶点数
#define MAX_INT 10000 //无穷大
typedef int AdjType
typedef struct{
int pi[MAX_VERTEX_NUM]//存放v到vi的一条最短路径
int end
}PathType
typedef char VType//设顶点为字符类型
typedef struct{
VType V[MAX_VERTEX_NUM]//顶点存储空间
AdjType A[MAX_VERTEX_NUM][MAX_VERTEX_NUM]//邻接矩阵
}MGraph//邻接矩阵表示的图
//Floyd算法
//求网G(用邻接矩阵表示)中任意两点间最短路径
//D[][]是最短路径长度矩阵,path[][]最短路径标志矩阵
void Floyd(MGraph * G,int path[][MAX_VERTEX_NUM],int D[][MAX_VERTEX_NUM],int n){
int i,j,k
for(i=0i<ni++){//初始化
for(j=0j<nj++){
if(G->A[i][j]<MAX_INT){
path[i][j]=j
}else{
path[i][j]=-1
}
D[i][j]=G->A[i][j]
}
}
for(k=0k<nk++){//进行n次试探
for(i=0i<ni++){
for(j=0j<nj++){
if(D[i][j]>D[i][k]+D[k][j]){
D[i][j]=D[i][k]+D[k][j]//取小者
path[i][j]=path[i][k]//改Vi的后继
}
}
}
}
}
int main(){
int i,j,k,v=0,n=6//v为起点,n为顶点个数
MGraph G
int path[MAX_VERTEX_NUM][MAX_VERTEX_NUM]//v到各顶点的最短路径向量
int D[MAX_VERTEX_NUM][MAX_VERTEX_NUM]//v到各顶点最短路径长度向量
//初始化
AdjType a[MAX_VERTEX_NUM][MAX_VERTEX_NUM]={
{0,12,18,MAX_INT,17,MAX_INT},
{12,0,10,3,MAX_INT,5},
{18,10,0,MAX_INT,21,11},
{MAX_INT,3,MAX_INT,0,MAX_INT,8},
{17,MAX_INT,21,MAX_INT,0,16},
{MAX_INT,5,11,8,16,0}
}
for(i=0i<ni++){
for(j=0j<nj++){
G.A[i][j]=a[i][j]
}
}
Floyd(&G,path,D,6)
for(i=0i<ni++){//输出每对顶点间最短路径长度及最短路径
for(j=0j<nj++){
printf("V%d到V%d的最短长度:",i,j)
printf("%d\t",D[i][j])//输出Vi到Vj的最短路径长度
k=path[i][j]//取路径上Vi的后续Vk
if(k==-1){
printf("There is no path between V%d and V%d\n",i,j)//路径不存在
}else{
printf("最短路径为:")
printf("(V%d",i)//输出Vi的序号i
while(k!=j){//k不等于路径终点j时
printf(",V%d",k)//输出k
k=path[k][j]//求路径上下一顶点序号
}
printf(",V%d)\n",j)//输出路径终点序号
}
printf("\n")
}
}
system("pause")
return 0
}
”模糊等价矩阵”英文对照fuzzy equivalence matrix
”模糊等价矩阵”在学术文献中的解释
1、R满足自反性、对称性,且满足:(3)传递性min(r*k,r助)镇r.j’称为模糊等价矩阵,根据任意指定的闭值(0耳入蕊1),将R‘载为普通等价矩阵R‘,‘人
文献来源
2、这一矩阵称为模糊等价矩阵.用平方自合成法可以构造出等价矩阵,方法如下:R.R==R.R.R.=R.若R=R.则R为模糊等价矩阵
基于模糊等价关系的模糊聚类分析 收藏
假设R是X上的模糊等价关系,则对任意的a,R的a-截集是X上的普通等价关系,因此,可以根据X上的模糊关系,对X进行模糊分类。当取不同的a值,则可以得到不同的分类结果,即分类是动态的。
实际 *** 作中,一般情况下,我们所获得是一系列样本,假设有N个,每个样本可以看作是M维空间中的一个点。可以表示如下,论域: ,对第i个元素有
1.数据预处理
考虑到不同的数据可能有不同的量纲,因此,再处理之前,有必要对数据进行相当的变换。常用的变换标准差变换和极差变换:
标准差变换:
经过变换后,每个变量的均值为0,标准差为1,并可以消除量纲的影响,但值不一定在0和1之间。
极差变换:
经过变换后,消除了量纲的影响,并且值在0和1之间。
2 模糊相似矩阵的建立
由已知的数据,可以建立论域上的模糊关系矩阵,其目的是为构造模糊等价矩阵提供数据。
计算模糊关系矩阵由很多方法,如夹角余弦法,相关系数法,算术平均法,几何平均法,最大最小法,以夹角余弦为例,可用下述公式计算:
3 用传递闭包法求模糊等价矩阵
由以上过程所建立的矩阵一般仅具有自反性和对称性,不满度传递性,必须进行变换转换为模糊等价矩阵。常采用传递闭包法,即从上述R矩阵出发,求R^2-->R^4-->R^8...,直到第一次出现R^k × R^k=R^k,这时表明R以具有传递性。
4 根据模糊等价矩阵和某以a得到分类结果。
部分代码实现:
'**********************************数据的标准差变化****************************
'
'过 程 名: Norm_Diff
'参数: Data() - Double ,待变换的二维数组
'说明: 执行改函数后数组中了保存变换的数据
'作者:
'修 改 者: laviepbt
'修改日期: 2006-11-1
'
'**********************************数据的标准差变化****************************
Public Sub Norm_Diff(ByRef Data() As Double)
Dim m As Integer, N As Integer, i As Integer, j As Integer
Dim Ave As Double, s As Double
N = UBound(Data, 1): m = UBound(Data, 2) 'n样品数,m变量数
For j = 1 To m
Ave = 0
For i = 1 To N
Ave = Ave + Data(i, j)
Next
Ave = Ave / N 'ave是平均值
s = 0
For i = 1 To N
s = s + (Data(i, j) - Ave) ^ 2 's是标准差
Next
s = Sqr(s / N)
For i = 1 To N
Data(i, j) = (Data(i, j) - Ave) / s
Next
Next
End Sub
'**********************************数据的极差变换****************************
'
'过 程 名: Extre_Diff
'参数: Data() - Double ,待变换的二维数组
'说明: 执行改函数后数组中了保存变换的数据
'作者:
'修 改 者: laviepbt
'修改日期: 2006-11-1
'
'**********************************数据的极差变换****************************
Public Sub Extre_Diff(ByRef Data() As Double)
Dim m As Integer, N As Integer, i As Integer, j As Integer
Dim Max As Double, Min As Double, d As Double
N = UBound(Data, 1): m = UBound(Data, 2) 'N样品数,M变量数
For j = 1 To m
Max = -10000000000#: Min = 10000000000#
For i = 1 To N
If Data(i, j) >Max Then Max = Data(i, j)
If Data(i, j) <Min Then Min = Data(i, j)
Next
d = Max - Min 'd是极差
For i = 1 To N
Data(i, j) = (Data(i, j) - Min) / d '极差标准化变换
Next
Next
End Sub
'**********************************夹角余弦法****************************
'
'过 程 名: Angle_Cos
'参数: Data() - Double ,二维数组数据
' R() - Double, 相似矩阵
'说明:
'作者:
'修 改 者: laviepbt
'修改日期: 2006-11-1
'
'**********************************夹角余弦法****************************
Public Sub Angle_Cos(ByRef Data() As Double, ByRef R() As Double)
Dim m As Integer, N As Integer, i As Integer, j As Integer, k As Integer
Dim S1 As Double, Si2 As Double, Sj2 As Double
N = UBound(Data, 1): m = UBound(Data, 2) 'N样品数,M变量数
For i = 1 To N
For j = 1 To N
If i = j Then
R(i, j) = 1
Else
S1 = 0: Si2 = 0: Sj2 = 0
For k = 1 To m
S1 = S1 + Data(i, k) * Data(j, k)
Si2 = Si2 + Data(i, k) ^ 2
Sj2 = Sj2 + Data(j, k) ^ 2
Next
R(i, j) = Int((S1 / Sqr(Si2 * Sj2)) * 1000 + 0.5) / 1000
End If
Next
Next
End Sub
'**********************************相关系数法****************************
'
'过 程 名: Correlation
'参数: Data() - Double ,二维数组数据
' R() - Double, 相似矩阵
'说明:
'作者:
'修 改 者: laviepbt
'修改日期: 2006-11-1
'
'**********************************相关系数法****************************
Public Sub Correlation(ByRef Data() As Double, ByRef R() As Double)
Dim m As Integer, N As Integer, i As Integer, j As Integer, k As Integer
Dim Xia As Double, Xja As Double
Dim S1 As Double, Si2 As Double, Sj2 As Double
N = UBound(Data, 1): m = UBound(Data, 2) 'N样品数,M变量数
For i = 1 To N
For j = 1 To N
If i = j Then
R(i, j) = 1
Else
Xia = 0: Xja = 0
For k = 1 To m
Xia = Xia + Data(i, k)
Xja = Xja + Data(j, k)
Next
Xia = Xia / m
Xja = Xja / m
S1 = 0: Si2 = 0: Sj2 = 0
For k = 1 To m
S1 = S1 + Abs((Data(i, k) - Xia) * (Data(j, k) - Xja))
Si2 = Si2 + (Data(i, k) - Xia) ^ 2
Sj2 = Sj2 + (Data(j, k) - Xja) ^ 2
Next
R(i, j) = Int((S1 / Sqr(Si2 * Sj2)) * 1000 + 0.5) / 1000
End If
Next
Next
End Sub
'**********************************传递闭包法****************************
'
'过 程 名: TR
'参数: R() - Double ,相似矩阵
' RR() - Double, 模糊乘积矩阵
'说明:
'作者:
'修 改 者: laviepbt
'修改日期: 2006-11-1
'
'**********************************传递闭包法****************************
Public Sub TR(ByRef R() As Double, ByRef RR() As Double)
Dim N As Integer, l As Integer
Dim i As Integer, j As Integer, k As Integer
Dim i1 As Integer, j1 As Integer
Dim dMax As Double
N = UBound(R, 1)
ReDim dMin(1 To N) As Double
l = 0
100:
l = l + 1
If l >100 Then
MsgBox "已进行100次自乘,仍然没有获得传递性", vbCritical, "错误"
Exit Sub
End If
For i = 1 To N
For j = 1 To N
For k = 1 To N
If R(i, k) <= R(k, j) Then
dMin(k) = R(i, k)
Else
dMin(k) = R(k, j)
End If
Next
dMax = dMin(1) '模糊矩阵的乘法,取小取大
For k = 1 To N
If dMin(k) >dMax Then dMax = dMin(k)
Next
RR(i, j) = dMax
Next
Next
For i = 1 To N
For j = 1 To N
'判断是否式模糊等价矩阵,若非则继续做
If R(i, j) <>RR(i, j) Then
For i1 = 1 To N
For j1 = 1 To N
R(i1, j1) = RR(i1, j1)
Next
Next
GoTo 100
End If
Next
Next
End Sub
全部代码可参考《模糊数学基础及实用算法》一书。
处理结果:以一下数据为例:选用极差法预处理数据,夹角余弦法计算相似矩阵
数据 模糊等价矩阵
部分分析结果:
********************************
入值:0.908
第1类:U1 U2 U3 U4
第2类:U5 U6
第3类:U7 U8
F效验值: 6.099
显著性为.2的临界值:2.259
显著性为.1的临界值:3.78
结论:在给定的临界值下,该分类效果特别显著.^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
********************************
入值:0.894
第1类:U1 U2 U3 U4
第2类:U5 U6 U7 U8
F效验值: 7.634
显著性为.2的临界值:2.073
显著性为.1的临界值:3.776
结论:在给定的临界值下,该分类效果特别显著.^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
********************************
入值:0.888
第1类:U1 U2 U3 U4 U5 U6 U7 U8
F效验值: ********
显著性为.2的临界值:********
显著性为.1的临界值:********
结论:在给定的临界值下,该分类效果不显著.
********************************
显然对于不同lamda值,由不同得聚集效果,可以考虑使用F检验方法刷掉一些不合理得分类。详见《模糊数学基础及实用算法》一书。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)