看全网的转libsvm格式的方法,大都使用FormatDataLibsvm.xls这个过程实现。本人觉得麻烦,直接写了一个函数,可以直接在python内使用。输入TXT文本的格式如下
输出dataMat,labelMat两个返回值,就可以作为样本属性和样本标记直接使用libsvm的svm_train函数和svm_predict函数,不再需要使用svm_read_problem函数。代码如下
#普通csv文件转换为libsvm文件
def loadDataSet_libsvm(fileName):
dataMat = []; labelMat = []; L1=[];L2=[]
fr = open(fileName)
for line in fr.readlines():
lineArr = line.strip().split('\t')
m=(len(lineArr))
labelMat.append(float(lineArr[m-1]))
for i in range(m-1):
L1.append(i)
L2.append(float(lineArr[i]))
d1=zip(L1,L2)
d=dict(d1)
dataMat.append(d)
L1=[];L2=[]
return dataMat,labelMat
顺带附使用该代码进行libsvm *** 作的代码
#libsvm求解
dataMat,labelMat=loadDataSet_libsvm('SVM.txt')
model = svm_train(labelMat[:90], dataMat[:90],'-t 2 -s 1 -c 4 -b 1 ')
print('----------')
p_label, p_acc, p_val = svm_predict(labelMat[90:], dataMat[90:], model)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)