怎么处理【weka】中文txt文本转化成arff时显示时的乱码

怎么处理【weka】中文txt文本转化成arff时显示时的乱码,第1张

建议你去下载weka的稳定版本,现在的应该是36的,在里面TextDirectoryLoader类的代码中规定的是转化的原文件需要是utf-8编码的,你可以把txt转化成utf-8编码,当然也可以在代码中把utf-8改成你的文件编码格式的,希望能够帮到你。

数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约束。

收集数据主要是通过计算机和网络。凡是经过计算机处理的数据都很容易收集,比如浏览器里的搜索、点击、网上购物、其他数据(比如气温、海水盐度、地震波)可以通过传感器转化成数字信号输入计算机。

收集到的数据一般要先经过整理,常用的软件:Tableau和Impure是功能比较全面的,Refine和Wrangler是比较纯粹的数据整理工具,Weka用于数据挖掘。

Hadoop是一个能够对大量数据进行分布式处理的软件框架。用于统计分析的R语言有个扩展RHadoop,可以在Hadoop集群上运行R代码。更具体的自己搜索吧。

可视化输出的工具很多。建议参考wikipedia的“数据可视化”条目。

Tableau、Impure都有可视化功能。R语言也可以绘图。

还有很多可以用来在网页上实现可视化输出的框架或者控件。

大致基于四种技术:Flash(Flex)或者JS(HTML5)或者Java或者ASPNET(Silverlight)

Flash的有Degrafa、BirdEye、Axiis、OpenFlashChart

JS的有Ajaxorg、SenchaExtJS、Filament、jQchart、Flot、Sparklines、gRaphael、TufteGraph、Exhibit、PlotKit、、MilkChart、GoogleChartAPI、Protovis

Java的有Choosel、google--java、GWTChronoscope、JFreeChart

ASPNET的有TelerikCharts、Visifire、DundasChart

目前我比较喜欢d3(Data-DrivenDocuments),图形种类丰富,有交互能力,你可以去d3jsorg看看,有很多种图形的demo。

 包解压C盘:C:\libsvm-3182
要用libsvm自带脚本gridpyeasypy,需要官网载绘图工具gnuplot,解压c盘进入c:\libsvm\tools目录用文本编辑器(记事本edit都)修改gridpyeasypy两文件找其关于gnuplot路径项根据实际路径进行修改并保存
python与libsvm连接(参考SVM习笔记(2)LIBSVMpython使用)
1打IDLE(pythonGUI)输入>>>importsys>>>sysversion
2python32位现字符:
(default,Apr102012,23:31:26)[MSCv150032bit(Intel)]’
候LIBSVMpython接口设置非简单libsvm-316文件夹windows文件夹找态链接库libsvmdll其添加系统目录`C:\WINDOWS\system32\’即python使用libsvm
wk_ad_begin({pid : 21});wk_ad_after(21, function(){$('ad-hidden')hide();}, function(){$('ad-hidden')show();});
3执行例
importos
oschdir('C:\libsvm-318\python')#请根据实际路径修改
fromsvmutilimport
y,x=svm_read_problem('/heart_scale')#读取自带数据
m=svm_train(y[:200],x[:200],'-c4')
p_label,p_acc,p_val=svm_predict(y[200:],x[200:],m)
##现结应该确安装optimizationfinished,#iter=257nu=0351161
obj=-225628984,rho=0636110nSV=91,nBSV=49
TotalnSV=91
Accuracy=842857%(59/70)(classification)
F


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/13367308.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-22
下一篇 2023-07-22

发表评论

登录后才能评论

评论列表(0条)

保存