数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约束。
收集数据主要是通过计算机和网络。凡是经过计算机处理的数据都很容易收集,比如浏览器里的搜索、点击、网上购物、其他数据(比如气温、海水盐度、地震波)可以通过传感器转化成数字信号输入计算机。
收集到的数据一般要先经过整理,常用的软件:Tableau和Impure是功能比较全面的,Refine和Wrangler是比较纯粹的数据整理工具,Weka用于数据挖掘。
Hadoop是一个能够对大量数据进行分布式处理的软件框架。用于统计分析的R语言有个扩展RHadoop,可以在Hadoop集群上运行R代码。更具体的自己搜索吧。
可视化输出的工具很多。建议参考wikipedia的“数据可视化”条目。
Tableau、Impure都有可视化功能。R语言也可以绘图。
还有很多可以用来在网页上实现可视化输出的框架或者控件。
大致基于四种技术:Flash(Flex)或者JS(HTML5)或者Java或者ASPNET(Silverlight)
Flash的有Degrafa、BirdEye、Axiis、OpenFlashChart
JS的有Ajaxorg、SenchaExtJS、Filament、jQchart、Flot、Sparklines、gRaphael、TufteGraph、Exhibit、PlotKit、、MilkChart、GoogleChartAPI、Protovis
Java的有Choosel、google--java、GWTChronoscope、JFreeChart
ASPNET的有TelerikCharts、Visifire、DundasChart
目前我比较喜欢d3(Data-DrivenDocuments),图形种类丰富,有交互能力,你可以去d3jsorg看看,有很多种图形的demo。
包解压C盘:C:\libsvm-3182要用libsvm自带脚本gridpyeasypy,需要官网载绘图工具gnuplot,解压c盘进入c:\libsvm\tools目录用文本编辑器(记事本edit都)修改gridpyeasypy两文件找其关于gnuplot路径项根据实际路径进行修改并保存
python与libsvm连接(参考SVM习笔记(2)LIBSVMpython使用)
1打IDLE(pythonGUI)输入>>>importsys>>>sysversion
2python32位现字符:
(default,Apr102012,23:31:26)[MSCv150032bit(Intel)]’
候LIBSVMpython接口设置非简单libsvm-316文件夹windows文件夹找态链接库libsvmdll其添加系统目录`C:\WINDOWS\system32\’即python使用libsvm
wk_ad_begin({pid : 21});wk_ad_after(21, function(){$('ad-hidden')hide();}, function(){$('ad-hidden')show();});
3执行例
importos
oschdir('C:\libsvm-318\python')#请根据实际路径修改
fromsvmutilimport
y,x=svm_read_problem('/heart_scale')#读取自带数据
m=svm_train(y[:200],x[:200],'-c4')
p_label,p_acc,p_val=svm_predict(y[200:],x[200:],m)
##现结应该确安装optimizationfinished,#iter=257nu=0351161
obj=-225628984,rho=0636110nSV=91,nBSV=49
TotalnSV=91
Accuracy=842857%(59/70)(classification)
F
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)