一、WEKA的安装
在WEKA的安装文件中有weka-3-5-6.exe和weka-3-5-6jre.exe,这两个软件我们安装一个即可,它们的区别是weka-3-5-6.exe只安装WEKA,而weka-3-5-6jre.exe是将WEKA和JRE一起安装,所以在安装之前我们应该首先检查一下我们的电脑中是否安装了JRE,如果本机中已经安装了JRE,那么我们就选择weka-3-5-6.exe安装程序,如果没有安装JRE,我们就选择weka-3-5-6jre.exe安装程序,下面我们来分别介绍这两种安装方法。
1、 weka-3-5-6.exe
若本机中已经安装了JRE,那么我们就选择安装此文件,双击此文件开始进行安装,在出现的窗芹庆口中点击Next
然后点击I Agree
再点击Next
此时出现如下窗口,Browse左边的区域是WEKA的默认安装路径,我们可以点击Browse选择我们想要安装WEKA的位置,然后点击窗口下方的NEXT,也可以不点击Browse直接将WEKA安装到默认的目录下,即直接点击窗口下方的NEXT,
在新出现的窗口中点击Install开始安装,
等待几秒种后点击Next
在新窗口中会有一个Start Weka单选框(默认情况下是选中的),如果我们想安装完成后就启动WEKA,那么我们就直接点击新窗口下方的FINISH 完成安装,如果我们不想立即启动WEKA可以单击Start Weka前面的单选框,然后点击FINISH即可完成安装,此时WEKA已经安装到我们的电脑中。
2、 weka-3-5-6jre.exe
若本机中没有安装JRE,我们选择安装此文件,双击此文件开始进行安装,在出现的窗口中点击Next
然后点击I Agree
再点击Next
此时出现如下窗口
Browse左边的区嫌枝握域是默认安装WEKA的地方,我们可以点击Browse选择我们想将WEKA安装的位置,然后点击窗口下方的NEXT,也可以不点击Browse直接将WEKA安装到默认的目录下,即直接点击窗口下方的NEXT,
在新出现的窗口中点击Install开始安装,
等待搭烂几秒种后在新出现的窗口中直接点击下方的接受(此时进行的是典型安装模式),
然后等待几分钟,此时正在安装的是J2SE Runtime Environment,待安装完毕我们点击完成,
然后在新出现的窗口中点击NEXT,
在新窗口中会有一个Start Weka单选框(默认情况下是选中的),如果我们想安装完成后就启动WEKA,那么我们就直接点击新窗口下方的FINISH 完成安装,如果我们不想立即启动WEKA可以单击Start Weka前面的单选框,然后点击FINISH即可完成安装。
此时WEKA和JRE均已安装到我们的电脑中。
3、配置环境变量
以上两种不同的方式安装完成后我们都还要配置环境变量,右键单击桌面上的我的电脑,点击属性,
在新出现的系统属性窗口中点击高级,
然后点击窗口下方的环境变量,此时会出现一个环境变量窗口,
该窗口有两个区域,上面的是Administrator的用户变量,下面的是系统变量,我们需要配置的是下面的这个区域中的变量。找到下面系统变量窗口中的PATH变量并双击,在变量值的区域中的最前面添上我们的JRE的安装路径(注意要到BIN文件)。
例如如果我们安装的时候选择的是默认的安装目录,那么就添加如下内容:C:\Program Files\Java\jre1.5.0_13\bin
若没有PATH变量可以点击窗口下方的新建按钮添加此属性,
在变量名中输入PATH,在变量值中输入C:\Program Files\Java\jre1.5.0_13\bin,然后点击确定按钮)。
然后点击确定
点击确定
点击确定即可,此时环境变量配置完成。
二、WEKA的启动
在开始程序中找到WEKA3.5.6(注意版本不同名称也不同,但都是叫WEKA……),选择WEKA3.5(with console)
单击即可启动WEKA,启动WEKA时我们会发现首先出现的是一个命令提示符
等待几秒种后又出现了一个窗口Weka3.5.6
这个窗口就是WEKA的主窗口,接下来我们就可以使用WEKA工具了。
三、连接数据库方法
但是这时在刚才出现的命令提示符中有这样一行信息:
Trying to add JDBC driver: oracle.jdbc.driver.OracleDriver - Error, not in CLASS
PATH?
这则信息说明我们无法连接数据库,这时我们进行连接数据库的配置。
在WEKA的安装目录下(如C:\Program Files\Weka-3-5)新建一个lib目录,将安装文件中的数据库Driver for JDBC(jar包)即ojdbc14.jar文件拷贝进lib,然后再右键点击桌面上的我的电脑,选择属性
切换到高级选项卡
点击窗口下方的环境变量(和刚才配置环境变量时一致),在系统变量中双击CLASSPATH(若没有此变量也需要点击新建按钮来添加,方法和前面添加PATH变量一致)
在编辑系统变量窗口中的变量值中的最前面添加ojdbc14.jar文件所在的目录,最前面要加上“.”,假如还以刚才的目录为例,则应添加:.C:\Program Files\Weka-3-5\lib\ojdbc14.jar
然后点击确定——>确定——>确定即可。
然后我再将WEKA安装程序中的DatabaseUtils.props文件复制到WEKA的安装路径下(如C:\Program Files\Weka-3-5),weka运行时会使用此文件。用UltraEdit打开此文件对里面的内容进行更改。
找到:
# database URL
jdbcURL=jdbc:oracle:thin:@10.8.2.16:1521:olap将jdbcURL的内容改为我们想要连接的数据库,如jdbcURL=jdbc:oracle:thin:@10.8.102.6:1521:hollycrm(假如我们安装的是ORACLE数据库,连接到10.8.102.6这台服务器,服务器的端口号(port)为:1521,服务器的名称为hollycrm)然后保存修改即可
重新打开WEKA,我们发现命令提示符中刚才的信息现在没有了,说明我们配置成功了,然后我们点击WEKA3.5.6窗口第二个菜单(Applications)下的Explorer
这时我们就打开了Explorer窗口,在该窗口的第二栏中有四个可点按钮,我们点击第三个按钮:Open DB……
这时会出现一个新的窗口,窗口的最上方CONNECTION信息中的URL就是我们刚刚配置地址,我们点击URL右边的USER按钮
在新出现的对话窗口中分别填上我们要登陆的数据库的用户名和密码,然后点击OK,再点击USER右边的按钮:CONNECT,此时如果在最下方的INFO窗口中会显示这样的信息:connecting to:jdbc:oracle:thin:@10.8.102.6:1521:hollycrm=true ,则说明我们连接数据库成功
相反,如果显示的信息为:connecting to:jdbc:oracle:thin:@10.8.102.6:1521:hollycrm=flase……,则说明我们连接数据库失败。
连接成功后我们就可以在中间的Query窗口中进行一些简单的数据库 *** 作了。
四、调整JVM
如果我们在使用WEKA的过程中,在导入csv文件时出现了JVM堆大小不够的问题,我们就需要调整JVM的参数,将内存扩充到至少512M,调整方法如下:
在WEKA的安装目录下(如C:\Program Files\Weka-3-5)找到RunWeka.ini文件,打开此文件,将此文件后面的maxheap=128m修改为maxheap=512m,然后保存即可。
注:此参数需要视数据和机器设备情况综合考虑调整。
此时WEKA安装配置均已完成。
祝顺利!有问题,请追问.有帮助,望采纳.
数大闹据挖掘用什么软件1.R是用于统计分析和图形化的计算机语言及分析工具;
2.Weka可能是名气最大的开源机器学习和数据挖掘软件,但用起来并不方便,界面也简单了点;
3.Tanagra 是使用图形界面的数据挖掘软件;4.RapidMiner现在流行的势头在上升,但它的 *** 作方式和商用软件差别较大,不支持分析流程图的方式,当包含的运算符比较多的时候就不容易查看了;
5.KNIME和Orange看起来都不错,Orange界面看上去很清爽,但我发现它不支持中 文。推荐KNIME,同时安装Weka和R扩展包。
对于普通用户可以选 用界面友好易于使用的软件,对于希望从事算法开发的用户则可以根据软件开发工具不同(Java、R、C++、Python等)来选择相应的软件。
求推荐简单好用的数据挖掘软件 10分
那肯定是SPSS啊,网上自学教程也一堆,如果你不追求特别专业的,只是想数据可视化的基础上有意思数据挖掘的功能,也可以用watson *** ytics,它还支持自然语言呢
常用的数据挖掘工具有哪些
RapidMiner、R、Weka、KNIME、GGobi、Orange,都是优秀的挖掘工具,可以依据自己的需要选择。
常用数据挖掘工具有哪些
EXCEL MATLAB Origin 等等
当前流行的图形可视化和数据分析软件有Matlab,Mathmatica和Maple等。这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果。 但它又比excel要强大些。一般日常的话可以用Excel,然后加载宏,里面有一些分析工具,不过有时需要数据库软件支持
学习数据挖掘一般要学哪些软件和工具
1、WEKA
WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。
2、RapidMiner
该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。
RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括 *** 使用的 MediaWiki。
3、NLTK
当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。
而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
4、Orange
Python 之所以受欢迎,是因为它简单世御易学并且功能强大。如果你是一个 Python 开发者,当涉及到需要找一个工作用的工具时,那么没有比 Orange 更合适的了。它是一个基于 Python 语言,功能强大的开源工具,并且对初学者和专家级的大神均适用。
此外,你肯定会爱上这个工具的可视化编程和 Python 脚本。它滚返罩不仅有机器学习的组件,还附加有生物信息和文本挖掘,可以说是充满了数据分析的各种功能。
5、KNIME
数据处理主要有三个部分:提取、转换和加载。 而这三者 KNIME 都可以做到。 KNIME 为您提供了一个图形化的用户界面,以便对数据节点进行处理。它是一个开源的数据分析、报告和综合平台,同时还通过其模块化数据的流水型概念,集成了各种机 器学习的组件和数据挖掘,并引起了商业智能和财务数据分析的注意。
KNIME 是基于 Eclipse,用 Java 编写的,并且易于扩展和补充插件。其附加功能可随时添加,并且其大量的数据集成模块已包含在核心版本中。
6、R-Programming
如果我告诉你R项目,一个 GNU 项目,是由 R(R-programming简称,以下统称R)自身编写的,你会怎么想?它主要是由 C 语言和 FORTRAN 语言编写的,并且很多模块都是由 R 编写的,这是一款针对编程语言和软件环境进行统计计算和制图的免费软件。
R语言被广泛应用于数据挖掘,以及开发统计软件和数据分析中。近年来,易用性和可扩展性也大大提高了 R 的知名度。除了数据,它还提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收......
学习数据挖掘一般要学哪些软件和工具
1、WEKA
WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。
2、RapidMiner
该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。
RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括 *** 使用的 MediaWiki。
3、NLTK
当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。
而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
目前业界常用的数据挖掘分析工具有哪些
数据分析的概念太宽泛了,做需要的是侧重于数据展示、数据挖掘、还是数据存储的?是个人用还是企业、部门用呢?应用的场景是制作简单的个人图表,还是要做销售、财务还是供应链的分析?
那就说说应用最广的BI吧,企业级应用,其实功能上已经涵盖了我上面所述的部分,主要用于数据整合,构建分析,展示数据供决策分析的,譬如FineBI,是能够”智能”分析数据的工具了。
哪个软件建立数据库比较简单好用
随着数据大数据的发展,数据安全已经上升到一个很高的高度。随着国家对数据安全的重视,国产数据库开始走进中国个大企业,其中不乏 *** 、国企。
实时数据库系统是开发实时控制系统、数据采集系统、CIMS系统等的支撑软件。在流程行业中,大量使用实时数据库系统进行控制系统监控,系统先进控制和优化控制,并为企业的生产管理和调度、数据分析、决策支持及远程在线浏览提供实时数据服务和多种数据管理功能。实时数据库已经成为企业信息化的基础数据平台,可直接实时采集、获取企业运行过程中的各种数据,并将其转化为对各类业务有效的公共信息,满足企业生产管理、企业过程监控、企业经营管理之间对实时信息完整性、一致性、安全共享的需求,可为企业自动化系统与管理信息系统间建立起信息沟通的桥梁。帮助企业的各专业管理部门利用这些关键的实时信息,提高生产销售的营运效率。如果你想定制这款国产数据库 可以打 前面是 一三六 中间是 六一二零 末尾是 四一四七
北京开运联合信息技术股份有限公司-实时性工业数据库软件(CreatRun Database )
实时性工业数据库软件(CreatRun Database )是什么?
1、实时性工业数据库软件(CreatRun Database ) 是开运联合公司针对行业应用,独立研发的,拥有全部自主知识产权的企业级实时/历史数据库平台。为企业监控生产情况、计算性能指标、进行事故分析和对设备启停分析诊断、故障预防等提供重要的数据保障。
2、实时性工业数据库软件(CreatRun Database ) 可广泛用于工业控制自动化数据的高速采集和存储,提供高速、海量数据存储和基础分析能力。
3、实时性工业数据库软件(CreatRun Database ) 可随时观察以及在线分析生产过程。长期保存的历史数据不仅可以重现历史生产情况,也使大规模数据挖掘成为可能。 提供企业生产信息管理解决方案,可以有效应对“从小到大” “由近及远” 的各种企业级数据应用。
4、CreatRun Database 可在线按照时间序列以毫秒级精度自动采集企业的各类过程自动化系统中的生产数据,高效压缩并存储。同时可向用户和应用程序提供实时和历史数据,使得用户可随时观察以及在线分析生产过程。长期保存的历史数据不仅可以重现历史生产情况,也使大规模数据挖掘成为可能。
【工业软件开发】实时性工业数据库软件(CreatRun Database )系统主要技术指标:
支持数据类型:digital、int16、int32、float16、float32、float64、String等类型
标签容量:200,000 Tag
数据容量:TB级
客户端并发用户数:500 个
生产过程数据采集时间响应速度:<500 毫秒
时间戳分辨率:毫秒
存储速度:>100,000 输入值/秒存档数据回取事务吞吐量:>2,000,000 输出值/秒
实时性工业数据库软件(CreatRun Database )系统特性——高可用性:
1、高效的数据存储策略及压缩算法“死区例外+可变斜率压缩算法 ”,精确到每个Tag的压缩配置,有效提高了历史数据存储性能,节约磁盘空间.
2、高速的数据缓存机制,使并行访问锁域粒度精确到“Block(1KBytes)”,实现了并行访问能力的最大化。使历史数据访问路由复杂度“最小化、均衡化,扁平化”,不界定“冷热”数据,所有数据访问时间成本一致,同时提供均衡访问特性和最大远程数据访问友好度。
3、Creat RUN ......
数据挖掘工具一般都有哪些
数据挖掘工具有国外的Qlik,国内的有永洪,收费是肯定的,你可以先去找些可以免费试用的挖掘工具,国内的ETHINK平台好像可以
数据挖掘工具有哪些?
SQL Server是数据库,但内建数据挖掘功能,若提到工具的话,大概有SAS, SPSS, Statistica(Dell), R, Revolution R...
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)