开源的字符串匹配算法有哪些

开源的字符串匹配算法有哪些,第1张

匹配整个字符串: /^javascript$/ 匹配包含: /javascript/ 匹配整个建议用==或者indexOf,(即不需要使用正则表达式) 正则表达式的优点在于模式匹配, 缺点是它的性能远比普通的字符串查找低下

数据挖掘,又称为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤,是一个挖掘和分析大量数据并从中提取信息的过程。其中一些应用包括市场细分-如识别客户从特定品牌购买特定产品的特征,欺诈检测-识别可能导致在线欺诈的交易模式等。在本文中,沙河电脑培训整理了进行数据挖掘的8个最佳开源工具。



1、Weka

WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

2、RapidMiner

RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。

3、Orange

Orange是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++和Python开发,它的图形库是由跨平台的Qt框架开发。

4、Knime

KNIME(KonstanzInformationMiner)是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。

5、jHepWork

jHepWork是一套功能完整的面向对象科学数据分析框架。Jython宏是用来展示一维和二维直方图的数据。该程序包括许多工具,可以用来和二维三维的科学图形进行互动。

6、ApacheMahout

ApacheMahout是ApacheSoftwareFoundation(ASF)开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在Apache在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout包含许多实现,包括集群、分类、CP和进化程序。此外,通过使用ApacheHadoop库,Mahout可以有效地扩展到云中。

7、ELKI

ELKI(EnvironmentforDevelopingKDD-ApplicationsSupportedbyIndex-Structures)主要用来聚类和找离群点。ELKI是类似于weka的数据挖掘平台,用java编写,有GUI图形界面。可以用来寻找离群点。

我经常去CSDN中搜索和PUDN中查找,另外ESRI论坛也是一个不错的选择。CSDN和PUDN都需要积分,但是PUDN由于封闭性网站,不好下载,积分需要你上传才能获得,但code质量的确好。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12748117.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存