开源的数据库有哪些?_sql

四大开源数据库是哪些

开源世界中的那几个免费数据库

发布时间：2011-11-22 09:34:30 来源：CSDN 评论：0 点击：1476 次【字号：大中小】

QQ空间新浪微博腾讯微博人人网豆瓣网百度空间百度搜藏开心网复制更多 0

开源数据库MySQLMySQL是一个开放源码的小型关联式数据库管理系统，开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低，尤其是开放源...

开源数据库MySQL

MySQL是一个开放源码的小型关联式数据库管理系统，开发者为瑞典MySQL AB公司。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。

盘点：开源社区那些免费的数据库软件

MySQL为多种编程语言提供了API，包括C、C++、C#、Delphi、Eiffel、Java、Perl、PHP、Python、Ruby和Tcl等。而其自身是采用C和C++编写的，使用了多种编译器进行测试，所以，MySQL能够保证源代码具有很强的可移植性。这样的一款数据库，自然能够支持几乎所有的 *** 作系统，从Unix、Linux到Windows，具体包括AIX、BSDi、FreeBSD、HP-UX、Linux、Mac OS、Novell Netware、NetBSD、OpenBSD、OS/2 Wrap、Solaris、SunOS、Windows等多种 *** 作系统。最重要的是，它是一个可以处理拥有上千万条记录的大型数据库。

与此同时，MySQL也产生了很多分支版本的数据库也非常值得推荐。

首先是MariaDB，它是一个采用Maria存储引擎的MySQL分支版本，是由原来MySQL的作者 Michael Widenius创办的公司所开发的免费开源的数据库服务器。与MySQL相比较，MariaDB更强的地方在于它拥有更多的引擎，包括Maria存储引擎、PBXT存储引擎、XtraDB存储引擎、FederatedX存储引擎，它能够更快的复制查询处理、运行的速度更快、更好的功能测试以及支持对Unicode的排序等。

其次是rcona，它为MySQL数据库服务器进行了改进，在功能和性能上较MySQL有着很显著的提升。该版本提升了在高负载情况下的InnoDB的性能，同时，它还为DBA提供一些非常有用的性能诊断工具，并且提供很多参数和命令来控制服务器行为。

第三是Percona Server，它使用了诸如google-mysql-tools、Proven Scaling和 Open Query对MySQL进行改造。并且，它只包含MySQL的服务器版，并没有提供相应对 MySQL的Connector和GUI工具进行改进。

非关系型数据库NoSQL

从NoSQL的字面上理解，NoSQL就是Not Only SQL，被业界认为是一项全新的数据库革命性运动，早期就有人提出，发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储，相对于目前铺天盖地的关系型数据库运用，这一概念无疑是一种全新的思维的注入。

盘点：开源社区那些免费的数据库软件

当然，NoSQL也是随着互联网Web2.0网站的兴起才能取得长足的进步。关键的需求在于，传统的关系数据库在应付Web2.0网站，特......>>

该选择哪个开源数据库

如果打算为项目选择一款免费、开源的数据库，那么你可能会在MySQL与PostgreSQL之间犹豫不定。MySQL与PostgreSQL都是免费、开源、强大、且功能丰富的数据库。你主要的问题可能是：哪一个才是最好的开源数据库，MySQL还是PostgreSQL呢？该选择哪一个开源数据库呢？

在选择数据库时，你所做的是个长期的决策，因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。

MySQL

MySQL相对来说比较年轻，首度出现在1994年。它声称自己是最流行的开源数据库。MySQL就是LAMP（用于Web开发的软件包，包括Linux、Apache及Perl/PHP/Python）中的M。构建在LAMP栈之上的大多数应用都会使用MySQL，包括那些知名的应用，如WordPress、Drupal、Zend及phpBB等。

一开始，MySQL的设计目标是成为一个快速的Web服务器后端，使用快速的索引序列访问方法（ISAM），不支持ACID。经过早期快速的发展之后，MySQL开始支持更多的存储引擎，并通过InnoDB引擎实现了ACID。MySQL还支持其他存储引擎，提供了临时表的功能（使用MEMORY存储引擎），通过MyISAM引擎实现了高速读的数据库，此外还有其他的核心存储引擎与第三方引擎。

MySQL的文档非常丰富，有很多质量不错的免费参考手册、图书与在线文档，还有来自于Oracle和第三方厂商的培训与支持。

MySQL近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由MySQL AB开发的，然后在2008年以10亿美金的价格卖给了Sun公司，Sun公司又在2010年被Oracle收购。Oracle支持MySQL的多个版本：Standard、Enterprise、Classic、Cluster、Embedded与munity。其中有一些是免费下载的，另外一些则是收费的。其核心代码基于GPL许可，对于那些不想使用GPL许可的开发者与厂商来说还有商业许可可供使用。

现在，基于最初的MySQL代码还有更多的数据库可供选择，因为几个核心的MySQL开发者已经发布了MySQL分支。最初的MySQL创建者之一Michael "Monty" Widenius貌似后悔将MySQL卖给了Sun公司，于是又开发了他自己的MySQL分支MariaDB，它是免费的，基于GPL许可。知名的MySQL开发者Brian Aker所创建的分支Drizzle对其进行了大量的改写，特别针对多CPU、云、网络应用与高并发进行了优化。

PostgreSQL

PostgreSQL标榜自己是世界上最先进的开源数据库。PostgreSQL的一些粉丝说它能与Oracle相媲美，而且没有那么昂贵的价格和傲慢的客服。它拥有很长的历史，最初是1985年在加利福尼亚大学伯克利分校开发的，作为Ingres数据库的后继。

可靠性是PostgreSQL的最高优先级。它以坚如磐石的品质和......>>

该选择哪个开源数据库？哪一个更好

Access是一种桌面数据库，只适合数据量少的应用，在处理少量数据和单机访问的数据库时是很好的，效率也很高。但是它的同时访问客户端不能多于4个。Microsoft Access数据库有一定的极限，如果数据达到100M左右，很容易造成服务器iis假死，或者消耗掉服务器的内存导致服务器崩溃，表现为英文“Service Unavailable”。

MS SQL Server是基于服务器端的中型的数据库，可以适合大容量数据的应用，在功能上管理上也要比Microsoft Access要强得多。在处理海量数据的效率，后台开发的灵活性，可扩展性等方面强大。因为现在数据库都使用标准的SQL语言对数据库进行管理，所以如果是标准SQL语言，两者基本上都可以通用的。Microsoft SQL Server还有更多的扩展，可以用存储过程，数据库大小无极限限制。

MySql短小精悍，像access一样的文件型数据库，但比access强百倍，是真正多用户多任务的数据库系统，从Linux上移植过来的，安全性非常好，不过大部分 *** 作是在dos下进行，虽然也有第三方开发的图形界面但并不好用。MySQL是跨多平台的数据库管理软件，可运行于LINUX、NT、UNIX等系统，可支持命令和图形化管理，对于一般的数据库足以应付了，占用系统资源较少，速度较快，而且是开源的。

Oracle各方面都比较成熟,但对硬件要求高，用于数据完整性、安全性要求较高的场合，能在所有主流平台上运行，完全支持所有的工业标准，采用完全开放策略。可以使客户选择最适合的解决方案，对开发商全力支持。平行服务器通过使一组结点共享同一簇中的工作来扩展服务器的能力,提供高可用性和高伸缩性的簇的解决方案，获得最高认证级别的iso标准认证，多层次网络计算，支持多种工业标准，可以用odbc,jdbc,oci等网络客户连接，较复杂，同时提供gui和命令行，在windows和unix下 *** 作相同，如果windows不能满足需要,用户可以把数据库移到unix中。其 *** 作和设置比较复杂，适用于有一定 *** 作经验的用户。

db2 能在所有主流平台上运行（包括windows）。最适于海量数据。DB2在企业级的应用最为广泛，在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器，而国内到97年约占5%。

总之，各个主流数据库各有优势与侧重，对于初学者而言，建议从MS SQL Server 着手学习，众所周知，微软的东西么，简单易懂。

该选择哪个开源数据库

如果打算为项目选择一款免费、开源的数据库，那么你可能会在MySQL与PostgreSQL之间犹豫不定。MySQL与PostgreSQL都是免

费、开源、强大、且功能丰富的数据库。你主要的问题可能是：哪一个才是最好的开源数据库，MySQL还是PostgreSQL呢？该选择哪一个开源数据库

呢？

在选择数据库时，你所做的是个长期的决策，因为后面如果再改变决定将是非常困难且代价高昂的。你希望一开始就选择正确。两个流行

的开源数据库MySQL与PostgreSQL常常成为最后要选择的产品。对这两个开源数据库的高层次概览将会有助于你选择最适合自己需要的。

MySQL

MySQL相对来说比较年轻，首度出现在1994年。它声称自己是最流行的开源数据库。MySQL就是LAMP（用于Web开发的软件包，包括

Linux、Apache及Perl/PHP/Python）中的M。构建在LAMP栈之上的大多数应用都会使用MySQL，包括那些知名的应用，如

WordPress、Drupal、Zend及phpBB等。

一开始，MySQL的设计目标是成为一个快速的Web服务器后端，使用

快速的索引序列访问方法（ISAM），不支持ACID。经过早期快速的发展之后，MySQL开始支持更多的存储引擎，并通过InnoDB引擎实现了

ACID。MySQL还支持其他存储引擎，提供了临时表的功能（使用MEMORY存储引擎），通过MyISAM引擎实现了高速读的数据库，此外还有其他的

核心存储引擎与第三方引擎。

MySQL的文档非常丰富，有很多质量不错的免费参考手册、图书与在线文档，还有来自于Oracle和第三方厂商的培训与支持。

MySQL近几年经历了所有权的变更和一些颇具戏剧性的事件。它最初是由MySQL

AB开发的，然后在2008年以10亿美金的价格卖给了Sun公司，Sun公司又在2010年被Oracle收购。Oracle支持MySQL的多个版

本：Standard、Enterprise、Classic、Cluster、Embedded与munity。其中有一些是免费下载的，另外一

些则是收费的。其核心代码基于GPL许可，对于那些不想使用GPL许可的开发者与厂商来说还有商业许可可供使用。

现在，基于最初的

MySQL代码还有更多的数据库可供选择，因为几个核心的MySQL开发者已经发布了MySQL分支。最初的MySQL创建者之一Michael

"Monty"

Widenius貌似后悔将MySQL卖给了Sun公司，于是又开发了他自己的MySQL分支MariaDB，它是免费的，基于GPL许可。知名的

MySQL开发者Brian Aker所创建的分支Drizzle对其进行了大量的改写，特别针对多CPU、云、网络应用与高并发进行了优化。

PostgreSQL

PostgreSQL是完全由社区驱动的开源项目，由全世界超过1000名贡献者所维护。它提供了单个完整功能的版本，而不像MySQL那样提供了多个

不同的社区版、商业版与企业版。PostgreSQL基于自由的BSD/MIT许可，组织可以使用、复制、修改和重新分发代码，只需要提供一......>>

现在的开源图形数据库有哪些

什么是开源数据库

开源意思是开放源代码，没有加密

开源数据库，说明这个数据库没有加密的，代码就是开放的

数据库作用都是用于动态语言开发的网站

有哪些开源的 POI 数据库

这个多了去了 ,apache 绝对是开源里面的领头羊 for example: 分类项目名说明开发语言服务器（共20） Apache HTTP Server全球第一HTTP服务器C/C++ TomcatJava的Web服务器Java James邮件服务器Java SpamAssassin反垃圾邮件C/C++ PerlApache的...

介绍几个比较好的面向对象数据库，最好是开源的。

db4o

Java连接多个数据库有什么开源实现吗

1. 如果是 MySQL 中的多个数据据实例的话， *** 作数据库时，使用 schema.table 就可以了

2. 如果是 MySQL 数据库和其他数据库同时使用的话，需要在 Spring 中配置多个 datasource，(ITJOB）

该选择哪个开源数据库？哪一个更好

1.MySQL 5

作为当今最流行的开放源码数据库之一，MySQL数据库为用户提供了一个相对简单的解决方案，适用于广泛的应用程序部署，能够降低用户的TCO。MySQL是一个多线程、结构化查询语言(SQL)数据库服务器。MySQL的执行性能高，运行速度快，容易使用。

MySQL包括以下几个关键优势：

◆ 可靠的性能和服务MySQL向公众提供所有数据库服务器软件的早期版本，都是利用开放源码进行为期几个月的测试之后才发布作为生产之用。

◆ 易于使用和部署MySQL的结构体系易于定制，运行速度快，其独特的多存储引擎结构为企业客户提供了灵活性，为数据库管理系统带来紧致性和稳定性，易于部署。

◆ 自由获得源码可以随时访问MySQL源代码，其策略确保了自由性，避免锁定某家公司或平台。

◆ 跨平台支持MySQL可用于20多种不同平台，包括主要的Linux系统、Mac OS X、Unix和Windows

◆ 可信赖的开发力量MySQL拥有大量的用户基础，也拥有高素质、有经验的开发团队。

◆ 满足企业需求MySQL结构体系简单易用，运行速度极快，能够处理企业数据库绝大多数的应用需求。

2008年12月8日,Sun Microsystems公司宣布，正式对外提供MySQL 5.1软件 —— 这是全球最受欢迎的开源数据库MySQL的一个极其重要的新版本。MySQL 5.1 GA版现通过以下三种模式提供，以满足不同用户的各种特殊需求：

◆MySQL munity Server —— Sun的MySQL 数据库的免费开源版。这一GPL许可的全功能软件的目标用户是个人技术用户，他不需要商业支持或是享有优惠的机上服务。

◆MySQL Enterprise Server —— 它作为MySQL Enterprise订购的一部分来提供，它最可靠、最安全，提供的是MySQL数据库的最新版本，其目标用户是有法人的IT用户。该模式的订户每月可收到快速软件升级服务，每个季度可收到带有最新补丁程序的“服务包” —— 还能访问仅供预览的监测工具，享受全天候7*24的生产技术支持。

◆MySQL Embedded Server —— 这是MySQL软件的商业许可模式，让ISV和OEM将一个高速的、占用空间很小的数据库嵌入或打包到他们自己的产品中，而不需要免费的GPL许可。

2. PostgreSQL

PostgreSQL是一个功能齐全、开放源码的对象一关系性数据库管理系统 (ORDBMS)。目前，PostgreSQL的稳定版本为8.4版，具有丰富的特性和商业级数据库管理系统的特质。这是一次向高质量大型数据库管理系统方向的飞跃。PostgreSQL是很富特色的开源数据库管理系统，其特性覆盖SQL-2/SQL-92和SQL-3/SQL-99。

◆ 丰富的数据类型PostgreSQL包括了丰富的数据类型支持，其中有些数据类型连商业数据库都不具备，比如IP类型和几何类型等。

◆ 功能全面PostgreSQL是全功能的开源软件数据库，全面支持事务、子查询、多版本并行控制系统和数据完整性检查等特性。

◆ 活跃的开发队伍PostgreSQL拥有一支活跃的开发队伍，在他们的努力下，PostgreSQL的质量日益提高，增强了人们使用PostgreSQL 的信心。

◆ 丰富的接口PostgreSQL支持几乎所有类型的数据库客户端接口。

◆ 支持多种平台PostgreSQL是目前支持平台最多的数据库管理系统之一，所支持的平台多达十几种，包括不同的系统和不同的硬件体系。

◆ 满足商用需求......>>

问题一：内存数据库主流的有哪些，并给出各自特点！这里介绍一些大型的市场占有率比较高的内存数据库，也是业界响当当的―SAP HANA、Oracle Exalytics、Orale TimesTen、IBM SolidDB，可以说他们之间没有说是哪个最好，主要还是看使用的场景和具体的需求，各自特点如下：

SAP HANA（High-Performance Analytic Appliance）是 SAP 公司于 2011 年推出的基于内存计算技术，面向企业分析性应用的产品。左图的系统架构示意图中可以看出， HANA 产品主要包括内存计算引擎和 HANA 建模工具两部分。它支持从 SAP 商务套件中同步更新业务数据，或者从 SAP BW（SAP 商务智能产品）和其他第三方数据源中批量导入数据，在 HANA 中进行运算后，提供给 SAP BI 客户端或者其他第三方展现工具进行分析和展现。

Oracle Exalytics 内存分析一体机是面向分析的集成设计系统，可以无限制提供最佳可视化分析和更智能的分析应用程序。如图所示， Oracle Exalytics 内存分析一体机的产品架构包括 3 个部分：内容分析硬件、内存分析软件和经过优化的 Oracle 商务智能基础套件（Oracle BI Foundation）。内存分析硬件部分是一台为基于内存计算的商务智能而特别优化的服务器，具有提供强劲计算能力的 40 核中央处理器，高达 1TB 的内存以及快速的网络. 内存分析软件部分的核心是 Oracle TimesTen 内存数据库。它是为 Exalytics 平台而特别优化的内存分析数据库，包括了很多 Oracle Exalytics 平台特有的功能。Oracle 商务智能基础套件部分受益于 Oracle Exalytics 内存分析一体机的大容量内存、处理器、并发处理能力、存储、网络、 *** 作系统、内核和系统配置等，可以提供明显优于传统软件的查询响应性、用户可用性和 TCO。

Oracle 内存数据库TimesTen 是一个基于内存计算的关系数据库，提供了响应时间极短且吞吐量极高的应用程序，可满足各行业应用程序的需求。 TimesTen 是一个可嵌入到应用程序中的数据库，通过消除进程间通信和网络开销，进一步提高数据库 *** 作的性能。Oracle 内存数据库 TimesTen 使用行级锁定和提交后读取 (mitted-read) 隔离，通过事务日志记录与数据库检查点相结合实现了基于磁盘的持久性和可恢复性。TimesTen 通常与多用户和多线程应用程序一起部署，应用程序直接通过 JDBC、 ODBC、 Oracle 调用接口、 Pro*C/C++ 和Oracle PL/SQL 编程接口，使用标准SQL 访问TimesTen 数据库。若运行在不同服务器上的多个应用程序共享一个数据库时，则使用常规的客户端/服务器访问方式。

IBM solidDB 是一个内存数据库，专为获取极高的速度和可用性而进行优化。如图所示，IBM solidDB 既可以单独部署作为独立的数据库支持应用程序，也可以部署为其他关系型数据库的加速缓存以提高应用程序性能。solidDB Universal Cache 功能将这些数据库中存储的性能关键型数据缓存到solidDB Universal Cache 中，加快领先关系数据库的速度。solidDB Universal Cache 功能使用检查点和事务日志将数据持久保存在磁盘上......>>

问题二：开源的内存数据库都有哪些 1.最简单的方法：

public static String reverse1(String str)

{

return new StringBuffer(str).reverse().toString()

}

2.最常用的方法：

public static String reverse3(String s)

{

char[] array = s.toCharArray()

String reverse = 注意这是空串，不是null

for (int i = array.length - 1i >= 0i--)

reverse += array[i]

return reverse

}

问题三：开源内存数据库有几种啊？常见的有FastDB、SQLite、Berkeley DB、GigaBASE，H2等

问题四：几种常用的开源内存数据库性能比较本人理解：orcal速度快但是维护不方便吗，费钱。mysql速度可以，维护方便，交orcal来说易上手。db2：大

问题五：开源的内存数据库有哪些支持SQL基准选择数据库实例―右键属性―选择【内存】选择页―修改内存―确定

问题六：C/C++开发的开源的分布式内存数据库有哪些 1.最简单的方法：

public static String reverse1(String str)

{

return new StringBuffer(str).reverse().toString()

}

2.最常用的方法：

public static String reverse3(String s)

{

char[] array = s.toCharArray()

String reverse = 注意这是空串，不是null

for (int i = array.length - 1i >= 0i--)

reverse += array[i]

return reverse

}

问题七：哪位达人用过关系型的内存数据库而且是开源的关系型数据库以行和列的形式存储数据，以便于用户理解。这一系列的行和列被称为表，一组表组成了数据库。表与表之间的数据记录有关系。用户用查询(Query)来检索数据库中的数据。一个Query是一个用于指定数据库中行和列的SELECT语句。关系型数据库通常包含下列组件：客户端应用程序(Client) 数据库服务器(Server) Structured Query Language(SQL)Client端和Server端的桥梁，Client用SQL来向Server端发送请求，Server返回Client端要求的结果。现在流行的大型关系型数据库有IBM DB2、Oracle、SQL Server、SyBase、Informix、access、foxpro等。

问题八：C/C++开发的开源的分布式内存数据库有哪些 1.最简单的方法：public static String reverse1(String str){ return new StringBuffer(str).reverse().toString()}2.最常用的方法：public static String reverse3(String s) { char[] array = s.toCharArray()String reverse = 注意这是空串，不是null for (int i = array.length - 1i >= 0i--) reverse += array[i]return reverse} 3.常用方法的变形： public static String reverse2(String s){ int length = s.length()String reverse = 注意这是空串，不是null for (int i = 0i 问题九：要求实时数据需要存储到内存库有开源内存数据库吗朋友您好，很高兴为您解答问题

请把问题补充完整

大家才能给你提供完善的建议

相信您在知道这个平台

一定会有满意的收获

真诚希望能够帮助您，如果满意请采纳，祝您好运常伴。

问题十：什么情况下用内存数据库相对于磁盘，内存的数据读写速度要高出几个数量级，将数据保存在内存中相比从磁盘 *** 问能够极大地提高应用的性能。同时，内存数据库抛弃了磁盘数据管理的传统方式，基于全部数据都在内存中重新设计了体系结构，并且在数据缓存、快速算法、并行 *** 作方面也进行了相应的改进，所以数据处理速度比传统数据库的数据处理速度要快很多，一般都在10倍以上。内存数据库的最大特点是其主拷贝或工作版本常驻内存，即活动事务只与实时内存数据库的内存拷贝打交道。显然，它要求较大的内存量，但并非任何时刻整个数据库都存放在内存，即内存数据库系统还是要处理I/O。

内存数据库是以牺牲内存资源为代价换取数据处理实时性的，内存数据库和磁盘数据库都是当今信息社会里每个企业所必须的关系型数据库产品，磁盘数据库解决的是大容量存储和数据分析问题，而内存数据库解决的是实时处理和高并发问题。两者的存在是相辅相成的，内存数据库的事务实时处理性能要远强于磁盘数据库。但是相对的，他的数据安全方面还没有达到磁盘数据库比肩的地步。

内存数据库将物理内存作为数据的第一存储介质，而将磁盘作为备份。随着电信业务的发展，系统对实时性的要求和对业务灵活修改的要求非常高，在此种情况下对于内存数据库的需求也越来越高。磁盘数据库的做法是将数据存入内存中进行处理，这种方式的可管理性及数据安全可靠性都没有保障。而内存数据库正是针对这一弱点进行了改进。

实际上，内存数据库并不是一项时髦技术，其出现于上世纪60年代末，但由于市场的需求原因在90年代后期才开始发展。作为新一代数据库，Altibase产品已经走向混合型数据库，其版本Altibase 4.0已经有一套自带的磁盘数据库，用户一旦购买了Altibase的内存数据库，就无须再购买磁盘数据库。它把热数据（经常被使用的、访问比较高的、经常要运算的数据）放在内存数据库里，而把历史性数据放在磁盘数据库里，可为用户进一步减少投资。

对于内存数据库而言，可以将同样数据库的部分内容存放于磁盘上，而另一部分存放于内存中。用户可以选择将数据存储在内存表中以提供即时的数据访问。若访问时间不紧急或数据存于内存中所占空间过大时，用户可将这些数据存入磁盘表中。

比如，在手机用户开始拔打电话时，如果应用基于内存数据库技术的混合数据管理引擎，就通过内存表检索其服务选项并立即验证用户身份，而将通话清单和计费清单归档到磁盘表中。从而，达到了速度与资源使用的平衡。

内存数据库的技术，一个很重要的特点，是可以对内存中的数据实现全事务处理，这是仅仅把数据以数组等形式放在内存中完全不同的。并且，内存数据库是与应用无关的，显然这种体系结构具有其合理性。内存引擎可以实现查询与存档功能使用的是完全相同的数据库，同时内存表与磁盘表也使用的是完全相同的存取方法。存储的选择，对于应用开发者而言是完全透明的。

对于内存数据库而言，实现了数据在内存中的管理，而不仅仅是作为数据库的缓存。不像其它将磁盘数据块缓存到主存中的数据库，内存数据库的内存引擎使用了为随机访问内存而特别设计的数据结构和算法，这种设计使其避免了因使用排序命令而经常破坏缓存数据库性能的问题。通过内存数据库，减少了磁盘I/O，能够达到了以磁盘I/O 为主的传统数据库无法与其相比拟的处理速度。

因此，内存数据库技术的应用，可以大大提高数据库的速度，这对于需要高速反应的数据库应用，如电信、金融等提供了有力支撑。

由于把大多数数据都放在内存中进行 *** 作，使得内存数据库有着比磁盘数据库高得多的性能表现，这一......>>

今天真是一个美好的时代，有无数的开源系统可以为我们提供服务，现在有许多开发软件可以用到工业大数据中，当然很多系统还不成熟，应用到工业中还需要小心，并且需要开发人员对其进行一定的优化和调整。下面就简单介绍一些开源的大数据工具软件，看看有哪些能够应用到工业大数据领域。

下面这张图是我根据网上流传的一张开源大数据软件分类图整理的：

我们可以把开源大数据软件分成几类，有一些可以逐步应用到工业大数据领域，下面就一一介绍一下这些软件。（以下系统介绍大都来源于网络）

1、数据存储类

（1）关系数据库MySQL

这个就不用太多介绍了吧，关系型数据库领域应用最广泛的开源软件，目前属于 Oracle 旗下产品。

（2）文件数据库Hadoop

Hadoop是大数据时代的明星产品，它最大的成就在于实现了一个分布式文件系统（Hadoop Distributed FileSystem），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的硬件上，而且它提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集的应用程序。

Hadoop可以在工业大数据应用中用来作为底层的基础数据库，由于它采用了分布式部署的方式，如果是私有云部署，适用于大型企业集团。如果是公有云的话，可以用来存储文档、视频、图像等资料。

（3）列数据库Hbase

HBase是一个分布式的、面向列的开源数据库，HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

基于Hbase开发的OpenTSDB，可以存储所有的时序（无须采样）来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集所有metrics，支持永久存储，可以做容量规划，并很容易的接入到现有的报警系统里。

这样的话，它就可以替代在工业领域用得最多的实时数据库。

（4）文档数据库MongoDB

MongoDB是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。他支持的数据结构非常松散，是类似json的bson格式，因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。

MongoDB适合于存储工业大数据中的各类文档，包括各类图纸、文档等。

（5）图数据库Neo4j/OrientDB

图数据库不是存放图片的，是基于图的形式构建的数据系统。

Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。

OrientDB是兼具文档数据库的灵活性和图形数据库管理链接能力的可深层次扩展的文档-图形数据库管理系统。可选无模式、全模式或混合模式下。支持许多高级特性，诸如ACID事务、快速索引，原生和SQL查询功能。可以JSON格式导入、导出文档。若不执行昂贵的JOIN *** 作的话，如同关系数据库可在几毫秒内可检索数以百记的链接文档图。

这些数据库都可以用来存储非结构化数据。

2、数据分析类

（1）批处理MapReduce/Spark

MapReduce是一种编程模型，用于大规模数据集（大于1TB）的并行运算。概念"Map（映射）"和"Reduce（归约）"，是它们的主要思想，都是从函数式编程语言里借来的，还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下，将自己的程序运行在分布式系统上。当前的软件实现是指定一个Map（映射）函数，用来把一组键值对映射成一组新的键值对，指定并发的Reduce（归约）函数，用来保证所有映射的键值对中的每一个共享相同的键组。

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoop 文件系统中并行运行。

这些大数据的明星产品可以用来做工业大数据的处理。

（2）流处理Storm

Storm是一个开源的分布式实时计算系统，可以简单、可靠的处理大量的数据流。Storm有很多使用场景：如实时分析，在线机器学习，持续计算，分布式RPC，ETL等等。Storm支持水平扩展，具有高容错性，保证每个消息都会得到处理，而且处理速度很快（在一个小集群中，每个结点每秒可以处理数以百万计的消息）。Storm的部署和运维都很便捷，而且更为重要的是可以使用任意编程语言来开发应用。

（3）图处理Giraph

Giraph是什么？Giraph是Apache基金会开源项目之一，被定义为迭代式图处理系统。他架构在Hadoop之上，提供了图处理接口，专门处理大数据的图问题。

Giraph的存在很有必要，现在的大数据的图问题又很多，例如表达人与人之间的关系的有社交网络，搜索引擎需要经常计算网页与网页之间的关系，而map-reduce接口不太适合实现图算法。

Giraph主要用于分析用户或者内容之间的联系或重要性。

（4）并行计算MPI/OpenCL

OpenCL（全称Open Computing Language，开放运算语言）是第一个面向异构系统通用目的并行编程的开放式、免费标准，也是一个统一的编程环境，便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码，而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器，在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。

（5）分析框架Hive

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

（6）分析框架Pig

Apache Pig 是apache平台下的一个免费开源项目，Pig为大型数据集的处理提供了更高层次的抽象，很多时候数据的处理需要多个MapReduce过程才能实现，使得数据处理过程与该模式匹配可能很困难。有了Pig就能够使用更丰富的数据结构。[2]

Pig LatinPig Latin 是一个相对简单的语言，一条语句就是一个 *** 作，与数据库的表类似，可以在关系数据库中找到它（其中，元组代表行，并且每个元组都由字段组成）。

Pig 拥有大量的数据类型，不仅支持包、元组和映射等高级概念，还支持简单的数据类型，如 int、long、float、double、chararray 和 bytearray。并且，还有一套完整的比较运算符，包括使用正则表达式的丰富匹配模式。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10871534.html

开源的数据库有哪些?

发表评论

评论列表（0条）