华为云提供的大数据MRS服务可以提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件。当前性价比很高,最小规格集群已经低至199元/小时,还有买10个月送2个月的活动。
在华为云社区找到了一个介绍MRS服务的云图说,可以MRS云图说。也可以到华为云MRS官方介绍页去看看。
通常数据库分为关系型数据库和非关系型数据库,关系型数据库的优势到现在也是无可替代的,比如MySQL、SQLServer、Oracle、DB2、SyBase、Informix、PostgreSQL以及比较小型的Aess等等数据库,这些数据库支持复杂的SQL *** 作和事务机制,适合小量数据读写场景;但是到了大数据时代,人们更多的数据和物联网加入的数据已经超出了关系数据库的承载范围。
大数据时代初期,随着数据请求并发量大不断增大,一般都是采用的集群同步数据的方式处理,就是将数据库分成了很多的小库,每个数据库的数据内容是不变的,都是保存了源数据库的数据副本,通过同步或者异步方式保证数据的一致性,每个库设定特定的读写方式,比如主数据库负责写 *** 作,从数据库是负责读 *** 作,等等根据业务复杂程度以此类推,将业务在物理层面上进行了分离,但是这种方式依旧存在一定的负载压力的问题,企业数据在不断的扩增中,后面就采用分库分表的方式解决,对读写负载进行分离,但是这种实现依旧存在不足,且需要不断进行数据库服务器扩容。
NoSQL数据库大致分为5种类型
1、列族数据库:BigTable、HBase、Cassandra、AmazonSimpleDB、HadoopDB等,下面简单介绍几个
(1)Cassandra:Cassandra是一个列存储数据库,支持跨数据中心的数据复制。它的数据模型提供列索引,log-structured修改,支持反规范化,实体化视图和嵌入超高速缓存。
(2)HBase:ApacheHbase源于Google的Bigtable,是一个开源、分布式、面向列存储的模型。在Hadoop和HDFS之上提供了像Bigtable一样的功能。
(3)AmazonSimpleDB:AmazonSimpleDB是一个非关系型数据存储,它卸下数据库管理的工作。开发者使用Web服务请求存储和查询数据项
(4)ApacheAumulo:ApacheAumulo的有序的、分布式键值数据存储,基于Google的BigTable设计,建立在ApacheHadoop、Zookeeper和Thrift技术之上。
(5)Hypertable:Hypertable是一个开源、可扩展的数据库,模仿Bigtable,支持分片。
(6)AzureTables:WindowsAzureTableStorageService为要求大量非结构化数据存储的应用提供NoSQL性能。表能够自动扩展到TB级别,能通过REST和ManagedAPI访问。
2、键值数据库:Redis、SimpleDB、Scalaris、Memcached等,下面简单介绍几个
(1)Riak:Riak是一个开源,分布式键值数据库,支持数据复制和容错。(2)Redis:Redis是一个开源的键值存储。支持主从式复制、事务,Pub/Sub、Lua脚本,还支持给Key添加时限。
(3)Dynamo:Dynamo是一个键值分布式数据存储。它直接由亚马逊Dynamo数据库实现;在亚马逊S3产品中使用。
(4)OracleNoSQLDatabase:来自Oracle的键值NoSQL数据库。它支持事务ACID(原子性、一致性、持久性和独立性)和JSON。
(5)OracleNoSQLDatabase:具备数据备份和分布式键值存储系统。
(6)Voldemort:具备数据备份和分布式键值存储系统。
(7)Aerospike:Aerospike数据库是一个键值存储,支持混合内存架构,通过强一致性和可调一致性保证数据的完整性。
3、文档数据库:MongoDB、CouchDB、Perservere、Terrastore、RavenDB等,下面简单介绍几个
(1)MongoDB:开源、面向文档,也是当下最人气的NoSQL数据库。
(2)CounchDB:ApacheCounchDB是一个使用JSON的文档数据库,使用Javascript做MapRece查询,以及一个使用>
(3)Couchbase:NoSQL文档数据库基于JSON模型。
(4)RavenDB:RavenDB是一个基于NET语言的面向文档数据库。
(5)MarkLogic:MarkLogicNoSQL数据库用来存储基于XML和以文档为中心的信息,支持灵活的模式。
4、图数据库:Neo4J、InfoGrid、OrientDB、GraphDB,下面简单介绍几个
(1)Neo4j:Neo4j是一个图数据库;支持ACID事务(原子性、独立性、持久性和一致性)。
(2):一个图数据库用来维持和遍历对象间的关系,支持分布式数据存储。
(3):是结合使用了内存和磁盘,提供了高可扩展性,支持SPARQ、RDFS和Prolog推理。
5、内存数据网格:Hazelcast、OracleCoherence、TerracottaBigMemorry、GemFire、Infinispan、GridGain、GigaSpaces,下面简单介绍几个
(1)Hazelcast:HazelcastCE是一个开源数据分布平台,它允许开发者在数据库集群之上共享和分割数据。
(2)OracleCoherence:Oracle的内存数据网格解决方案提供了常用数据的快速访问能力,一致性支持事务处理能力和数据的动态划分。
(3)TerracottaBigMemory:来自Terracotta的分布式内存管理解决方案。这项产品包括一个Ehcache界面、Terracotta管理控制台和BigMemory-Hadoop连接器。
(4)GemFire:VmwarevFabricGemFire是一个分布式数据管理平台,也是一个分布式的数据网格平台,支持内存数据管理、复制、划分、数据识别路由和连续查询。
(5)Infinispan:Infinispan是一个基于Java的开源键值NoSQL数据存储,和分布式数据节点平台,支持事务,peer-to-peer及client/server架构。
(6)GridGain:分布式、面向对象、基于内存、SQLNoSQL键值数据库。支持ACID事务。
(7)GigaSpaces:GigaSpaces内存数据网格能够充当应用的记录系统,并支持各种各样的高速缓存场景。
8月18日,中国人民银行贵安数据中心在北京正式签约落地。据了解,该数据中心投用后将成为我国重要的金融基础设施。同时,贵安新区以该数据中心落地为契机,规划建设数字金融产业园,实施“产业金融中心”“金融产业中心”双轮驱动,打造一流金融基地。作为贵州建设国家大数据综合试验区的核心区,贵安新区近年来加快推进“中国南方数据中心示范基地”建设,目前已在该区马场镇以贵安腾讯七星数据中心为圆心,在半径4公里、面积不超过50平方公里的区域内,规划建设了12个超大型数据中心。
贵安新区的大数据产业始于数据中心。2013年10月,中国电信云计算贵州信息园在贵安新区开工,拉开了该区数据中心建设的序幕,也开启了大数据产业发展征程。
据了解,目前已有中国电信、中国移动、中国联通、华为、腾讯、苹果、富士康等7家企业的数据中心落户贵安新区。
在快速推进数据建设的同时,贵安新区还以数据中心为基础,加速聚集上下游企业,延长大数据产业链。该区积极布局服务器制造、云服务、CDN服务及大数据增值服务,谋划打造一个千亿级智能终端产业集群和5个百亿级数据中心产业集群的“1+5”产业生态。目前已经汇聚了浪潮、数据宝、云上艾珀、腾讯贵安数码公司、白山云、华云创谷等一批数字经济引领性企业。
数据显示,今年上半年,贵安新区大数据产业保持高质量发展态势,软件和信息技术服务业营业收入完成25.39亿元,电子商务交易额完成80.12亿元,同比分别增长37.89%和25.75%。
8月13日,贵阳市、贵安新区、华为技术有限公司和拓维信息系统股份有限公司在贵阳共同签署战略合作协议,四方将整合各自优势资源和能力,共建“立足贵州、服务全国”的鲲鹏产业生态,率先把贵阳市和贵安新区打造成全国产业数字化、数字产业化、数字治理的标杆和示范地区。
贵安新区相关负责人表示,数据中心仍是该区今后重点支持的项目,将全力保障数据中心建设的集约化用地需求、电力安全需求、网络需求和信息安全需求,同时创新体制机制,降低数据中心及配套产业的要素成本,打造一流的运维体系,进一步提升数据中心聚合能力。
按照规划,到2025年,贵安新区承载的服务器数达400万台,数据中心固定资产投资超400亿元,有可能成为全国最大的高安全、绿色化、集约化数据中心基地。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)