哪个数据库软件比较好用,主要是记录几万个个人信息的!求助!

哪个数据库软件比较好用,主要是记录几万个个人信息的!求助!,第1张

MySql:

优点: 1支持5000万条记录的数据仓库

2适应于所有的平台

3是开源软件,版本更新较快

4性能很出色。纯粹就性能而言,MySQL是相当出色的,因为它包含一个缺省桌面格式MyISAM。MyISAM 数据库与磁盘非常地兼容而不占用过多的CPU和内存。MySQL可以运行于Windows系统而不会发生冲突,在UNIX或类似UNIX系统上运行则更好。你还可以通过使用64位处理器来获取额外的一些性能。因为MySQL在内部里很多时候都使用64位的整数处理。

5价格便宜

缺点: 缺乏一些存储程序的功能,比如MyISAM引擎联支持交换功能

MsSqlserver:

优点: 1真正的客户机/服务器体系结构

2图形化的用户界面,使系统管理和数据库管理更加直观、简单

3丰富的编程接口工具,为用户进行程序设计提供了更大的选择余地

4与WinNT完全集成,利用了NT的许多功能,如发送和接受消息,管理登录安全性等,SQL Server也可以很好地与Microsoft BackOffice产品集成。

5有很好的伸缩性,可以跨平台使用。

6提供数据仓库功能,这个功能只在Oracle和其他昂贵的DBMS中才有。

Oracle:

优点: 1Oracle的稳定性要比Sql server好。

2Oracle在导数据工具sqlloadexe功能比Sqlserver的Bcp功能强大,Oracle可以按照条件把文本文件数据导入

3Oracle的安全机制比Sql server好。

4Sql server的易用性和友好性方面要比Oracle好。

5在处理大数据方面Oracle会更稳定一些。

6Sql Server在数据导出方面功能更强一些。

7处理速度方面比Oracle快一些,和两者的协议有关

缺点: 价格昂贵

1 Oracle跨平台,SQL Server只能运行在Windows上,而Windows能够安装的硬件是有限的,如Sun的Sparc服务器不能安装Windows,一些大型机、小型机也只能装UNIX,在这些高端机器上就只能跑Oracle了,这注定了Oracle就是高端数据库,而SQL Server呢,中低端。

2 Oracle真正实现了行级锁,SQL Server也宣称实现了行级锁,但你实际去试,如果不加索引,其实是不行的。

3 Oracle因为有多版本数据的技术,读写 *** 作不会相互等待,虽然SQL Server 2005学习Oracle增加了snapshot机制,从而也引进了多版本数据(MySQL也有多版本数据机制,不能说一定是学习Oracle),但是实际效果感觉就是2个版本的数据,隔离级别为read committed时候,读写不再相互等待,但是把隔离设置为Serializable还是会产生读写相互等待。

4 Oracle的事务日志归档相当方便,而SQL Server要用事务日志备份来实现,而且还要配置自动作业,启动agent服务。

5 Oracle的数据字典丰富,使得DBA容易判断数据库的各种情况,虽然SQL Server 2005学习了Oracle的数据字典的特点,但从数量及方便程度上还是相差太多。个人感觉这是Oracle最人性化的地方。

6 Oracle的PL/SQL比SQL Server的T-SQL功能强大很多。

7 Oracle的触发器比SQL Server的种类多几种。

8 oracle的备份恢复原理相当简单明了,备份就在 *** 作系统上拷贝数据文件好了,恢复呢,再拷贝回来,数据是旧的,不怕,应用重做日志好了。SQL Server呢,虽然原理在本质上还是这些,但 *** 作起来麻烦多了,麻烦到让你体会不到其本质。

9 Oracle数据库启动可以有多个阶段,使得DBA可以在不同的情况下,通过启动到特定的阶段解决一些特殊问题,而SQL Server只要服务一启动,所有数据库就都打开了。

10. SQL Server给人的感觉是简单易用,但是我要说,如果你继续向前走,就会发现SQL Server的体系结构相当复杂(注意我这里是说的复杂),大体还是沿袭的Sybase的体系结构,这种复杂结构,估计很难有根本性的改变,而Oracle呢,时间越长你越会觉得其体系结构严谨,虽然开始会感觉很难。我的一个比喻,SQL Server是傻瓜相机(就是那些一两千的小数码),Oracle是单反相机(40D,5D,D300),如果你是入门者,那用傻瓜相机好了,在各种环境下拍摄,基本都过得去,用单反,光圈、快门都要自己设定,反倒不如傻瓜相机的效果,如果你是高手了,那傻瓜相机就很难得心应手了。

11. Oracle的书籍一般都比较深,随便一说就是一大批,Epert Oracle、Practical Oracle 8i、Cost-based Oracle,SQL Server呢,恐怕只有那套Inside SQL Server了,虽然SQL Server的书籍数量比Oracle的多的多(特别是在国内),但多数都是step by step的入门书。

12 对比SQL*Plus与sqlcmd(或2000的osql,65的isql),sqlcmd的功能是太简陋,差得太多了。

13 SQLServer的最大优点就是和Windows结合紧密,易用,但是要注意事情都是两面的,这些优点可能导致其致命的缺点,例如易用,使得搞SQL Server的人可以不求甚解,有时候不求甚解是没问题的,但是有时候不求甚解可能会造成灾难,特别是对搞数据库的人来说。不好意思,本来要说SQL Server的优点呢,最后也成了缺点了。

ACCESS是由微软发布的关联式数据库管理系统。它结合了 Microsoft Jet Database Engine 和图形用户界面两项特点,是 Microsoft Office的成员之一。优点:Access部署简单方便就一个文件运用起来比较灵活主要是桌面数据库系统,他也可以开发基于自己的桌面数据库应用(UI),也可以作为前端开发工具与其它数据库搭配开发应用程序(如SQL Server,DB2,Oracle等),熟练的软件设计师和资料分析师利用它来开发应用软件,而一些不熟练的程序员和非程序员的初级用户则使用它来开发简单的应用软件。

缺点:数据储存量小安全性不够高,加了用户级密码容易破解。C/S结构下对服务器要求很高,否则容易造成MDB损坏并发数255,但是对高强度 *** 作适应性差,如果服务器不够好,网络不够好,编程的方法不够好,6-7个人同时访问就能导致MDB损坏或者并死,不能将VBA代码开发的软件系统直接编译成EXE可执行文件,不能脱离ACCESS或者ACCESS RUNTIME环境,该环境相对其他软件体积较大(50M左右)。Microsoft Access数据库有一定的极限,如果数据达到100M左右,很容易造成服务器iis假死,或者消耗掉服务器的内存导致服务器崩溃。

SQL Server是一个关系数据库管理系统。

优点:安全性高真正的客户机/服务器体系结构,图形化用户界面,使系统管理和数据库管理更加直观、简单,丰富的编程接口工具为用户进行程序设计提供了更大的选择余地。SQL Server与Windows NT完全集成,利用了NT的许多功能,如发送和接受消息,管理登录安全性等。SQL Server也可以很好地与Microsoft BackOffice产品集成。具有很好的伸缩性,可跨越多种平台使用,对Web技术的支持,使用户能够很容易地将数据库中的数据发布到Web页面上。SQL Server还提供数据仓库功能,这个功能只在Oracle和其他更昂贵的DBMS中才有。

缺点:因功能强大,所以 *** 作数据比ACCESS较为复杂

1数据量太大,比如上亿,就用oracle,优点上亿数据对Oracle来说轻飘飘的,也不用太多优化配置,缺点安装比较麻烦,上手比较慢。

2数据量较大,比如千万级,用postgresql,它号称对标Oracle,处理千万级数据还是可以的,也是易学易用。

3数据量一般,比如百万级,用mysql,这个级别的数据量mysql处理还是比较快的。

4数据量较小,比如十万以下,sqlite、access都可以。

上面是基于单表 *** 作的数据量,你看着选。

简单易用的数据库哪个比较好?这个要具体看你的用途,如果数据量比较少(10万左右),追求简约简单,免费开源的sqlite就行,如果数据量比较多,考虑到高并发、分布式,可以使用专业的mysql、postgresql,下面我分别简单介绍一下,感兴趣的朋友可以尝试一下:

小巧灵活sqlite

这是基于c语言开发的一个轻量级关系型数据库,短小精悍、免费开源,个人使用无需繁琐的配置,只需一个简单的运行库便可直接使用,针对各种编程语言都提供了丰富的API接口, java、 python、c#等都可轻松 *** 作,如果你存储数据量不多,只是本地简单的 *** 作(读多写少),可以使用一下这个数据库,占用内存非常少,轻便灵活,当然,在高并发、数据量大的情况下就不合适了:

专业强大mysql

这是目前应该广泛使用的一个关系型数据库,免费开源跨平台,在信息系统开发方面一直占据着主力位置,如果你从事于web开发或者网站后台建设,那么这个数据库一定非常熟悉,支持高并发、分布式,存储数据量相对于sqlite来说,更多也更安全,索引、触发器、存储过程等功能非常不错,支持数据导入导出、恢复备份,只要你熟悉一下基本使用过程,很快就能掌握和运用:

免费开源postgresql

这是加州大学计算机系开发的一个对象-关系型数据库(自由软件),免费、开源、跨平台,支持流计算、全文检索、图式搜索、并行计算、存储过程、空间数据、K-V类型,相比较mysql来说,在复杂查询、高并发下更稳定、性能更优越,可扩展性、可维护性非常不错,但也有劣势,例如新旧版本不分离存储,没有Coverage index scan等,总体使用效果来说还不错:

当然,除了以上3个数据库,还有许多其他数据库,像mssql、oracle等也都非常不错,对于存储和处理数据来说绰绰有余,只要你熟悉一下基本使用过程,很快就能入门的,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。

最符合初学者理解和入门的是Access,因为它和Excel本来就是一个套件,相互转化容易,复制粘贴即可,非常好理解库、表、字段、键的概念。

如果数据量不大,强烈推荐试试Filemaker,脚本化编程,自由定制输入界面、工作流程,非常便捷高效。

最近杀出来的airtable,更是简单高效,界面美观, *** 作与电子表格相当,发展势头也非常迅猛。

二者侧重点有所不同,用户可根据需要选择

作为一个软件开发人员,长期需要和数据库打交道,个人更加青睐于MySQL。虽然可能基于你的Excel原因,有些人会建议你使用Access数据库,但是基于我个人的 意见,我并不建议你那样做。采用MySql的具体理由如下:

1MySQL具有普遍性,在国内的环境中,绝大多数的互联网企业采用的是MySQL。有了广大的用户基础后,针对于各种问题网上也能更好地找到解决方案。

2MySQL相对于Oracle而言,更加轻量化,针对于从Excel量级的数据,没必要使用Oracle。同时MySQL是完全免费的,不用担心版权及费用问题,无论对个人还是对预算有限的企业而言都是很好的选择。

3MySQL高度兼容标准SQL,这对于以后迁移到其他数据库而言,也能很大程度地降低学习成本。

希望我的回答能够对你有所帮助!!![耶][耶][耶]

Excel办公确实便利,可以做一些简单的数据分析,但涉及大量复杂的数据运算,就会遇到和题主一样的问题,运算速度慢,如果主机性能不是很好,还有可能面临电脑死机,数据丢失等问题。

遇到这种情况,我们该如何解决呢?数据库的重要性显而易见!

现在, 我将用3分钟的时间,与您探讨该选择何种数据库,以及选择它的理由,是否有更优的解决方案呢?

MySQL数据库,90%的企业都会选择它

数据库选得好,企业的数据安全,资产安全,也就得到了保障。那么该如何选择数据库呢?这个跟你的业务量和业务服务行业,密不可分。

如果你只是上班打卡,用SQL server就可以了;

如果你要储存会话信息,用户配置信息,购物车数据,建议使用NoSQL数据库;

不过90%的企业或个人,首选数据库都是MySQL数据库。

为什么这么说?

因为,它集 低成本、高可用、可靠性强、易用性强、体积小、速度快开放源码 等特性于一身,所以在金融、财务、网站、 数据处理 等应用领域,它占据着独一无二的优势。

这也是几乎所有企业都选择它,来存储数据的原因。

加之MySQL数据库,支持多种存储引擎,支持大型数据库,可以处理成千上万条记录,还提供用于管理、检查、优化数据库 *** 作的工具。

因而,MySQL尤其受个人,以及中小企业的推崇。

虽然MySQL数据库简单易用,但我还是不会部署该怎么办?

别担心,现在市面上已经出现了,一种自带数据库的新型办公软件。

比如说,云表企业应用平台,一款兼容excel功能,但功能更为强大的办公软件,它就内嵌了MySQL数据库。 (文末有免费获取方式)

云表内嵌的MySQL数据库,有何优点?

1 性能更加优化,更加兼容系统。因为云表的研发人员,时刻更新维护MySQL数据库。

2 省去自己手动部署的麻烦。但如果你熟悉部署数据库,想把数据库改成Oracle或SQL server等数据库,也可以设置。(不过,我建议IT小白还是 “拿来即用” 就好)

3 快速实时计算。数据分析实时交互,完全满足管理决策中的临时性分析,多变的业务需求,以及频繁的结果刷新。

4 通过自带的内存计算引擎,无需事先建立CUBE,IT部门将告别报表延时报表分析,亿级数据秒级响应。

内嵌的MySQL数据库是否可靠

云表不仅是一款办公软件,同时还是一款开发工具。

通过它,你将解决以下问题:

复杂的数据运算,精确到行列的权限管控,以及工作流,海量用户同时在线办公,数据透视,制作像销售单,洽谈合同等表单报表,一份制作,即可重复录用

你还可以通过它,与电子称、地磅等进行对接,与用友金蝶等三方系统集成,生成条形码,扫码出入库,生成移动端APP 基本上业务所需的功能,你都可以放心交给它做。

它最大的亮点就是,你可以 用使用excel的手法,用它来开发业务应用。

而且,可视化的 拖拉拽 之后,开发出来的ERP、WMS、OA、进销存等业务应用,还秉承了MySQL数据库增删改查的功能特性。

没错,用云表开发出来的业务应用,是允许二次开发的,而且功能可以随时增删改查,轻松满足大集团精细化的数据控制需求。

不过,大家最关心的应该是数据安全问题吧。

数据存放在云表内嵌的MySQL数据库,是安全不丢失的,它提供了多种数据存储的方式,本地部署,云端部署,混合部署,任君挑选!

正因如此,像 恒逸石化、许继电气、航天科工委、中铁、中冶、云南小松 等大型集团,才鼓励内部员工去学习云表。

篇幅所限,只说到这里,说太多你也不会看。

免费 的软获取方式在下方:

数据库的用处可大着呢,不仅可以实现数据共享,减少数据冗余度,还能实现对数据的集中控制,保持数据的一致性和可维护性。选取简单易用的数据库,你有什么好的建议呢,留言让我们看到噢!

题主强调了简单易用。所以推荐最简单三个。

1Access。

2Excel。

3飞书文档、腾讯文档、石墨文档等的表格。

如果要做分析,数据量才比较大,建议Access,还是专业的更好一些。网上教程也很多,比较容易学。而且建议用早一点的版本,比如2003或者2007,Access这些年微软一直想从office里去掉,奈何用的人还是很多,所以不敢去掉,但是采取了一种比较恶心的方法让用户放弃,就是每发布一个新版本,就去掉一些好用的功能,所以说Access是越早的功能越强。

还一个推荐就是Sql Server Express版本,是SQL Server的免费版本,不要钱,基本功能都有,要比sqllite等强大的多

这要结合你个人实际情况来定,有计算机基础,懂一点数据库的话那么市场上的那些软件都可以用,常用有oracle,sqlserver,mysql等,要上手快还是sqlserver比较快,界面 *** 作也比较直观;如果一点基础都没有,但是又要分析数据的话可以用微软自带的一个access,这个上手比较快。决定用哪一种之后还是要买点教材看,简单的sql查询要会,熟练之后也能提高工作效率。

个人使用数据库的话,只存数据不做分析,SQLite就足够了。

问题一:建立数据库该用什么软件 50分 这需要一个软件来管理,软件调用数据库信息。可以找人定做。大漠驼铃软件工作室,望采纳。

问题二:要创建一个数据库,用什么软件? Mysql吧,这个小,比较合适。

问题三:哪个软件建立数据库比较简单好用 随着数据大数据的发展,数据安全已经上升到一个很高的高度。随着国家对数据安全的重视,国产数据库开始走进中国个大企业,其中不乏 、国企。

实时数据库系统是开发实时控制系统、数据采集系统、CIMS系统等的支撑软件。在流程行业中,大量使用实时数据库系统进行控制系统监控,系统先进控制和优化控制,并为企业的生产管理和调度、数据分析、决策支持及远程在线浏览提供实时数据服务和多种数据管理功能。实时数据库已经成为企业信息化的基础数据平台,可直接实时采集、获取企业运行过程中的各种数据,并将其转化为对各类业务有效的公共信息,满足企业生产管理、企业过程监控、企业经营管理之间对实时信息完整性、一致性、安全共享的需求,可为企业自动化系统与管理信息系统间建立起信息沟通的桥梁。帮助企业的各专业管理部门利用这些关键的实时信息,提高生产销售的营运效率。如果你想定制这款国产数据库 可以打 前面是 一三六 中间是 六一二零 末尾是 四一四七

北京开运联合信息技术股份有限公司-实时性工业数据库软件(CreatRun Database )

实时性工业数据库软件(CreatRun Database )是什么?

1、实时性工业数据库软件(CreatRun Database ) 是开运联合公司针对行业应用,独立研发的,拥有全部自主知识产权的企业级实时/历史数据库平台。为企业监控生产情况、计算性能指标、进行事故分析和对设备启停分析诊断、故障预防等提供重要的数据保障。

2、实时性工业数据库软件(CreatRun Database ) 可广泛用于工业控制自动化数据的高速采集和存储,提供高速、海量数据存储和基础分析能力。

3、实时性工业数据库软件(CreatRun Database ) 可随时观察以及在线分析生产过程。长期保存的历史数据不仅可以重现历史生产情况,也使大规模数据挖掘成为可能。 提供企业生产信息管理解决方案,可以有效应对“从小到大” “由近及远” 的各种企业级数据应用。

4、CreatRun Database 可在线按照时间序列以毫秒级精度自动采集企业的各类过程自动化系统中的生产数据,高效压缩并存储。同时可向用户和应用程序提供实时和历史数据,使得用户可随时观察以及在线分析生产过程。长期保存的历史数据不仅可以重现历史生产情况,也使大规模数据挖掘成为可能。

工业软件开发实时性工业数据库软件(CreatRun Database )系统主要技术指标:

支持数据类型:digital、int16、int32、float16、float32、float64、String等类型

标签容量:200,000 Tag

数据容量:TB级

客户端并发用户数:500 个

生产过程数据采集时间响应速度:100,000 输入值/秒存档数据回取事务吞吐量:>2,000,000 输出值/秒

实时性工业数据库软件(CreatRun Database )系统特性――高可用性:

1、高效的数据存储策略及压缩算法“死区例外+可变斜率压缩算法 ”,精确到每个Tag的压缩配置,有效提高了历史数据存储性能,节约磁盘空间

2、高速的数据缓存机制,使并行访问锁域粒度精确到“Block(1KBytes)”,实现了并行访问能力的最大化。使历史数据访问路由复杂度“最小化、均衡化,扁平化”,不界定“冷热”数据,所有数据访问时间成本一致,同时提供均衡访问特性和最大远程数据访问友好度。

3、Creat RUN >>

问题四:建立数据库,大家都使用什么软件啦 Mysql吧,这个小,比较合适。

问题五:有木有什么软件可以建立一个产品数据库? ACCESS就可以,而且现在计算机二级过级普遍考的都是ACCESS,很好找人做和维护数据库的

问题六:建立管理数据库用什么软件好 有两种数据库都可以

access和sqlserver

access:

sql:

问题七:数据库的创建需要在什么软件的支持下? 安装微软的ms sqlserver盯000软件,就能创建sql数据库

安装微软的office组件,就能创建access数据库

以此类推,明白了吗

每种数据库的安装和运行都需要对应的数据库管理系统软件作为支持

问题八:如何建立数据库并使用数据库,需要什么硬件 数据库其实只是一个软件,比如mysql,Oracle DB之类的很多

你只需要安装到某台电脑上,就可以使用了。

然后根据数据库种类以及访问频度不同,需要的硬件配置也不一样。10几个人用,普通PC就可以,几千个人频繁访问的话,就买个服务器吧。

然后关于配置(CPU,内存之类的),你百度 数据库名字+最低配置 就能看到了

问题九:建立数据仓库,用什么数据库软件好 开源的数据库不少,公司内部使用的话,看你的实际需求,如果结构比较简单,数据量不大的,从网上下载个mysql和对应的管理工具就行。如果稍复杂的,就用大型的关系型数据库吧,如oracle、SQL SERVER等等。

问题十:建立一个公司的数据库需要一些什么软件? 做邮件的话建议你用OA系统(办公自动化软件),数据库一般是用MYSQL,你可以拿一台电脑做主机,在上面按 *** 作系统下载相应的PHPnow做为数据库,然后看你用免费的还是收费的OA系统,在百度一般都可以搜到的,再按照产品说明书 *** 作就可以了。

OA系统可以达到即时通信、邮件系统、文件共享、信息发布、知识管理、项目管理、协同网络、系统管理、工具、员工论坛等等要求

数据库管理系统(DBMS):

数据库管理系统主要是对数据库的管理.和维护的,针对本数据库进行保护.

数据库开发工具:

是对数据库的数据进行 *** 作的我工具,而并不对数据库系统进行维护和管理.

所以说,DBMS是对数据库(DB)进行保护管理的

数据库开发工具是对数据库(DB)的数据进行 *** 作的.

两者,有本质的不同.

不知道你懂了没

谢谢啊~

可以试试DBSync,主要特点:

●独立运行

不需要在数据库中设置程序或脚本,不需要更改库结构,是一款独立的应用程序,因此不影响现有系统的运行,简单易用。

●支持各种数据源

既支持常规数据库,如Access、SQL Server、Oracle、MySQL、DB2等,又支持Excel、txt、csv等文件数据,任何可用OLE DB或ODBC连接的数据,均可参与同步。

●异型数据库同步

既支持相同类型数据库之间的同步,如Access到Access、SQL Server到SQL Server,又支持异型数据库之间的同步,如Excel到Access、Access到SQL Server、SQL Server到Oracle等。

●无人值守同步

软件具有定期自动同步的功能,只需预先设置好时间间隔,就可长期自动同步;支持系统重启后自动继续同步,防止意外关机重启而造成同步中断,从而实现无人值守同步。

●支持增量同步

既支持简单的全部复制式同步(Insert),又支持增量同步。软件能快速扫描数据库,找出相互间的差异(即增量),只对增量进行同步。

●支持断点续传

当同步中断后,再次同步时能从中断位置继续同步,避免每次都需要从头开始。

●秒级实时同步

重复同步的时间间隔最短可设置为1秒,源数据库发生变更后,1秒后就同步过去,几乎等同于实时同步。

●支持同步后处理

可设置同步后的SQL执行语句,实现同步之后的数据转换、公式计算等额外任务。

Java:只要了解一些基础即可,做大数据不需要很深的Java技术,学javaSE就相当于有学习大数据。基础

Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置,能少踩很多坑,学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。

好说完基础了,再说说还需要学习哪些大数据技术,可以按我写的顺序学下去。

Hadoop:这是现在流行的大数据处理平台几乎已经成为大数据的代名词,所以这个是必学的。Hadoop里面包括几个组件HDFS、MapRece和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapRece是对数据进行处理计算的,它有个特点就是不管多大的数据只要给它时间它就能把数据跑完,但是时间可能不是很快所以它叫数据的批处理。

记住学到这里可以作为你学大数据的一个节点。

Zookeeper:这是个万金油,安装Hadoop的HA的时候就会用到它,以后的Hbase也会用到它。它一般用来存放一些相互协作的信息,这些信息比较小一般不会超过1M,都是使用它的软件对它有依赖,对于我们个人来讲只需要把它安装正确,让它正常的run起来就可以了。

Mysql:我们学习完大数据的处理了,接下来学习学习小数据的处理工具mysql数据库,因为一会装hive的时候要用到,mysql需要掌握到什么层度那你能在Linux上把它安装好,运行起来,会配置简单的权限,修改root的密码,创建数据库。这里主要的是学习SQL的语法,因为hive的语法和这个非常相似。

Sqoop:这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个,直接把Mysql数据表导出成文件再放到HDFS上也是一样的,当然生产环境中使用要注意Mysql的压力。

Hive:这个东西对于会SQL语法的来说就是神器,它能让你处理大数据变的很简单,不会再费劲的编写MapRece程序。有的人说Pig那它和Pig差不多掌握一个就可以了。

Oozie:既然学会Hive了,我相信你一定需要这个东西,它可以帮你管理你的Hive或者MapRece、Spark脚本,还能检查你的程序是否执行正确,出错了给你发报警并能帮你重试程序,最重要的是还能帮你配置任务的依赖关系。我相信你一定会喜欢上它的,不然你看着那一大堆脚本,和密密麻麻的crond是不是有种想屎的感觉。

Hbase:这是Hadoop生态体系中的NOSQL数据库,他的数据是按照key和value的形式存储的并且key是唯一的,所以它能用来做数据的排重,它与MYSQL相比能存储的数据量大很多。所以他常被用于大数据处理完成之后的存储目的地。

Kafka:这是个比较好用的队列工具,队列是干吗的排队买票你知道不数据多了同样也需要排队处理,这样与你协作的其它同学不会叫起来,你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来,你别怪他因为他不是搞大数据的,你可以跟他讲我把数据放在队列里你使用的时候一个个拿,这样他就不在抱怨了马上灰流流的去优化他的程序去了,因为处理不过来就是他的事情。而不是你给的问题。当然我们也可以利用这个工具来做线上实时数据的入库或入HDFS,这时你可以与一个叫Flume的工具配合使用,它是专门用来提供对数据进行简单处理,并写到各种数据接受方(比如Kafka)的。

Spark:它是用来弥补基于MapRece处理数据速度上的缺点,它的特点是把数据装载到内存中计算而不是去读慢的要死进化还特别慢的硬盘。特别适合做迭代运算,所以算法流们特别稀饭它。它是用scala编写的。Java语言或者Scala都可以 *** 作它,因为它们都是用JVM的。

以上就是关于哪个数据库软件比较好用,主要是记录几万个个人信息的!求助!全部的内容,包括:哪个数据库软件比较好用,主要是记录几万个个人信息的!求助!、简单易用的数据库哪个比较好、建立数据库用什么软件等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9345817.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存