数据分析数据库有哪些常见类型_工具

1、MySQL数据库

定位：开源、多平台、关系型数据库;

目前使用最广泛、流行度最高的的开源数据库。

功能：支持事务，符合关系型数据库原理，符合ACID，支持多数SQL规范，以二维表方式组织数据，有插件式存储引擎，支持多种存储引擎格式。

部署：用编译安装的方式，或者二进制包的方式，按照“安装软件-创建实例-库表用户初始化”，可以很快完成数据库部署。

使用：使用标准的SQL语句进行数据库管理，简单SQL语句的并发和性能较好，对视图、存储过程、函数、触发器等支持的不是太好。

2、SQL Server数据库

定位：商业、Windows平台、关系型数据库;

最早接触、与微软体系结合紧密的的商业数据库，属于“微软技术体系”。

功能：支持事务，符合关系型数据库原理，符合ACID，支持多数SQL规范，以二维表方式组织数据

部署：在Windows平台，用图形界面进行软件安装;

使用：在Windows平台，使用SQL Server Mangement Studio图形界面进行安装。

1数据量太大，比如上亿，就用oracle，优点上亿数据对Oracle来说轻飘飘的，也不用太多优化配置，缺点安装比较麻烦，上手比较慢。

2数据量较大，比如千万级，用postgresql，它号称对标Oracle，处理千万级数据还是可以的，也是易学易用。

3数据量一般，比如百万级，用mysql，这个级别的数据量mysql处理还是比较快的。

4数据量较小，比如十万以下，sqlite、access都可以。

上面是基于单表 *** 作的数据量，你看着选。

简单易用的数据库哪个比较好？这个要具体看你的用途，如果数据量比较少（10万左右），追求简约简单，免费开源的sqlite就行，如果数据量比较多，考虑到高并发、分布式，可以使用专业的mysql、postgresql，下面我分别简单介绍一下，感兴趣的朋友可以尝试一下：

小巧灵活sqlite

这是基于c语言开发的一个轻量级关系型数据库，短小精悍、免费开源，个人使用无需繁琐的配置，只需一个简单的运行库便可直接使用，针对各种编程语言都提供了丰富的API接口， java、 python、c#等都可轻松 *** 作，如果你存储数据量不多，只是本地简单的 *** 作（读多写少），可以使用一下这个数据库，占用内存非常少，轻便灵活，当然，在高并发、数据量大的情况下就不合适了：

专业强大mysql

这是目前应该广泛使用的一个关系型数据库，免费开源跨平台，在信息系统开发方面一直占据着主力位置，如果你从事于web开发或者网站后台建设，那么这个数据库一定非常熟悉，支持高并发、分布式，存储数据量相对于sqlite来说，更多也更安全，索引、触发器、存储过程等功能非常不错，支持数据导入导出、恢复备份，只要你熟悉一下基本使用过程，很快就能掌握和运用：

免费开源postgresql

这是加州大学计算机系开发的一个对象-关系型数据库（自由软件），免费、开源、跨平台，支持流计算、全文检索、图式搜索、并行计算、存储过程、空间数据、K-V类型，相比较mysql来说，在复杂查询、高并发下更稳定、性能更优越，可扩展性、可维护性非常不错，但也有劣势，例如新旧版本不分离存储，没有Coverage index scan等，总体使用效果来说还不错：

当然，除了以上3个数据库，还有许多其他数据库，像mssql、oracle等也都非常不错，对于存储和处理数据来说绰绰有余，只要你熟悉一下基本使用过程，很快就能入门的，网上也有相关教程和资料，介绍的非常详细，感兴趣的话，可以搜一下，希望以上分享的内容能对你有所帮助吧，也欢迎大家评论、留言进行补充。

最符合初学者理解和入门的是Access，因为它和Excel本来就是一个套件，相互转化容易，复制粘贴即可，非常好理解库、表、字段、键的概念。

如果数据量不大，强烈推荐试试Filemaker，脚本化编程，自由定制输入界面、工作流程，非常便捷高效。

最近杀出来的airtable，更是简单高效，界面美观， *** 作与电子表格相当，发展势头也非常迅猛。

二者侧重点有所不同，用户可根据需要选择

作为一个软件开发人员，长期需要和数据库打交道，个人更加青睐于MySQL。虽然可能基于你的Excel原因，有些人会建议你使用Access数据库，但是基于我个人的意见，我并不建议你那样做。采用MySql的具体理由如下：

1MySQL具有普遍性，在国内的环境中，绝大多数的互联网企业采用的是MySQL。有了广大的用户基础后，针对于各种问题网上也能更好地找到解决方案。

2MySQL相对于Oracle而言，更加轻量化，针对于从Excel量级的数据，没必要使用Oracle。同时MySQL是完全免费的，不用担心版权及费用问题，无论对个人还是对预算有限的企业而言都是很好的选择。

3MySQL高度兼容标准SQL，这对于以后迁移到其他数据库而言，也能很大程度地降低学习成本。

希望我的回答能够对你有所帮助！！！[耶][耶][耶]

Excel办公确实便利，可以做一些简单的数据分析，但涉及大量复杂的数据运算，就会遇到和题主一样的问题，运算速度慢，如果主机性能不是很好，还有可能面临电脑死机，数据丢失等问题。

遇到这种情况，我们该如何解决呢？数据库的重要性显而易见！

现在， 我将用3分钟的时间，与您探讨该选择何种数据库，以及选择它的理由，是否有更优的解决方案呢？

MySQL数据库，90%的企业都会选择它

数据库选得好，企业的数据安全，资产安全，也就得到了保障。那么该如何选择数据库呢？这个跟你的业务量和业务服务行业，密不可分。

如果你只是上班打卡，用SQL server就可以了；

如果你要储存会话信息，用户配置信息，购物车数据，建议使用NoSQL数据库；

不过90%的企业或个人，首选数据库都是MySQL数据库。

为什么这么说？

因为，它集 低成本、高可用、可靠性强、易用性强、体积小、速度快开放源码 等特性于一身，所以在金融、财务、网站、 数据处理 等应用领域，它占据着独一无二的优势。

这也是几乎所有企业都选择它，来存储数据的原因。

加之MySQL数据库，支持多种存储引擎，支持大型数据库，可以处理成千上万条记录，还提供用于管理、检查、优化数据库 *** 作的工具。

因而，MySQL尤其受个人，以及中小企业的推崇。

虽然MySQL数据库简单易用，但我还是不会部署该怎么办？

别担心，现在市面上已经出现了，一种自带数据库的新型办公软件。

比如说，云表企业应用平台，一款兼容excel功能，但功能更为强大的办公软件，它就内嵌了MySQL数据库。 （文末有免费获取方式）

云表内嵌的MySQL数据库，有何优点？

1 性能更加优化，更加兼容系统。因为云表的研发人员，时刻更新维护MySQL数据库。

2 省去自己手动部署的麻烦。但如果你熟悉部署数据库，想把数据库改成Oracle或SQL server等数据库，也可以设置。（不过，我建议IT小白还是 “拿来即用” 就好）

3 快速实时计算。数据分析实时交互，完全满足管理决策中的临时性分析，多变的业务需求，以及频繁的结果刷新。

4 通过自带的内存计算引擎，无需事先建立CUBE，IT部门将告别报表延时报表分析，亿级数据秒级响应。

内嵌的MySQL数据库是否可靠

云表不仅是一款办公软件，同时还是一款开发工具。

通过它，你将解决以下问题：

复杂的数据运算，精确到行列的权限管控，以及工作流，海量用户同时在线办公，数据透视，制作像销售单，洽谈合同等表单报表，一份制作，即可重复录用

你还可以通过它，与电子称、地磅等进行对接，与用友金蝶等三方系统集成，生成条形码，扫码出入库，生成移动端APP 基本上业务所需的功能，你都可以放心交给它做。

它最大的亮点就是，你可以 用使用excel的手法，用它来开发业务应用。

而且，可视化的 拖拉拽 之后，开发出来的ERP、WMS、OA、进销存等业务应用，还秉承了MySQL数据库增删改查的功能特性。

没错，用云表开发出来的业务应用，是允许二次开发的，而且功能可以随时增删改查，轻松满足大集团精细化的数据控制需求。

不过，大家最关心的应该是数据安全问题吧。

数据存放在云表内嵌的MySQL数据库，是安全不丢失的，它提供了多种数据存储的方式，本地部署，云端部署，混合部署，任君挑选！

正因如此，像 恒逸石化、许继电气、航天科工委、中铁、中冶、云南小松 等大型集团，才鼓励内部员工去学习云表。

篇幅所限，只说到这里，说太多你也不会看。

免费的软获取方式在下方：

数据库的用处可大着呢，不仅可以实现数据共享，减少数据冗余度，还能实现对数据的集中控制，保持数据的一致性和可维护性。选取简单易用的数据库，你有什么好的建议呢，留言让我们看到噢！

题主强调了简单易用。所以推荐最简单三个。

1Access。

2Excel。

3飞书文档、腾讯文档、石墨文档等的表格。

如果要做分析，数据量才比较大，建议Access，还是专业的更好一些。网上教程也很多，比较容易学。而且建议用早一点的版本，比如2003或者2007，Access这些年微软一直想从office里去掉，奈何用的人还是很多，所以不敢去掉，但是采取了一种比较恶心的方法让用户放弃，就是每发布一个新版本，就去掉一些好用的功能，所以说Access是越早的功能越强。

还一个推荐就是Sql Server Express版本，是SQL Server的免费版本，不要钱，基本功能都有，要比sqllite等强大的多

这要结合你个人实际情况来定，有计算机基础，懂一点数据库的话那么市场上的那些软件都可以用，常用有oracle，sqlserver，mysql等，要上手快还是sqlserver比较快，界面 *** 作也比较直观；如果一点基础都没有，但是又要分析数据的话可以用微软自带的一个access，这个上手比较快。决定用哪一种之后还是要买点教材看，简单的sql查询要会，熟练之后也能提高工作效率。

个人使用数据库的话，只存数据不做分析，SQLite就足够了。

本篇文章继续围绕SQL的语法重点为大家介绍连接和 高级连接 的使用，以及 使用连接的注意事项 。

SQL最强大的功能之一就是能在数据查询的执行中 连接（join）表 。连接是利用SQL的SELECT语句能执行的最重要的 *** 作，很好地理解连接及其语法是学习SQL的极为重要的一点。在能够有效地使用连接前，我们必须了解 关系表 以及 关系数据库 设计的一些基础知识。下面的介绍并不能涵盖这一主题的所有内容，但作为入门已经够了。

连接

理解关系表，最好是来看个例子。

有一个包含产品目录的数据库表，其中每类物品占一行。

对于每一种物品，要存储的信息包括产品描述、价格，以及生产该产品的供应商。

现在有同一供应商生产的多种物品，那么在何处存储供应商名、地址、联系方法等供应商信息呢？将这些数据与产品信息分开存储的理由是：

① 同一供应商生产的每个产品，其供应商信息都是相同的，对每个产品重复此信息既浪费时间又浪费存储空间；

② 如果供应商信息发生变化，例如供应商迁址或电话号码变动，只需修改一次即可；

③ 如果有重复数据（即每种产品都存储供应商信息），则很难保证每次输入该数据的方式都相同。不一致的数据在报表中就很难利用。

关键是， 相同的数据出现多次不是一件好事 ，这是关系数据库设计的基础。

关系表的设计就是要 把信息分解成多个表 ， 一类数据一个表 。各表通过某些共同的值互相关联（所以才叫关系数据库）。在这个例子中可建立两个表：一个存储供应商信息，另一个存储产品信息。Vendors表包含所有供应商信息，每个供应商占一行，具有唯一的标识。此标识称为主键（primary key），可以是供应商ID或任何其他唯一值。Products表只存储产品信息，除了存储供应商ID（Vendors表的主键）外，它不存储其他有关供应商的信息。Vendors表的主键将Vendors表与Products表关联，利用供应商ID能从Vendors表中找出相应供应商的详细信息。

这样做的好处是：

① 供应商信息不重复，不会浪费时间和空间；

② 如果供应商信息变动，可以只更新Vendors表中的单个记录，相关表中的数据不用改动；

③ 由于数据不重复，使得处理数据和生成报表更简单。

总之，关系数据可以有效地存储，方便地处理。因此，关系数据库的可伸缩性远比非关系数据库要好。

为什么使用连接

连接将数据分解为多个表实现 更有效 地存储、 更方便 地处理，且 可伸缩性更好 。

可伸缩性：能够适应不断增加的工作量而不失败。

连接作为一种机制，能在一条SELECT语句中用来关联表。使用特定的语法，可连接多个表返回一组输出。

创建连接

分析：上述SELECT语句中与之前的语句相同，都是指定检索的列，区别在于该语句指定的两列（prod_name,prod_price）在一个表中，而第一列（vend_name）在另一个表中。

FROM子句也有所区别。该FROM子句列出了两个表：Vendors,Products。这两个表由SELECT语句的WHERE子句连接。WHERE子句指示DBMS将Vendors表中的vend_id与Products表中的vend_id匹配起来。

这里使用了 完全限定列名 将Vendorsvend_id和Productsvend_id两列匹配。最终输出了两个不同表中的数据。

高级连接部分将介绍 如何使用表别名，另外的一些连接 ，以及 如何对被连接的表使用聚集函数 。

使用表别名

之前的文章已经给大家介绍了如何使用别名引用被检索的表列。

SQL还可以 给表名起别名 ，目的是：

① 缩短SQL语句。

② 允许在一条SELECT语句中多次使用相同的表。

分析：上述语句中的FROM子句的三个表都有别名。如此 省略了许多字符 。表别名还可以用于SELECT的列表、ORDER BY子句以及其他语句部分。

需要注意的是： 表别名只在查询执行中使用 。与列别名不同，表别名不返回到客户端。

使用不同类型的连接

接下来将给大家介绍四种其他类型的连接： 自连接 、 自然连接 、 内连接 和 外连接 。

①自连接

分析： 这是使用了 子查询 的方案。对内部的SELECT语句做了一个简单的检索，返回Jim Jones工作公司的cust_name。该数据用于外部查询的WHERE子句中，以检索出为该公司工作的所有雇员。

下面看看使用了连接的方案。

分析：上述语句需要的两个表实际上是相同的表，所以Customers表在FROM子句中出现了两次。但这对于Customers的引用具有歧义，因为没有指示DBMS引用的是哪个Customers表。

于是需要使用表别名解决该问题。Customers表 第一次出现为别名c1 ， 第二次为c2 ，然后再将这些别名用作表名。如SELECT语句使用c1前缀明确给出所需列的全名。如果不这么做，DBMS将返回错误，因为名为cust_id、cust_name、cust_contact的列各有两个。DBMS不知需要哪一列，即使它们都是同一列。

WHERE首先连接两个表，再按第二个表中的cust_contact过滤数据，返回所需的数据。

②自然连接

内连接 返回所有的数据，其中 相同的列可多次出现 。而 自然连接排除多次出现 ，使每一列只返回一次。

一般通过对一个表使用通配符（SELECT ），而对其他的列使用明确的子集来实现自然连接。

分析： 上述语句中，通配符只对第一个表使用，而所有其他列都明确列出来，所以没有出现重复的列被检索出来。

③内连接

目前为止使用的连接称为等值连接，是基于两个表之间的相等测试。该连接也称为内连接。

对该种连接还可以使用不同的语法，明确指定连接的类型。

分析：该语句中的SELECT与之前的区别在于FROM 子句。此处两个表之间的关系是以 INNER JOIN 指定的部分FROM子句，因此需要使用特定的 ON子句 而不是WHERE子句。但传递给ON的实际条件与WHERE相同。

④外连接

许多连接将一个表中的行与另一个表中的行相关联，但有时候 需要包含没有关联的行 。例如，可能需要使用连接完成以下工作：

对每个顾客下的订单进行计数，包括那些至今尚未下订单的顾客；

列出所有产品以及订购数量，包括没有人订购的产品；

计算平均销售规模，包括那些至今尚未下订单的顾客。

在上述例子中，连接包含了那些在相关表中没有关联行的行。这种连接称为外连接，外连接分为 左外连接 和 右外连接 。

左外连接：取左边的表的全部，而右边的表按照条件显示，不符合条件的显示NULL。

右外连接：取右边的表的全部，而左边的表按照条件显示，不符合条件的显示NULL。

下面先给出一个简单的 内连接 ，再给出 左外连接 ，大家对比着理解。

分析：两个语句都使用了 JOIN 关键字来指定连接类型，与内连接不同的是，左外连接包括没有关联行的行。因此在使用JOIN语法时，还需使用RIGHT或LEFT关键字来指定包括其所有行的表（RIGHT指出的是OUTER JOIN右边的表，而LEFT指出的是OUTER JOIN左边的表）。

上述左外连接语句使用了LEFT OUTER JOIN 从FROM子句左边的表（Customers）中选择所有行。

若要从右边的表选择所有行，即使用 右外连接 ，则语句如下：

注意：两种基本的外连接形式，左外连接和右外连接。两者的唯一差别是所关联的表的顺序。

此外，还有一种外连接，即 全外连接 。该连接检索两个表中的所有行并关联可关联的行。与左外连接或右外连接包含一个表的不关联的行不同，全外连接包含两个表的不关联的行。

自连接、自然连接、内连接和外连接的区别

①自连接： 通常用于 两张结构和数据内容完全一样的表 ，在做数据处理时，对它们分别 重命名 来加以区分，然后再进行关联。

②自然连接 ：特点是要求两个关系表中进行连接的必须是 相同属性列 （名字相同），无需添加连接条件，且 在结果中消除了重复的属性列 。

③内连接 ：与自然连接相似，区别在于内连接 不要求两属性列同名 ，可以用 using或on 来指定某两列字段相同的连接条件。

④外连接 ：可以解决自然连接时某些属性不同导致这些元组被舍弃的问题，起到了 保留要舍弃的结果 的作用。

使用带聚集函数的连接

之前给大家介绍过使用 聚集函数 来汇总数据，殊不知这些函数也可以与连接一起使用。

分析： 上述语句使用了 COUNT函数 。该语句使用INNER JOIN将Customers和Orders表相互关联。GROUP BY子句按顾客分组，因此，函数调用COUNT(Ordersorder_num)对每个顾客的订单计数，将其作为num_ord返回。

分析： 上述语句使用 左外连接 包含所有顾客，包括了那些没有任何订单的顾客。

WHERE子句的重要性

需记住的是，在一条SELECT语句中连接几个表时，相应的关系是在运行中构造的，因为在数据库表中的定义没有指示DBMS如何对表进行连接的内容。

要连接多个表，需要将它们并列于from之后，关键是要设置WHERE子句，确保它们之间的 关联关系 必须给出，否则，查询结果会成为笛卡尔积。

笛卡尔积：由没有连接条件的表关系返回的结果为笛卡儿积。

分析：上述语句输出的结果便是 笛卡尔积 。返回的数据用每个供应商匹配了每个产品，包括了供应商不正确的产品（即使该供应商没有产品）。

连接及其使用的要点

① 注意所使用的连接类型。一般我们使用内连接，但使用外连接也有效。

② 关于确切的连接语法，应该查看具体的文档，看相应的DBMS支持何种语法（大多数DBMS使用这两课中描述的某种语法）。

③ 保证使用正确的连接条件（不管采用哪种语法），否则会返回不正确的数据。

④ 应该总是提供连接条件，否则会得出笛卡儿积。

⑤ 在一个连接中可以包含多个表，甚至可以对每个连接采用不同的连接类型。虽然这样做是合法的，一般也很有用，但应该在测试它们前分别测试每个连接。这会使故障排除更为简单。

以上就是本次介绍的连接和高级连接啦~

下一期将给大家介绍 组合查询 、 插入数据 及 更新和删除数据。

我们下期见！

SOLyog的下载、安装以及使用很简单。我去了相关网站下载，它只有384K字节大小。它把两个文件(一个可执行文件exe和一个动态链接库文件dll)安装到C:\Program Files\SQLyog路径下。然后运行可执行文件。安装后没有必要再访问该网站了，我访问该网站是得到了一个消息，说它的域名没有设置(configured)、登记、或正在建设中。我不清楚这个问题是暂时的还是一直是这样。该软件是免费的，并且没有标志广告(banner ads)，所以它可能是一个特定的尚未最终定型的商业模型。最终可能还是要负费的。数据库、表格(table)和列树(column tree)该程序一启动就开始询问我的登录到MySOL服务器的口令。我只需要输入我的服务器名字、用户id和登录密码。所有其它的设置都是正确的默认值。然后(当我开始其它事务、重启几次、睡了一会之后)，我重新运行该程序，这时只需要再次输入我的登录密码。该程序没有保存密码的选项，你可以认为这是该程序的一个bug，也可以说是程序的保密特性。一旦你登录之后，界面就是很值得注意。MySOL服务器上所有的数据库都显示在一个树型控件上。你只能访问你在登录时授权的那个数据库。如果你点开代表授权给你的那个数据库的树型结构，你就可以看到一系列代表表格的节点。点开表格节点后，你就可以看到一系列显示字段名的节点和另一个代表索引的节点集合。索引界面绝对是个好东东，这样你就可以CRUD查询索引和关键字了。这相对前端数据库如Microsoft Access来说是个提高。如果考虑到MySOL刚刚开始提供对主(primary)和非相关(foreign)关键字关系的支持，本程序这部分的设计是很成熟的。在右下方的面板上，有四个标签页，即：结果(Result)、消息(Message)、对象(Object)和历史(History)。在SQLyog FAQ上，有一种观点认为该软件没有正式归档的必要。当然，FAQ(常见问题解答)本身就是一种归档。SQLyog的界面非常直观。我建议你打印一份MySOL文档(包括SQL特殊语法扩展)。我就是这么做的，它只用了一个半英寸的活页封面。最后一步FAQ还让人想到一个让人耳朵起了老茧却又是正确的Occam's Razor准则——一切超出必要的复杂性都是没有必要的。我之所以到处“推销”这个工具，就是因为它可以为我们提供一个可以管理MySOL服务器上许多数据库的、简单的、图形化的界面。它的速度极快，并且它的拷贝很小(可以放在一张软盘上)。SQLyog宣称自己是一个查询分析器，实际上它的功能远远不止这些。

以上就是关于数据分析数据库有哪些常见类型全部的内容，包括:数据分析数据库有哪些常见类型、数据库的选择什么样的数据库简单实用、数据分析人必掌握的数据库语言-SQL指南第六期等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9546987.html

数据分析数据库有哪些常见类型

发表评论

评论列表（0条）