数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指

数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指,第1张

数据库的特点之一是数据的共享,严格来讲,这里的数据共享是指多种应用、多种语言、多个用户互相覆盖地使用数据集合。

拓展:数据库的特点

数据结构化。

数据库系统实现了整体数据的结构化,这是数据库的最主要的特征之一。这里所说的“整体”结构化,是指在数据库中的数据不只是针对某个应用,而是面向全组织,面向整体的。

实现数据共享。

因为数据是面向整体的,所以数据可以被多个用户、多个应用程序共享使用,可以大幅度地减少数据冗余,节约存储空间,避免数据之间的不相容性与不一致性。

数据独立性高。

数据的独立性包含逻辑独立性和物理独立性,其中,逻辑独立性是指数据库中数据的逻辑结构和应用程序相互独立,物理独立性是指数据物理结构的变化不影响数据的逻辑结构。

数据统一管理与控制。

为数据库配置比较大的内存 可以有效提高数据库性能 因为数据库在运行过程中 会在内存中划出一块区域来作为数据缓存 通常情况下 用户访问数据库时 数据先会被读取到这个数据缓存中 当下次用户还需要访问这个数据时 就会从这个数据缓存中读取 因为在数据缓存中读取数据要比在硬盘上读取数据快几百倍 所以扩大数据库服务器内存 可以有效提高数据库性能 特别是 *** 作大型数据库时效果更加明显

但是 现在企业中普遍采用的数据库服务器都是 位的 *** 作系统 而这个 位的 *** 作系统却有最大内存的使用限制 通常情况下 标准的 位地址最多可以采用 GB的内存 若数据库管理员想让数据库系统采用更多的内存来提高数据库的性能 则就需要进行额外的配置 下面笔者就介绍两种常用的配置方式 让SQLServer数据库服务器支持大内存 让其成为数据库的加速剂

一 让数据库应用程序支持 GB的内存空间

虽然 *** 作系统支持 GB内存 可是 这并不会全部给数据库等应用程序使用 默认情况下 在 位 *** 作系统中 将有 GB的内存空间是为 *** 作系统所保留的 即使没有用完 其他应用程序也是不能够染指的 而包含SQL Server数据库在内的所有应用程序 只能过采用剩余的 GB内存空间

但是 在实际应用中 *** 作系统往往用不着多大 G的内存 根据笔者的经验 一般只要为 *** 作系统保留 G的内存已经足够其使用 只要没有病毒等不良因素作怪 这个内存不会被完全适用 如此的话 应用程序可以采用的内存空间就会多达 G 比原先整整多出一个G来

要实现这个转变 其实很简单 在Windows *** 作系统中 有一个BOOT启动配置文件 为了让数据库服务器支持 GB的用户模式进程空间 必须在这个配置文件中 加入一个/ gb的参数 然后重新启动 *** 作系统即可 这么设置之后 应用程序就可以寻址 GB的进程地址空间 而为 *** 作系统保留 GB的内存空间

有时候 这个小小的配置可以在很大程度上提高数据库的性能 记得有一次 笔者为一家企业优化数据库性能 笔者查看了用户的数据库环境之后 就建议用户增大数据库服务器的内存 从 G增加到 G 可是 效果并没有很大的改善 正当笔者束手无措的时候 就想到了改变 *** 作系统与应用程序的内存分配方式 为此 笔者就更改了BOOT启动配置文件 只给 *** 作系统保留 G的内存空间 重新启动后 数据库性能得到了很大的改善

二 为SQLServer启用更高的内存支持

如果数据库应用程序内存寻址空间达到 GB后 数据库管理员还不满足的话 则就需要通过增加物理内存的方式 来提高应用程序的性能 若需要服务器 *** 作系统突破其默认 GB内存空间的限制 支持 GB以上的内存空间 也不是不可能的 只是需要进行额外的配置 并且 其维护的工作量也比较大

若想要SQLServer数据库支持 GB以上的内存寻址空间 则往往需要进行如下配置

第一步 锁定内存页

默认情况下 内存大小与 *** 作系统的虚拟内存之间有一个正比例关系 在这里 数据库管理员只想增大服务器的物理内存 而不想对虚拟内存有什么影响 故需要锁定内存页 锁定内存页的主要作用就是确定哪些帐户可以使用进程将数据保留在物理内存中 从而阻止系统将数据分页到磁盘的虚拟内存中 默认情况下 这个选项的只为OFF 也就是说 在必要的时候 系统会将数据分页到硬盘的虚拟空间中 为了最大程度发挥内存的效用 就需要把这个选项开启 不过这数据库管理员往往需要寻求系统管理员的帮助 因为只有具有系统管理员权限的用户 才能够给更改这个选项

第二步 启用Awe Enable选项

默认情况下 即使服务器 *** 作系统支持 GB以上的内存空间 可是数据库应用程序并不一定支持 为了让SQLServer应用程序也支持这个 就必须更改数据库的配置参数 也就是说 需要将这个选项的值设置为 然后重新启动数据库系统 这个配置比较简单 只需要利用命令sp_configure awe enabled 即可 不过在进行这个配置之前 需要注意两个细节方面的内容 一是数据库用户需要这个 *** 作的权限 二是这里有一个BUG 即在SQL Server数据库中会有一个错误信息 数据库管理员可以忽略这个信息

第三步 限制文件系统缓存

若增加的内存给 *** 作系统或者其他应用程序用了 那么数据库管理员不是白忙一场吗为此 数据库管理员还需要优化数据库系统内存的使用情况 如需要限制系统用于文件缓存的内存量 如要这么处理的话 只需要简单的三个步骤即可

首先 数据库管理员在 *** 作系统中 找到控制面板 并双击网络连接 然后选中本地连接 其次 双击本地连接 在d出的对话框中 找到常规选项卡 单击属性 选中网络文件与打印机共享 并单击属性 最后 在d出的对话框中 去掉 最大化网络应用程序数据吞吐量 复选框 一路按确认即可 这个简单的步骤 就可以优化数据库内存的使用率

三 大内存维护管理几个关键点

在通常情况下 往往不需要启用 GB以上的内存 但是 若在服务器上 同时启用了其他的应用程序服务 如在一台服务器上同时有数据库应用程序 邮件应用程序 文件服务器等多个应用服务的话 则可能原有的 GB内存无法满足 系统管理员不得不对内存进行升级 但是 对内存升级之后 数据库管理员需要手工对内存的分配进行干预 以免SQLServer应用程序占用比较多的内存空间 而影响其他应用程序的性能

配置max server memory选项 虽然说这个选项并不是必须要修改的 但是笔者仍强烈建议数据库管理员要修改这个选项 特别是数据库应用程序与其他应用程序共享同一台服务器时 因为启动SQLServer对大内存的支持后(将Awe Enabled设置为 ) 而且可用物理内存大于用户模式进程空间 则当启动数据库服务器时 运行的SQLServer实例将会占用几乎所有的可用内存(不管需不需要使用 数据库服务器程序会先锁定这些内存 这就叫占著茅坑不拉屎) 而这个max server memory选项就是用来配置其最大可以占用的内存数量 数据库管理员需要预先估算出一个合理的数值 然后进行配置 让数据库应用程序与其他应用服务能够共同改善 至少不能够对其他应用程序的性呢产生不良影响 在比较极端的情况下 可以在升级内存之前 先关闭数据库应用程序;然后启用其他应用程序服务 观测一段时间 看看他们所需要用到多少的内存 然后升级内存 并为其他应用程序至少保留以前所需要的内存空间 否则的话 就会对其他应用程序产生不良影响 牺牲其他应用程序的性能来提高数据库的性能 这是拆西墙补东墙的做法 不值得取

lishixinzhi/Article/program/SQL/201311/16351

最基本的两个功能是:一数据收集;二数据分析归纳。

扩展:

一、它必须容纳海量数据

如果大数据分析平台无法扩展以存储或管理海量数据,那么仅仅提高速度所带来的作用相当有限。大数据分析平台必须能够容纳海量数据。

大规模并行处理是用于扩展分析处理的理想技术,因为它同时利用计算机群集的存储和计算能力。它不仅在性能上有所扩展,而且其处理传入的大量数据流的能力也相应提高。

此外,被设计为用于处理结构化数据的大数据平台使用MPP,可进一步加速处理 *** 作,这是因为已针对分析程序优化了结构化数据,并减少了回答查询所需执行的搜索量。结构化数据库能够更好地了解数据在数据海洋中的位置,并且可以精确地存取数据。

一般来说,非结构化数据库难以扩展到采用列式设计的结构化数据库所能达到的级别。但是,大数据分析平台可能整合有能够提高非结构化数据库的可扩展性和性能的功能。

二、它必须非常快

简单来说,数字时代下,用户不希望在运行查询时长时间地等待结果。他们期望即时得到满足,获得即时结果,而对其他工作负载没有影响。这意味着大数据分析平台必须增强现有应用程序的性能,允许您开发具有挑战性的新分析方法,并提供合理、可预测和经济的横向扩展策略。

从技术角度来看,要满足这些期望,必须结合列式数据库架构(相对于基于行的非并行处理传统数据库)和使用大规模并行处理技术或者说MPP。

理由在于:列式设计可最大限度地减少I/O争用,后者是导致分析处理发生延迟的主要原因。列式设计还可提供极高的压缩率,相比于行式数据库,通常可将压缩率提高四倍或五倍。MPP数据仓库通常按比例线性扩展,这意味着如果您将双节点MPP仓库的空间翻倍,那么可有效将其性能提高一倍。

列式设计和MPP的结合不仅能够大幅提高性能(通常约100到1000倍),还可以实现更低且更透明的定价机制,例如针对每TB的模型而非传统的针对每处理器、每节点、每用户的定价方案。最终结果:性能呈指数级增长,同时大数据分析处理过程的总成本大幅降低。

三、它必须兼容传统工具

如果您的大数据分析平台依赖于“提取、转换、加载”(ETL)工具(如Attunity、Informatica、Syncsort、Talend或Pentaho)或基于SQL的可视化工具(如Logi

Analytics、Looker、MicroStrategy、Qlik、Tableau和Talena),请确保该平台已经过认证,可与所有这些工具而不仅仅是主要供应商的工具搭配使用。此外,确保您使用的所有工具和扩展技术符合最新版本的ANSI

SQL标准(SQL2011)。

四、它必须为数据科学家提供支持

数据科学家在企业IT中拥有着更高的影响力和重要性,因此大数据分析平台应在下述两个关键方面支持数据科学家。首先,新一代数据科学家采用Java、Python和R等工具来执行预测式分析。底层分析数据库应支持和加速创新型预测分析的创建过程。

其次,此平台应有助于将数据科学家的工作与业务目标联系起来。如今,数据科学家的角色常常从统计学家演变而来,后者相对而言更具学术意味,而且通常并不熟悉宏观业务目标。在某些情况下,会导致数据科学家得出的结论可能不完整、不准确或与业务成果无关。同时,商业人士常常乐于让统计学家在封闭的环境中工作,只在需要他们支招时才去找他们。

快速、高效、易于使用和广泛部署的大数据分析平台可以帮助拉近商业人士和技术专家之间的距离。

五、它应提供高级分析功能

根据您的特定使用情况,可能有必要深入查看由大数据分析引擎提供的内置SQL分析功能。您必须从底层查看,以了解究竟提供了何种SQL分析,而不用对该数据执行分析。例如,如果要对从设备获得的数据执行分析(如在物联网中),则需要诸如“时间序列分析”和“差距分析”等分析功能。如果没有这些功能,您可能需要花费时间整理数据或编写自定义代码。

以上就是关于数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指全部的内容,包括:数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指、大内存SQLServer数据库的加速剂、大数据平台提供的最基本的两个功能是什么等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9874337.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存