如何在海量数据环境下,搭建分布式数据库系统

如何在海量数据环境下,搭建分布式数据库系统,第1张

分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都有DBMS的一份完整拷贝副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。

 这种组织数据库的方法克服了物理中心数据库组织的弱点。首先,降低了数据传送代价,因为大多数的对数据库的访问 *** 作都是针对局部数据库的,而不是对其他位置的数据库访问;其次,系统的可靠性提高了很多,因为当网络出现故障时,仍然允许对局部数据库的 *** 作,而且一个位置的故障不影响其他位置的处理工作,只有当访问出现故障位置的数据时,在某种程度上才受影响;第三,便于系统的扩充,增加一个新的局部数据库,或在某个位置扩充一台适当的小型计算机,都很容易实现。然而有些功能要付出更高的代价。例如,为了调配在几个位置上的活动,事务管理的性能比在中心数据库时花费更高,而且甚至抵消许多其他的优点。

可以试试DBSync,主要特点:

●独立运行

不需要在数据库中设置程序或脚本,不需要更改库结构,是一款独立的应用程序,因此不影响现有系统的运行,简单易用。

●支持各种数据源

既支持常规数据库,如Access、SQL Server、Oracle、MySQL、DB2等,又支持Excel、txt、csv等文件数据,任何可用OLE DB或ODBC连接的数据,均可参与同步。

●异型数据库同步

既支持相同类型数据库之间的同步,如Access到Access、SQL Server到SQL Server,又支持异型数据库之间的同步,如Excel到Access、Access到SQL Server、SQL Server到Oracle等。

●无人值守同步

软件具有定期自动同步的功能,只需预先设置好时间间隔,就可长期自动同步;支持系统重启后自动继续同步,防止意外关机重启而造成同步中断,从而实现无人值守同步。

●支持增量同步

既支持简单的全部复制式同步(Insert),又支持增量同步。软件能快速扫描数据库,找出相互间的差异(即增量),只对增量进行同步。

●支持断点续传

当同步中断后,再次同步时能从中断位置继续同步,避免每次都需要从头开始。

●秒级实时同步

重复同步的时间间隔最短可设置为1秒,源数据库发生变更后,1秒后就同步过去,几乎等同于实时同步。

●支持同步后处理

可设置同步后的SQL执行语句,实现同步之后的数据转换、公式计算等额外任务。

依靠索引

-------------------------

索引

使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构,例如 employee 表的姓(lname)列。如果要按姓查找特定职员,与必须搜索表中的所有行相比,索引会帮助您更快地获得该信息。

索引提供指向存储在表的指定列中的数据值的指针,然后根据您指定的排序顺序对这些指针排序。数据库使用索引的方式与您使用书籍中的索引的方式很相似:它搜索索引以找到特定值,然后顺指针找到包含该值的行。

在数据库关系图中,您可以在选定表的“索引/键”属性页中创建、编辑或删除每个索引类型。当保存索引所附加到的表,或保存该表所在的关系图时,索引将保存在数据库中。有关详细信息,请参见创建索引。

注意;并非所有的数据库都以相同的方式使用索引。有关更多信息,请参见数据库服务器注意事项,或者查阅数据库文档。

作为通用规则,只有当经常查询索引列中的数据时,才需要在表上创建索引。索引占用磁盘空间,并且降低添加、删除和更新行的速度。在多数情况下,索引用于数据检索的速度优势大大超过它的。

索引列

可以基于数据库表中的单列或多列创建索引。多列索引使您可以区分其中一列可能有相同值的行。

如果经常同时搜索两列或多列或按两列或多列排序时,索引也很有帮助。例如,如果经常在同一查询中为姓和名两列设置判据,那么在这两列上创建多列索引将很有意义。

确定索引的有效性:

检查查询的 WHERE 和 JOIN 子句。在任一子句中包括的每一列都是索引可以选择的对象。

对新索引进行试验以检查它对运行查询性能的影响。

考虑已在表上创建的索引数量。最好避免在单个表上有很多索引。

检查已在表上创建的索引的定义。最好避免包含共享列的重叠索引。

检查某列中唯一数据值的数量,并将该数量与表中的行数进行比较。比较的结果就是该列的可选择性,这有助于确定该列是否适合建立索引,如果适合,确定索引的类型。

索引类型

根据数据库的功能,可以在数据库设计器中创建三种索引:唯一索引、主键索引和聚集索引。有关数据库所支持的索引功能的详细信息,请参见数据库文档。

提示:尽管唯一索引有助于定位信息,但为获得最佳性能结果,建议改用主键或唯一约束。

唯一索引

唯一索引是不允许其中任何两行具有相同索引值的索引。

当现有数据中存在重复的键值时,大多数数据库不允许将新创建的唯一索引与表一起保存。数据库还可能防止添加将在表中创建重复键值的新数据。例如,如果在 employee 表中职员的姓 (lname) 上创建了唯一索引,则任何两个员工都不能同姓。

主键索引

数据库表经常有一列或列组合,其值唯一标识表中的每一行。该列称为表的主键。

在数据库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每个值都唯一。当在查询中使用主键索引时,它还允许对数据的快速访问。

聚集索引

在聚集索引中,表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引。

如果某索引不是聚集索引,则表中行的物理顺序与键值的逻辑顺序不匹配。与非聚集索引相比,聚集索引通常提供更快的数据访问速度。

海关信息化项目的主要特点是“电子海关”是一个覆盖全国海关各项业务,连接海关各部门、各关区,以通关作业网络化、物流监控智能化为主要特征的海关管理信息系统。目前,电子海关已形成以H2000通关管理系统为主体,包含海关整个通关业务流程的信息处理系统,海关虚拟专网已覆盖全国41个直属海关、700多个业务现场。依托“电子海关”,海关加快了区域“大通关”建设,实施了快速通关、快速转关、高新技术企业便捷通关、加工贸易联网监管、无纸通关等一系列监管制度改革。去年7月1日开关的深圳湾海关充分发挥高科技作用,依托大型集装箱检查设备、闭路电视监控系统、通道自动核放系统、货检及旅检小型X光机、车载移动式车辆检查设备、智能告知管理系统等高科技“武器”,在深圳湾口岸实施了“重车自主选择通道通关”、“电子车牌自动识别系统与人工验放相结合”等高效通关模式,大大提高了通关速度。仅“通道自动核放系统”就将原来车辆通过海关通道需要2分钟,一下子缩短到了5秒钟。同样是提速,杭州海关推出的空港进口货物“空中申报,落地验放”通关作业模式,使得装载进口货物的飞机在境外机场一起飞,舱单电子数据便通过SITA网传输到海关,电子报检、报关、审单等10项手续都可以提前进行。平均通关时间由原先的84小时缩短至7小时以内,绝大部分进口货物在飞机落地后3小时内即可完成通关手续。

如果说“提速”给海关带来的是效率,那对企业来讲,则意味着能省下“真金白银”。中国国际石油化工联合有限责任公司是一家大型石油进口企业,今年上半年仅原油进口就向国家缴纳了40亿元人民币的关税。公司负责人感慨,“我们的货物多滞留一天就要承担多一天的风险,卸油期限每超过1小时就要多增加7万多美元的滞港费用。杭州海关推出‘提前报关,货到验放’,船没到港就能办手续,油船即到、即卸、即离,为公司节省了可观的在港费用。”

 矢量化海图(Vector charts):是将数字化的海图信息分类存储的数据库,使用者可以选择性的查询、显示和使用数据,并可以和其他船舶系统相结合,提供诸如警戒区、危险区的自动报警等功能。

光栅扫描海图(Raster charts ):通过对纸质海图的光学扫描形成的数据信息文件,可以看作是纸质海图的复制品。因此,不能提供选择性的查询和显示功能。

以上就是关于如何在海量数据环境下,搭建分布式数据库系统全部的内容,包括:如何在海量数据环境下,搭建分布式数据库系统、比较好用的数据库同步软件又哪些、数据库文件是如何在海量数据中快速确定需要数据的位置原理是什么等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9481326.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存