Oracle数据库空间管理和规划_sql

本文希望通过系统地介绍这方面的有关概念让大家能更好地规划使用数据空间正确使用Oracle提供的有关功能特性提高应用的执行效率

数据库空间的有效使用和维护不仅是数据库管理的重要工作也是大多数开发人员所关心的内容因为它直接关系到数据库性能的发挥同时数据碎片是经常令人头疼的问题碎片不仅造成空间的浪费更重要的是会直接影响应用程序的响应速度

Oracle提供了不少方法用于数据空间的使用监控和维护同时也在各版本中陆续对这方面的功能进行了增强目的在于简化这方面工作的复杂度提高应用的运行效率

一相关概念

数据库的空间在逻辑上分为多个表空间每个表空间则由系统中的一个或多个物理数据文件构成 Oracle存储数据的基本单位是块其大小在建库时由DB_BLOCK_SIZE参数确定一个或多个连续的块构成一个区片（EXTENT）它作为数据对象存储的基本单位来使用在Oracle中每个基本数据对象使用的空间称为段（Segment）段存放在唯一的表空间上每个段实际上是一系列区片（更为准确地是数据块）的集合每个简单数据对象对应一个段对于分区对象如分区表索引则每个（子）分区对应一个段由各个（子）分区共同构成一个完整的数据对象因此可以把表空间看作桶里面放著许多段一个段只能放在一个桶中而不能跨越多个桶

二表空间的使用

表空间碎片的产生

由于同一个表空间中存放有多个数据段各个数据段可以有不同的区片尺寸不同段的区片可以交叉存放当这些段中的区片经过分配（如创建表）释放（如删除表）后就可能使表空间中原本连续的空闲数据块变成不连续而区片必须由连续的数据块构成这时当某一段需要分配新的区片时就有可能出现虽然表空间空闲数据块的总和大于所需区片的大小但却无法找到一串连续的块来供此区片分配使用这种情况就称为表空间的Extent Fragmentation 我们经常会遇到这种情况明明从DBA_FREE_SPACE中计算表空间还有几百MB 但其中的某一个表却无法再扩展几个MB的空间

消除表空间碎片

Oracle在段的区片分配上为用户提供了很大的灵活性然而如果未能正确使用创建表空间和数据对象的各个可选择参数则在最后将不可避免的要面对区片碎片的问题 Oracle 的Bhaskar Himatsingka 和 Juan Loaiza 为此提出了SAFE（Simple Algorithm for Fragmentation Elimination ）配制规则通过遵循这套规则区片级碎片可以完全的避免而实际上 Oracle i引入的新特性 Local Managed Tablespace就是SAFE规则在Oracle Server的内置实现 SAFE原则概括起来包括

对每个表空间上的段使用相同的区片尺寸段参数INITIAL=NEXT PCTINCREASE= 可以通过使用Create Tablespace 的 MINIMUM EXTENT 子句来确保分配的区片是此参数的倍数

仅在表空间级指定INITIAL NEXT参数在创建数据段时不要指定这些参数

区片的大小根据段大小来确定原则是均衡顺序扫描的效率和空间的利用率同时确保段的区片数目控制在之下根据此原则在进行相应测试之后确定以下区片选取规则

段大小(Oracle ) 区片大小(Oracle ) 段大小(Oracle ) 区片大小(Oracle ) &M K &M K M G M M G M &G M &G M

有此数据库中可以只使用三种区片大小的表空间在对象创建之前需对其大小进行评估并放到相应的表空间中

Oracle 引入了本地管理表空间它在管理和性能上都优于传统的字典管理表空间它已融合了规则要使用此特性在CREATE TABLESPACE语句中指定EXTENT MANAGEMENT LOCAL子句

段的区片数目上限应在之下 DML *** 作在此区片数目范围内不会有明显的性能差异但某些DDL *** 作的速度则与区片的数目关系较大因此合理的区片数目应保持在之下对于持续不断扩展的段应监控区片数目在必要时移至其它表空间

对于特别大的数据段应控制在 G G（Oracle 为 G G）之间它们应存放到单独的表空间上同时对于这些特大段应考虑使用分区拉提高性能

用户的临时表空间应使用TEMPORARY类型

当系统的事务规模比较均衡时可以对回滚段使用OPTIMAL参数否则应避免制定OPTIMAL参数而定期监控回滚段的大小并在必要时重建

临时段和回滚段绝对不要将用户数据存放到SYSTEM表空间它是专为永远不会Drop和Truncate的系统数据对象而设计的

创建表空间时指定数据文件的大小应=区片整数倍+ 数据块对于Local Managed Tablespace则为区片整数倍+ K

当表空间使用统一的区片大小时不要对其进行空间整理重整的结果不仅耗费精力而且可能会使性能变差对于未使用统一的区片尺寸的表空间应通过Export/Import重整

i 提供了Alter Table …Move [Tablespace…]命令可用于快速重整表 Alter Index …Rebuild…[Tablespace…] 命令可用于快速重建索引

有关使用单个区片的误导

在许多关于碎片整理的文档中建议在Export时使用Compress=Y选项将表中的所有数据调整到一个区片中期望在Import后获得良好性能由此让许多人产生一个观点认为当表中数据全部存放到一个区片中时可以获得良好性能实际上单区片段只在以下条件成立时才具有优越性

数据主要以（全段）扫描方式访问

段所对应的数据块在物理磁盘上连续存放 Oracle可以发布较大的顺序磁盘读 *** 作

通过对这两条进行分析可以发现一方面数据库中大部分表是通过索引来访问另一方面现在的数据库文件一般在物理上使用了RAID 或RAID + 技术数据以条带化方式分布到多个物理磁盘上逻辑上的单个区片和多区片在物理上并无本质上的区别另外从Oracle的角度来看管理几百个区片的段是非常轻松的并不会有性能的下降由此可见将整个段放到一个区片中并无明显好处而这种做法却会导致表空间碎片的产生

三表数据段的使用

表空间的组织

Heap表的空间由一系列区片链接而成每个数据块除块头外其余部分可用于存放数据在创建表时可以指定以下参数

PCTFREE 块中保留用于UPDATE *** 作的空间百分比当数据占用的空间达到此上限时新的数据将不能再插入到此块中

PCTUSED 指定块中数据使用空间的最低百分比当一个块在达到PCTFREE 之后经历了一些DELETE *** 作在其空间使用下降到PCTUSED后便可以重新被用于INSERT数据这就是PCTFREE/PCTUSED参数的含义

调整PCTFREE PCTUSED参数的目标一方面是提高性能另一方面则主要是提高空间使用效率避免出现块中存在有许多未用的空间但却无法找到一个块可以被用于插入新数据行的情况发生

PCTFREE的使用

在Oracle中表的每一行数据由唯一的ROWID标记而Oracle支持的数据类型中有一些长度是可变的如VARCHAR 当对这些数据进行UPDATE时如果块中的可用空间不能容纳UPDATE后的数据行时 Oracle将会把此行移到其它数据块同时保留此数据行的ROWID不变并在原有块中建一指针指向行迁移后的位置在这种情况下读取一行数据将需要访问个数据块从而导致性能下降 PCTFREE保留的空间就是为确保更改后的数据行可以仍存放于原有数据块中避免行迁移的情况发生

由此如果PCTFREE设置不足时可能产生行迁移而另一方面如果PCTFREE设置过高将会造成空间浪费因此正确设置PCTFREE需要对表中数据的使用进行分析对于数据长度不会变化或极少更新的情况可以采用较小的PCTFREE 对于其它大多数情况应采用稍大的PCTFREE（PCTFREE的缺省值是如果不好估计需预留的空间可以使用的范围）不要为节约块中的空间而使用较小的PCTFREE值

PCTUSED的使用

当块的使用的空间下降到PCTUSED后此块被重新放回空闲链表（Freelist）中作为后续Insert的候选块同样设置PCTUSED需要视数据行的特性和Insert Update Delete的模式而定但必须遵守的原则是 db_block_size * （ PCTFREE PCTUSED）必须比行的长度大

对于数据行长度变化较大的情况应使用最大行长度来计算PCTUSED 并且应使用较低的PCTUSED值因为在执行Insert时如果数据块的可用空间不能装下一行数据当块的使用的空间是在PCTUSED之上 Oracle将把此块从Freelist中移走当块的使用的空间是在PCTUSED之下 Oracle将会扩展段空间因此 PCTUSED如果设得过高将导致段的不断扩展

lishixinzhi/Article/program/Oracle/201311/18776

ORACLE数据库中表是最基本的内容可以说表设计的好坏直接跟数据库的性能相关所以在设计表的时候除了要遵循其固有的数据库准则之外还需要看个人的数据库管理经验下面我就把这些经验分享一下或许对大家有所帮助一表该存放在哪里? 我们都知道在ORACLE数据库中使利用空间这个概念来管理表对象的在数据库创建的时候数据库中已经建立了一些表空间那么当我们新建立表的时候这个新表的位置该放在什么地方呢?这就好像吃饭时的坐的位置一样是有讲究的一般来说我们在新建表的时候至少要遵循如下建议一是在数据库创建的时候在数据库中已经有了一个SYSTEM的表空间一般情况下这个表空间中只包含数据字典及Oracle系统对象如果我们将我们的表建立在这个空间上的话那是要降低数据库的性能的所以一般我们是不建议用户把表格建立在这个空间上但是若我们不只一个人维护数据库如有八个人共同设计数据库系统时如何才能保证其他用户不在SYSTEM表空间中建立数据库表格呢?最好的办法就是通过权限控制如我们可以给每个数据库设计人员指定一个默认的表空间让他们只能在这个表空间中建立表格如此的话就能防止他们在SYSTEM表空间中建立自己的数据表格从而对数据库的运行性能产生不良影响所以若给每个用户设置默认表空间的话那么用户在建立具体的表时不用具体指定表空间了二是我们在为某个应用设计数据库的时候最好先对表的空间进行规划一般情况下不要把数据表随意的分散到不同的表空间中去如我们在为一个ERP系统设计数据库的时候若把采购部门相关的表跟销售部门相关的表放到两个不同的表空间中去这是不明智的做法这么处理的话会降低某些数据库管理和维护 *** 作的效率如数据的备份与恢复 *** 作而且也无法集中管理属于某个特定应用的数据所以我们一般建议在规划数据库表空间的时候把相同应用的表放在同一个表空间中去如果要区分不同部门或者不同模块的表的话我们可以在表的命名上动脑子如我们在设计ERP系统的数据库中可以根据其应用模块的不同在前面加上前缀来进行识别如跟系统基本配置相关的表我们可以用AD为前缀而跟销售部门相关的表我们可以加上SA前缀等等如此的话这些表具体是属于哪个模块的就一清二楚了完全没有必要为此设置不同的表空间这是ORACLE数据库初学者经常会犯的错误主要是对ORACLE表空间的定义不是很熟悉所导致的二对预计存储数量比较大的表时要给与额外的重视有些表非常的大我们这边说的大不一定是说结构复杂而是指在这个表格中预期会存储比较多的数据为了提高对这个表格的处理效率我们在事先要做出一定的安排否则的话后续对这些大表进行查询插入等 *** 作的话速度会很慢所以我们就有必要在数据库设计的时候先预先估计一下表的数据存储量把一些数据量大的表格做一些额外的设置如在ERP软件的数据库设置中一般来说产品数据与物料清单数据这两个表的数据量会比较大而从长远看的话销售订单采购订单生产订单记账凭证等这种单据类相关的表格其数据量也会比较大一年两年可能感觉不出来但是到十年后这个纪录数量就会很庞大而像ERP系统这种大型的信息化管理项目用个几十年时很正常的事情而且为了记录的完整性也不建议用户把以前的数据删除所以为这种应用进行数据库设计的时候要充分考虑这些大表的性能问题具体的来说设计大表的时候可以考虑遵循如下的建议一是不要为大表设置存储的限制在ORACLE数据库中可以为每张表格设置存储配额限制如此的话表最大容量就不能超过这个限制对于一些数据容量比较小的表格这么设置时合理的可以提高空间的利用率但是若数据量比较大的话就不建议事先设置表的存储空间了如ERP系统的销售订单表其刚开始可能记录量很小第一年预计只有 G的记录容量但是估计在十年后这个记录容量就会达到 G了在这种情况下我们怎么来给其设置存储空间呢?一开就设置 G空间这也是不合理的而且设置存储空间就意味着有可能产生存储碎片从而影响到数据查询的效率所以在数据库表的设计过程中若某些应用的表可能会有比较大的数据容量时建议不要对其存储空间做出任何的限制二是要为这大表分配足够的临时空间如我们使用ERP系统时要查询产品资料信息我们都知道产品信息的话有些企业这个纪录数非常的庞大而且在查询时我们还会经常的进行排序 *** 作如有时候会按照产品编码对查询出来的数据进行排序当记录少的话还好但是当记录多的话这个排序动作要求具有比较大的临时存储空间所以当某个表预计会有很大的记录数量的时候我们就要给其分配足够多的临时空间临时空间的存储参数设置取决于临时表空间的默认储存参数设置我们可以更改这些参数以达到我们对要求若没有给大表分配足够多的临时空间的话则排序的动作将会很慢而且很可能不成功三是要考虑将表与表的索引分离存放大表所对应的索引通常也比较大一般来说索引的数量是随着表记录的数量增加而增加两者是接近于一个正比例的关系所以通常表的记录容量大的时候索引数量也会很庞大针对这种情况我们考虑突破我们上面讲的表空间的规则定义而考虑把表和他的索引分别存储于不同的表空间中甚至在条件允许的情况下分别存储于不同的硬盘中这么做的好处是什么呢?最大的好处是让索引比较容易的获得所需要的连续的存储空间从而提高输入输入的效率通俗的说就是可以提高数据的查询效率如不这么处理的话查询大容量的记录的话数据库可能需要花费秒而如此设计的话就可能把时间缩短为秒这是一个很明显的性能改善三如何给表命名? 上面我在讲如何为表分配存储空间的时候已经讲到过这方面的问题下面我就将对这个问题进行详细的描述以帮助数据库管理员掌握一套好的数据库命名规则首先毋庸置疑的在为标命名的时候要遵循ORACLE数据库的基本命名规则如不能以数字开头为表命名如不能利用数据库的关键字为表命名如表的名字不能重复等等这些是最基本的要求就不用我多费口舌了除了要遵循这些基本的命名规则外在实际工作中为了数据库后续的维护等方面出发我们还是要遵循一些额外的规则这些规则跟ORACLE定义的规则不同我们所讲的规则没有约束力可以说只是业界的一些共识而已你若不怎么处理 ORACLE数据库也不会说你错误只是后续维护的时候会比较麻烦而已一是在对数据库命名的时候最好能跟体现表的分类关系如最常见的我们在设计数据库的时候表都是按系统的具体模块来区分的如根据前端系统要求的不同数据库的表大致可以分为系统基本配置表销售模块表采购模块表报表模块表等等我们可以根据这些模块的不同分别给与不同的前缀来区分这么做的好处是很明显的如一看到表最大名字就可以知道这个表是属于哪个应用的哪个模块的这无疑可以提高数据库设计与前台软件开发的效率同时数据库中默认的排序规则是按名字来排序的所以为表格设置类别前缀的话可以把同一类的表格排在一起方便我们察看二是对表格命名的时候要考虑可读性而不能随便阿狗阿猫的乱取名字最常见的是那些刚学数据库的人在表命名的时候如要建几张测试表就会随便命名如TEST TEST 之类的虽然这只是测试但是也不符合我们的命名过则要做测试的话那就以TEST开头然后后面加上具体要测试的内容如此的话我们才可以通过表的名字知道该表具体的用途而不用打开表去看里面具体的结构或者注释才能知道我们需要的信息所以在设计表的名字的时候还要关注一下其的可读性 lishixinzhi/Article/program/Oracle/201311/18317

ORA-1555通常是一个偶然出现的错误。有时在发生了该错误以后，重新运行该任务就有可能不再碰到类似的错误。这个错误最麻烦的是它并不会立刻发生，运行时间长的任务在错误失败以前可能已经运行了一段时间了(可能几个小时)。只是简单地重新运行该任务并不能保证它能成功，可能在运行了一段时间以后仍然失败。

1 原因分析

ORA-1555错的根本原因是因为oracle要保证读一致性。读一致性是指当有多个用户对一个数据块内的行进行修改时，这些块变“脏”或处于变化之中直到被确认。在被确认以前，它们对事务中的所有语句都是可见的，但是对别的事务或语句而言是不可见的。一旦确认以后，对所有后继的事务或语句就都是可见的了。但在事务被确认前的语句不能看到修改，因为这些修改还未发生。

例如，事务T 1(如对某大表的exp *** 作)在2 2 ：0 0开始而事务T 2(如对同一大表的update *** 作)在2 2 ：0 1时开始，因为T 1需遍历一个很大的表，其读取要花很长的时间，而T 2可能对同一个表中的数据进行基于索引的更新 *** 作。这样， T2可能在几秒钟之内完成，而T 1可能要运行很长时间，假定4 0分钟。当T 1到达T 2做过修改的地方时(根据当前的S C N时间戳可以识别出新作的改变)，尽管T 2所进行的写已经被确认，但为了保证读一致性,它不会读到修改后的数据,它只访问在2 2 ：0 0时的数据，在2 2 ：0 1时所做的改变不能被读取。T 1从回滚段中读取改变前的数据以保证读一致性。但因为事务T2已经提交，T2事务使用的回滚段oracle认为已经可以重新利用，当回滚段太少或事务较密集时，oracle有可能会用新事务覆盖掉原来T2事务的回滚段，这时T1事务读到被T2修改过的数据时，再从回滚段中就无法找到修改前的数据，这时就会报ORA-1555,snapshot too old错。

下面我们可以结合实例来将此过程回溯一遍：

(1)事务T1在22点开始执行了对某一个大表Test1的exp *** 作(Test1表数据量可能有几千万甚至更多)，那么按照经验，此 *** 作可能需要执行40分钟左右或更长

(2)事务T2在22点01分开始执行对Test1表某行的update *** 作，并且 *** 作条件上有索引(将col1为00的行，col2值由90修改为100)，故此 *** 作很快完成，比如5秒钟完成 *** 作并commit

(3)此时事务T2已经执行完毕，而事务T1还在执行中

(4)当事务T1需要将col1为00的行导出为dmp文件时，Oracle为了保证读一致性，即T1导出的必须是22点时数据库表的值，故col1为00的行对于T1任务来说值仍然为90，而非100

(5)由于T2事务在22点02分前就已经做完(提交)，并且T2认为回滚段是可以重新利用的

(6)如果此时由于回滚段太少或业务量较密集，oracle就可能会重新利用刚才T2事务所使用的回滚段。这时T1事务读到此处时，就会造成无法找到回滚段中修改前的数据，产生错误。

数据库一致性(Database Consistency)是指事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。

保证数据库一致性是指当事务完成时，必须使所有数据都具有一致的状态。在关系型数据库中，所有的规则必须应用到事务的修改上，以便维护所有数据的完整性。

保证数据库的一致性是数据库管理系统的一项功能.比如有两个表(员工/职位),员工表中有员工代码、姓名、职位代码等属性，职位表中有职位代码、职位名称、职位等级等属性。你在其中员工表中进行了插入 *** 作，你插入了一个新员工的信息，而这个新员工的职位是公司新创建的一个职位。如果没有一致性的保证，就会出现有这么一个员工，但是不知道他到底担当什么职责！这个只是它的一个小小方面。

读一致性也是数据库一致性的一个重要方面，在实际中，我们会遇到这种情况：我们对一个表中的某些数据进行了更新 *** 作，但是还没有进行提交，这时另外一个用户读取表中数据。这个时候就出现了读一致性的问题：到底是读什么时候的数据呢？是更新前的还是更新后的？在DBMS中设有临时表，它用来保存修改前的值，在没有进行提交前读取数据，会读取临时表中的数据，这样一来就保证了数据是一致的。(当前用户看到的是更新后的值)

但是还有一种情况：用户user1对表进行了更新 *** 作，用户user2在user1还没有进行提交前读表中数据，而且是大批量的读取(打个比方：耗时3分钟)而在这3分钟内user1进行了提交 *** 作，那又会产生什么影响呢？这个时候怎么保证读写一致性呢？这个时候DBMS就要保证有足够大的临时表来存放修改前的数值，以保证user2读取的数据是修改前的一致数据。然后下次再读取时候就是更新后的数据了。

个人认为：从逻辑上来说：当数据库存在没有结束的事务时，数据库就是不一致的。所以要保持数据库的一致性，就是要确保某一时刻没有事务在数据库上执行即可。例如一般说的数据库一致性备份，就需要在数据库关闭之后再进行。当然从物理存储结构考虑一致性的问题会比较复杂一些，因为涉及到很多文件的修改等问题，例如Oracle中的各类SCN的设置。总的来说，可以简单得认为：所有事务结束后数据库就是一致的。

所以说：数据库的一致性的前提是首先要保证事务的一致性。事务的一致性则需要通过并发控制、锁、隔离性等限制进行保证，具体工作机制可以参见前文，这里就不再研究了。

对于Oracle的一致性检测，只需在mount到open阶段，运行命令recover database即可，DBMS就可以把在线日子文件同步到数据库文件中去。这样Oracle数据库才能正常打开使用。

读完整性，撤销记录，事务

为了维护多版本数据一致性模型，当一个表的数据被更新（写）的同时也在被查询（读）时，Oracle必须创建一个维持读完整性的数据集。当更新发生时，被更新数据的原始值被记录在数据库的undo records中。在事务中的更新 *** 作没有被提交之前，用户查询正在被修改的记录时只能看到她们的原始值。Oracle结合SGA中以及撤销记录中的信息为查询表数据的用户构建了一个维持读完整性的视图[此视图非彼视图]。

当事务提交后，事务中对数据的修改才被永久记录。在用户事务提交后执行的语句九只能查询到提交后的数据了。

事务是Oracle实现读完整性的关键。事务是一组SQL语句（这组语句或者被一起提交，或者都不被提交），事务的作用是：决定了为查询用户生成的保持读完整性的视图的起始点

控制着被一个事务修改过的数据何时可以被数据库中其它进行读写 *** 作的事务看到

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10074864.html

Oracle数据库空间管理和规划

发表评论

评论列表（0条）