Oracle ASM

Oracle ASM,第1张

概述(一)ASM概述 提到Oracle ASM,相信大家都有熟悉又陌生的感觉,熟悉在于目前11g ARC数据库基本都使用ASM,陌生在于平时只是基本的使用,对ASM了解并不全面。例如数据库实例是如何与AS

(一)ASM概述

        提到Oracle ASM,相信大家都有熟悉又陌生的感觉,熟悉在于目前11g ARC数据库基本都使用ASM,陌生在于平时只是基本的使用,对ASM了解并不全面。例如数据库实例是如何与ASM交互与分工的、ASM存在哪些特性、数据库各种文件是怎样存放于ASM存储中、他的元数据是怎么存放的。

        Oracle 10g之前,存储设备的使用情况:UNIX/linux *** 作系统上安装逻辑卷管理器(LVM),通过LVM将多个磁盘做成卷组,在卷组上划分逻辑卷(logical volume),然后在逻辑卷上创建文件系统,RAC环境下需要第三方共享集群软件。Oracle 10g之后引入的专用文件系统ASM,为数据库文件的管理提供了很好的支持。DBA能够完全在Oracle框架内执行许多任务,利用ASM来将一组磁盘转换成一个可伸缩的和高性能的文件系统/卷管理器。ASM磁盘组提供了直接作为原始设备来访问这个空间,并提供文件系统的便利性和灵活性。

        ASM对DBA有许多好处,使用ASM可以避免:

 I/O性能优化 数据文件移动和重新组织文件名管理逻辑卷管理文件系统管理集群文件系统管理裸设备管理

使用ASM可以显著减少:

逻辑单元号(LUN)管理,逻辑单元数量较少,大小较大数据库管理员对系统管理员的依赖性手动执行任务时可能发生的错误

(二)RAC环境下的ASM结构

        RAC环境下的ASM结构如图:


                                                             图1. RAC环境下的ASM结构

ASM的出现是为RDBMS管理文件存储,ASM中适合存放的文件类型包括:数据文件(data file)、控制文件(control file)、重做日志文件(redo log file)、归档日志文件(archive log file)、闪回日志文件(flashback log file)、参数文件(spfile)、RMAN备份以及block tracking file、datapump文件。

ASM不会代替RDBMS去实施I/O读写,很多人对这一点存在误解,认为RDBMS发送I/O请求给ASM,ASM去执行I/O,这样的想法是错误的。ASM只负责将存储空间地址返回给RDBMS,真正的I/O还是会由RDBMS进程去完成,和不用ASM的裸设备一样,因此ASM不是I/O的中间层,也就不存在因为ASM而出现I/O瓶颈。

(三)ASM实例

        ASM实例的主要任务之一就是管理ASM Metadata元数据。ASM instance在10.2中使用与RDBMS一样的二进制软件,到11.2中分开独立实例,它类似于ORACLE RDBMS INSTANCE,有其SGA和大多数后台进程。

ASM Instance结构如下图:

 

 

                                                          图2.ASM Instance结构图

(1)ASM Instance中的内存结构主要包括4个部分:

Share Pool:用于元数据信息Large Pool:用于并行 *** 作ASM

       sql> show parameter large_pool_size

       name                            TYPE         VALUE

       ------------------------------- ----------- ------------------------------

       large_pool_size                 big integer  12M

ASM高速缓存:用于重新平衡 *** 作期间读取和写入块Free Memory:可用的未分配内存

(2)ASM的主要进程:

RBAL:在搜索过程中打开所有设备文件并协调重新平衡活动ARBn:一个或多个从属过程,用于执行重新平衡活动GMON:负责管理磁盘活动,例如删除或脱机以及提高ASM磁盘兼容性MARK:根据需要将ASM分配单元标记为过时

此外,ASM Instance还有一下进程:

ARCn:归档进程CKPT:检查点进程DBWn:数据库写进程DIAG:诊断进程Jnnn:作业队列进程LGWR:日志写进程,ASM实例的SGA不包含log buffer,该实例也不使用联机重做日志文件,ASM实例的LGWR进程将事件记录信息复制到ASM磁盘组。PMON:进程监视进程SMON:系统监视进程PSP0:进程衍生进程QMNn:队列监视进程RECO:恢复器进程VKTM:虚拟计时器进程

对于ASM实例,这些进程执行的任务与数据库实例中的不同。例如,ASM实例的SGA不包含日志缓冲区,该实例也不使用联机重做日志,ASM实例中的LGWR进程将事件记录信息复制到ASM磁盘。

如果ASM是以集群方式建立的,则将在ASM实例中运行与集群管理相关的附加进程。其中一些进程如下:

LMON:全局入队服务监视器进程LMDn:全局入队服务守护进程LMSn:全局高速缓存服务进程LCKn:锁定进程

(四)初始化参数

ASM由参数文件控制,通常设置的参数包括:

instance_type:对于asm实例来说,要设置成asm,对于数据库,则设置成RDBMSASM_POWER_liMITE:默认为1,表示ASM磁盘组在进行rebalance时的并行度,值从1到11,1最慢,该参数可动态修改alter system set asm_power_limit=5;ASM_disKSTRING:是一个与 *** 作系统有关的值,ASM使用它来限制搜索时考虑的磁盘集。默认为空字符串,表示ASM查找系统中所有ASM拥有读写权限的所有设备;ASM_disKGROUP:表示启动实例时,自动Mount那些磁盘组,可以写多个磁盘组MEMORY_TARGET:默认自动启动内存管理,即使未明确设置MEMORY_TARGET参数也是如此,该参数建议不小于1536M。

通常,这几个参数的值如下:

asm_diskgroups                                           string     

asm_diskstring                              string     

asm_power_limit                            integer     1

asm_preferred_read_failure_groups         string 

memory_target                              big integer  0

(五)数据库实例与ASM实例的交互

        例如,一个数据文件的创建,数据库实例与ASM实例是怎么交互分工来完成的?

 

                                                                 图3.数据库实例与ASM实例交互

文件创建过程如下:

1.用户在RDBMS发出create file命令,RDBMS会发起一个与ASM实例的连接,RDBMS端这个连接是ASMB后台进程,而ASM端则是个前台进程,接着,创建文件的指令通过这个链接提交给ASM实例;

2.ASM根据创建文件的指令,从磁盘中分配AU,ASM会根据指定的模板(template)或diskgroup默认的template来决定文件的冗余、条带策略;

3.AU分配完成后,ASM就把文件的Extent map发送给RDBMS;

4.RDBMS发起I/O *** 作,初始化(格式化)这个ASM文件;

5.初始化完成后,RDBMS向ASM发送commit请求,ASM把相应的allocation table、file directory、alias directory异步写回磁盘;

6.提交确认会隐式关闭该文件。将来发生I/O时,数据库实例需要重新打开该文件。

注意:用户在读写数据时,第4步不同,其它均相同

        经常有人问,数据库实例使用ASM作为存储,只需要在文件名中加上磁盘组名即可,而在数据库中没有ASM相关的静态配置,那么是怎么找到ASM磁盘组的?

其实ASM实例挂载磁盘组后,ASM会把diskgroup、asm instance name、oracle homepath等信息注册到CSS,当数据库实例打开或创建名字以“+”开头的文件时,它会通过CSS来查看disk group和mount该DG的ASM实例的信息,再通过CSS中这些信息构造connect string连接ASM实例的。

ASM概念图如下:

 

                图4.数据库逻辑结构与ASM物理结构的关系

(六)磁盘组、磁盘、AU、ASM文件、EXTENT MAP

(6.1)ASM磁盘组(ASM diskgroup)

一个disk Group由多个ASMdisk组成,该diskgroup空间使用信息的元数据均完整的包含在这个磁盘组中,通过v$asm_diskgroup视图查看磁盘组信息。

 sql> select * from v$asm_diskgroup;

GROUP_NUMBER    name        SECTOR_SIZE  BLOCK_SIZE  ALLOCATION_UNIT_SIZE   STATE        TYPE      TOTAL_MB    FREE_MB     ColD_USED_MB  USABLE_file_MB  VOTING_fileS
------------    ---------   -----------  ----------  --------------------   ----------   ------    ----------  ----------  ------------  --------------  ------------
           1    ARC         1024         4096        1048576                CONNECTED    EXTERN    204800       178612     26188         178612           N
           2    DATA        1024         4096        1048576                CONNECTED    EXTERN    2048000      1523261    524739        1523261          N
           3    OCRVote     1024         4096        1048576                MOUNTED      EXTERN    6144         5716       428           5716             Y

我们可以看到一共有3个DG,名字分别为ARC、DATA、OCRVote,磁盘组的Block Size大小为4096b(4kb),AU大小为1Mb,STATE状态有CONNECTED,说明数据库实例正在连接使用该DG;状态为MOUNTED,说明DG已经挂载,随时可以使用。TYPE类型显示为外部冗余,总容量和空闲容量在这也有显示。

磁盘组冗余有三种选择:

External Redundancy:没有Fialure Group,不提供任何镜像;normal Redundancy:至少要求2个Failure Group,默认支持双向镜像;High Redundancy:要求3个FailureGroup,默认支持三向镜像。

(6.2)ASM磁盘(ASM disk)

对于ASM而言LUN disk可以是裸设备也可以直接是块设备,可以通过v$asm_diskgroup来查看磁盘信息:

sql> select * from v$asm_disk;
 
GROUP_NUMBER  disK_NUMBER  MOUNT_STATUS  MODE_STATUS  liBRARY    OS_MB      TOTAL_MB  FREE_MB  name           FAILGROUP      PATH                VOTING_file  SECTOR_SIZE   FAILGROUP_TYPE
------------  -----------  ------------  -----------  -------    --------   --------  -------  -------------- ------------   ------------------  -----------  -----------   --------------
           3  0            CACHED        ONliNE       System     6144       6144      5716     OCRVote_0000   OCRVote_0000   /dev/rdisk/disk18   Y            1024          REGulAR
           1  0            CACHED        ONliNE       System     204800     204800    186864   ARC_0000       ARC_0000       /dev/rdisk/disk19   N            1024          REGulAR
           2  0            CACHED        ONliNE       System     1024000    1024000   761637   DATA_0000      DATA_0000      /dev/rdisk/disk20   N            1024          REGulAR
           2  1            CACHED        ONliNE       System     1024000    1024000   761624   DATA_0001      DATA_0001      /dev/rdisk/disk21   N            1024          REGulAR

我们可以看到ASMdisk,其中/dev/rdisk/disk19属于diskgroup1,/dev/rdisk/disk20和/dev/rdisk/disk21属于diskgroup2,/dev/rdisk/disk18属于diskgroup3。通过ASM磁盘信息,我们也可以看到磁盘的使用情况。

        创建ASM磁盘的方法主要有:ASMliB和UDEV。通常不建议使用ASMliB创建ASM磁盘,缺点有:

              1.对于多路径设备,需要配置ORACLEASM_SCAnorDER及ORACLEASM_SCANEXCLUDE;

              2.因为ASM Instance使用ASMliB提供的ASM disk,所以增加了额外的层面;

    3.不是每个版本的linux Kernel都支持ASMliB;

    4.使用ASMliB意味着要花费更多的时间去创建和维护。

(6.3)AU

        AU(allocation unit)是disk Group的分配单元,一个ASM磁盘上的可用空间总是整数倍个AU。在每一个ASM disk的头部均有一个表,该表的一个记录代表ASM disk的一个AU。

   在创建磁盘组时可以配置AU大小,AU默认大小为1MB,AU足够小,能够缓存数据库,但足够大,能够提供高效的访问。AU的大小可设置为:1,2,4,8,16,32或64MB。

(6.4)ASM文件

        ASM文件由一组分配单元(AU)组成,这些文件只属于某个磁盘组,不可跨越磁盘组,每个ASM文件都具有唯一的系统生成的名称,ASM文件的文件名以“+”号开头,如“+data/orcl/datafile/system.256.689832921”。如果在创建ASM文件时指定了文件的名称,如“+data/orcl/tbs01.dbf”,则该名称为ASM文件的别名,ASM会将该别名与实际创建的文件名称相关联。

   ASM中可以存放数据文件、日志文件、控制文件、归档日志文件等。

(6.5)区映射(EXTENT MAP)

区映射是ASM的Extent指针(pointer)给出了ASM disk Number和AU号,这就描述了该Extent的物理位置。

 

                          图5.ASM区映射

文件区与分配单元(AU)之间的关系如下所示。区包含:

1个AU用于前20000个区(0-19999)4 AUs用于接下来的20000个区(20000-39999)16 Aus用于40000以上的区

将可变大小的区与大型分配单元结合使用,可满足非常大的ASM存储文件的需要。

X$KFFXP是ASM自动存储管理特性的重要内部视图,该视图反应了file Extent Map映射关系。

(七) ASM故障组

    ASM怎么实现冗余,failure group采用同一份数据的多份拷贝,保证不会出现单点错误,冗余拷贝单位为Extent。多份冗余拷贝不会存在同一个failure group 的磁盘中,换句话说,一个failure group中只有一份拷贝的数据,不会有第二份。

   failure group又是什么概念呢?个人理解,failure group是diskgroup的一个子集,在创建diskgroup的时候,我们可以指定磁盘组的failure group的数量,如果不指定,则diskgroup中的每个磁盘都是一个failure group。对于冗余级别为external的diskgroup, 只保留一份数据,因此只需要有1个diskgroup即可,对于冗余级别为normal的diskgroup, 需要保留一份数据及其镜像,因此至少需要有2个diskgroup,对于冗余级别为high的diskgroup, 需要保留一份数据及两份镜像,因此至少需要有3个diskgroup。

以下示例,一个normal redundancy的diskgroup中存在8个disk,并使用2个failure group,可以看到每个failure group存一份数据。

 

                      图6.ASM normal Redundancy Extents分布图示

当disk H发生故障时,这个失败要求在失败磁盘上的所有的Extent均被修复,Extent3和Extent5会从现存的磁盘中复制到failure group 2中可用的区域。在此例子中,Extent 5被从disk A中复制到disk F,Extent3从disk拷贝到disk G,最后将失败的磁盘从diskgroup中drop出去。

 

                      图7.失效时的磁盘分配

(八)ASM磁盘数据rebalance

ASM怎么平衡组内磁盘的数据?Rebanlance将在diskgroup范围内将数据在disk上移动,以保证文件均匀分布在diskgroup上的各个磁盘中。一旦diskgroup发生了存储配置变化,如增加或删除磁盘,resize会自动出发一次rebanlance。power参数将决定有多少个slave进程参与数据移动。

以下示例Rebanlance。磁盘组diskgroup中有2个磁盘diskA和disk B,这时,我们再增加一个磁盘disk C,这时disk C并没有数据。在Rebanlance后,三个磁盘数据达到平衡。

                     图8.ASM磁盘数据rebanlance

 (九) ASM条带化

在ASM中,条带化主要有2个用途:

在磁盘组的所有磁盘中执行I/O负载平衡;改善I/O等待时间

ASM条带化一共有2种类型,粗粒度条带化和细粒度条带化。

(9.1)粗粒度条带化(主要用于平衡I/O)

        粗粒度条带化条带大小固定为AU大小,条带宽度固定为1。因此,粗粒度条带化在分配文件时,ASM会在所有磁盘中分布分配单元,有时无法非常平均,但随着时间的流逝,会变得几乎相等。下图显示了一个具有5个分配单元的文件,这些AU在条带化之后,分布在一个冗余级别为external的磁盘组中,该磁盘组一共有8个磁盘。

                         图8.粗粒度条带化

(9.2)细粒度条带化(主要用于改善等待时间)

   细粒度条带化极少使用,默认都是粗粒度。细粒度条带化条带大小为128KB(默认),AU大小为1MB(默认),条带宽度为8。细粒度条带化将数据区拆分为128KB的块,然后许多磁盘分布每个区的负载,从而改善特定文件类型的等待时间,默认情况下,细粒度条带化用于控制文件和联机重做日志文件。

 例子:具有8个磁盘构成的磁盘组,采用外部冗余的模式,AU大小为1MB,细粒度条带化条带大小为128KB,AU大小为1MB。第一个1MB区在8个AU中以128KB条带形式写入。因此,1MB数据分布在8个磁盘中,而不是1个磁盘中。

               图9.第一个1MB区在8个AU中以128KB条带形式写入

当第二个1MB区数据进来后,继续分配在每个磁盘AU的第2个128KB块中,这种模式一直继续,直到第1组AU写满,然后再分配下一组AU。

                      图9.第二个1MB区继续在8个AU中以128KB条带形式写入

(十)ASM常用视图

视图名称x$基表名描述
 V$ASM_disKGROUP X$KFGRP 实施磁盘发现disk discovery和列出磁盘组
 V$ASM_disKGROUP_STATX$KFGRP_STAT
 显示磁盘组状态
 V$ASM_disKX$KFDSK,X$KFKID
 实施磁盘发现disk discovery和列出磁盘以及磁盘的使用量
 V$ASM_disK_STATX$KFDSK_STAT,X$KFKID
 列出磁盘及度量信息
 V$ASM_fileX$KFFIL
 列出ASM文件,也包括了元数据信息
 V$ASM_AliASX$KFALS 列出ASM的别名,文件和目录
 V$ASM_TEMPLATEX$KFTMTA
 列出可用的模板及属性
 V$ASM_CLIENTX$KFNCL
列出连接到ASM实例的会话客户端
 V$ASM_OPERATIONX$KFGMG
列出rebalance重平衡 *** 作
 V$ASM_disK_IOSTATX$KFNSDSKIOSTI/O统计信息

 

 

【完】

 

 

注:本文整理自云和恩墨的线上讲座,原文:https://wenku.baIDu.com/vIEw/752e450fdc36a32d7375a417866fb84ae45cc391.HTML。感谢作者的分享。

总结

以上是内存溢出为你收集整理的Oracle ASM全部内容,希望文章能够帮你解决Oracle ASM所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1153904.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-01
下一篇 2022-06-01

发表评论

登录后才能评论

评论列表(0条)

保存