ORA-03113错误分析

ORA-03113错误分析,第1张

前言 每一个DBA在进行数据库管理的过程中不可避免的要遇到形形 的错误(ORA xxxx) 有些错误由于频繁出现 原因复杂而被DBA们戏称之为 经典的错误 其中ORA end of fileon munication channel 就是这样的一个 我们可以简单的把这个错误理解为Oracle客户端进程和数据库后台进程连接中断 不过 导致这个错误的原因实际上有很多种 对数据库设置不当 任何能导致数据库后台进程崩溃的行为都可能产生这个错误 这个错误的出现还经常伴随着其它错误 比如说 ORA ORACLE not available 此外 该错误出现的场景复杂 可能出现在: 启动的Oracle的时侯; 试图创建数据库的时侯; 试图对数据库进行连接的时侯; 在客户端正在运行SQL/PL/SQL的时侯; 备份/恢复数据库的时侯; 其它一些情况下......在论坛上也时常可以看到初级DBA对这个问题的求救 在这里简单的对该问题进行一下整理 不当之处 请多指教! 错误原因种种 根据网络上大家反映的情况来看 错误原因大约有这些: Unix核心参数设置不当 Oracle执行文件权限不正确/环境变量问题 客户端通信不能正确处理 数据库服务器崩溃/ *** 作系统崩溃/进程被kill Oracle 内部错误 特定SQL PL/SQL引起的错误 空间不够 防火墙的问题 其它原因在开始解决问题之前 作如下几件事情: 回忆一下在出现错误之前你都做了什么 *** 作 越详细越好; 查看background_dump_dest目录中的alertSID log文件也是你要做的事情; Google一下 在互联网上有很多信息等着你去发现 不要什么都问别人 当然 如果你找到了一些对你非常有帮助的东西――这篇文档就不用看了 别耽误你的时间 呵呵 Unix核心参数设置不当/ init参数设置不当 如果数据库在安装过程中没有设定正确的 *** 作系统核心变量 可能在安装数据库文件的时侯没甚么问题 在创建数据库的时侯常常会出现 错误 和此有关的另一个原因是init ora参数文件中的processes参数指定了不合理的值 启动数据库导致错误出现(当然这个归根到底也是核心参数的问题) 这个错误信息一般如下 ORA : end of file on munication channelORA : ORACLE not availableORA : shared memory realm does not exist解决办法有两个 修改核心参数 加大相应核心参数的值(推荐); 减小init ora参数的Processes的值 需要注意的是 SEMMSL必须设定为至少要 + 进程数的最大值 SEMMNS 也依赖于每个数据库上的进程参数值 注 这个错误类型只在Unix平台上出现 在Windows上如果processes的值过大 则会出现 ORA : invalid value for parameter max_rollback_segments must bebeeen and / 此时指定的参数值超过了 /或者ORA : out of memory / 小于 的一个大参数值 /我的软件环境 Windows Version Service Pack CPU type ORACLE RDBMS Version: 在特定平台上更改核心参数可能会有差别 请参考Oracle Technet()上的安装文档 对特定Unix平台的安装文档也有对核心参数意义的解释 Init ora中的参数如果设置不当 会产生该错误 有经验表明:shared_pool_size设置过小会出现错误 此外timed_statistics=true的设置也会带来问题 Oracle执行文件权限不正确/环境变量问题 这个问题只出现在Unix平台上 常见情况是有的时侯管理员为了方便而使用Unix的tar命令处理过的压缩包进行的安装 或者是系统管理员指定了额外的OS用户也可以管理数据库却没有指定正确的环境变量 Oracle执行文件在$ORACLE_HOME/bin目录下 如果出现问题 应该用如下Unix类似命令来纠正 chmod $ORACLE_HOME/bin/oracle有的时侯要对Oracle进行relink *** 作 在Unix上通过cp拷贝安装的时候 常常会出现环境变量的问题 和个别执行程序连接问题 LD_LIBRARY_PATH如果设置的不正确会导致问题 在这种情况下 需要对Oracle进行relink 如果可执行文件oralcle被破坏 也要对其relink 如果安装了并行服务器选项而Distributed Lock Manager没有安装或正确运行也会导致错误 客户端通信不能正确处理 SQLNet驱动器的问题 如果使用的版本比较低的驱动器 请更换到新版本的驱动 SQLNet的驱动没有连接到Oracle可执行文件会导致错误 检查网络是否通畅 Windows平台的常见问题:在Windows平台创建数据库的时侯 如果出现该问题可以考虑用如下的方法 首先检查本地网络设置 查看网络上是否有同名的结点或有冲突的IP 如果问题依旧 可以保守的用下面的方法 禁用网卡 将本地连接状态改为禁用; 将sqlnet ora文件打开(以记事本形式)将nts验证注释掉 #SQLNET AUTHENTICATION_SERVICES= (NTS) 创建数据库; 创建成功后 恢复本地连接 数据库服务器崩溃/ *** 作系统崩溃/进程被Kill 在连接过程中 如果Oracle数据库的服务器崩溃或者数据库所在的 *** 作系统崩溃 就会出现这个错误 Oracle Server崩溃的原因可能因为主要后台进程死掉 被错误的进行了Kill *** 作 如果是这个原因还是比较容易解决的 此外 和OS有关的应用程序存在内存泄漏(或者有病毒)的时侯也会导致Oracle后台程序问题 推荐排错办法: 查看应用软件相关进程是否正常运行; 查看有无内存泄漏; 查杀病毒; 确定系统管理员没有进行误 *** 作; 确定无黑客入侵行为 其它不确定因素...... Oracle 内部错误/ Bug 如果查看background_dump_dest目录中的alert log发现有无ora 等错误 可以到Metalink站点上查看具体信息及其解决方案 一般情况下要打软件补丁 特定SQL PL/SQL引起的错误尝试把SQL进行分开执行 也可以用SQL_TRACE来进行跟踪 找到导致问题的SQL语句 在SQLPlus下 ALTER SESSION SET SQL_TRACE TRUE;SQL语句中的非法字符和不合理的处理结果偶尔会带来问题 系统空间不够 任何时侯都要确保数据库系统有足够的空间 如果 USER_DUMP_DEST和BACKGROUND_DUMP_DEST没有剩余空间的话 会导致此问题 此外 如果打开了审计 AUDIT目录要由足够的空间 如果激活了Trace的话 Trace目录要由足够的空间 Dave Wotton的文档表明 在对表进行插入数据的时侯 如果文件超过了 G(而文件系统有 G限制) 会导致该问题 防火墙的问题 如果数据要通过防火墙 请联系系统管理员 询问是否对数据库数据进行了过滤或者是突然禁止了通行端口 如本地安装有个人防火墙 请检查本地设置 其它方面说明 导致这个错误的原因有很多种 上面列到的只是一些典型情况 经常去一些数据库技术论坛可能会有帮助 比如说ITPUB() C NOUG()等 lishixinzhi/Article/program/Oracle/201311/17658

如何连接oracle数据库及故障解决办法
如何配置才能使客户端连到数据库:
要使一个客户端机器能连接oracle数据库,需要在客户端机器上安装oracle的客户端软件,唯一的例外就是java连接数据库的时候,可以用jdbc thin模式,不用装oracle的客户端软件。加入你在机器上装了oracle数据库,就不需要在单独在该机器上安装oracle客户端了,因为装oracle数据库的时候会自动安装oracle客户端。
用过sql server数据库然后又用oracle的新手可能会有这样的疑问:问什么我用sql server的时候不用装sql server的客户端呢?原因很简单,sql server也是microsoft的,它在 *** 作系统中集成了sql server客户端,如果microsoft与oracle有协议,将oracle客户端也集成到 *** 作系统中,那我们也就不用在客户端机器装oracle客户端软机就可访问数据库了,不过,这好像是不可能实现的事情。
也有的人会问:为什么在sql server中没有侦听端口一说,而在oracle中要配置侦听端口?其实sql server中也有侦听端口,只不过microsoft将侦听端口固定为1433,不允许你随便改动,这样给你一个错觉感觉sql server中没有侦听端口,咳,microsoft把太多的东西都封装到黑盒子里,方便使用的同时也带来的需要副作用。而oracle中的侦听端口直接在配置文件中,允许随便改动,只不过无论怎样改动,要与oracle服务器端设置的侦听端口一致。
好,言归正传,我们如何做才能使客户端机器连接到oracle数据库呢?
A. 安装相关软件
B. 进行适当的配置
A.在适当的位置安装适当的软件:
在客户端机器:
1.在客户端机器上安装ORACLE的Oracle Net通讯软件,它包含在oracle的客户端软件中。
2.正确配置了sqlnetora文件:
NAMESDIRECTORY_PATH = (TNSNAMES, …)
NAMESDEFAULT_DOMAIN=DB_DOMAIN
一般情况下我们不用NAMESDEFAULT_DOMAIN参数。如果想不用该参数用#注释掉或将该参数删除即可,对于NAMESDIRECTORY_PATH参数采用缺省值即可,对于NAMESDEFAULT_DOMAIN参数有时需要注释掉,在下面有详细解释。
3.正确配置了tnsnameora文件
在服务器端机器:
1.保证listener已经启动
2.保证数据库已经启动。
如果数据库没有启动,用:
Oracle 9i:
dos>sqlplus “/ as sysdba”
sqlplus> startup
Oracle 8i:
dos>svrmgrl
svrmgrl>connect internal
svrmgrl>startup
命令启动数据库
如果listener没有启动,用:
lsnrctl start [listener name]
lsnrctl status [listener name]
命令启动listener
B.进行适当的配置
如何正确配置tnsnameora文件:
可以在客户端机器上使用oracle Net Configuration Assistant或oracle Net Manager图形配置工具对客户端进行配置,该配置工具实际上修改tnsnamesora文件。所以我们可以直接修改tnsnamesora文件,下面以直接修改tnsnamesora文件为例:
该文件的位置为: …\network\admin\tnsnamesora (for windows)
…/network/admin/tnsnamesora (for unix)
此处,假设服务器名为testserver,服务名为orcltestservercom,使用的侦听端口为1521,则tnsnamsora文件中的一个test网络服务名(数据库别名)为:
test =
(DESCRIPTION=
(ADDRESS_LIST=
(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))
)
(CONNECT_DATA=(SERVICE_NAME=orcltestservercom)
)
)
此处的笑脸为)。
红色的内容为需要根据实际情况修改的内容,现解释如下:
PROTOCOL:客户端与服务器端通讯的协议,一般为TCP,该内容一般不用改。
HOST:数据库侦听所在的机器的机器名或IP地址,数据库侦听一般与数据库在同一个机器上,所以当我说数据库侦听所在的机器一般也是指数据库所在的机器。在UNIX或WINDOWS下,可以通过在数据库侦听所在的机器的命令提示符下使用hostname命令得到机器名,或通过ipconfig(for WINDOWS) or ifconfig(for UNIX)命令得到IP地址。需要注意的是,不管用机器名或IP地址,在客户端一定要用ping命令ping通数据库侦听所在的机器的机器名,否则需要在hosts文件中加入数据库侦听所在的机器的机器名的解析。
PORT:数据库侦听正在侦听的端口,可以察看服务器端的listenerora文件或在数据库侦听所在的机器的命令提示符下通过lnsrctl status [listener name]命令察看。此处Port的值一定要与数据库侦听正在侦听的端口一样。
SERVICE_NAME:在服务器端,用system用户登陆后,sqlplus> show parameter service_name命令察看。
如何利用配置的网络服务名连接到数据库:
用sqlplus程序通过test网络服务名进行测试,如sqlplus system/manager@test。如果不能连接到数据库,则在tnsnameora文件中的test网络服务名(net service)后面加上sqlnetora文件中NAMESDEFAULT_DOMAIN参数的值,此处我的参数值为testservercom,将其加到网络服务名后面,修改后的tnsnameora中关于该网络服务名的内容为:
什么情况下会引起oracle自动设置NAMESDEFAULT_DOMAIN参数?
出现这种情况的典型环境为windows的客户端的‘我得电脑à属性à计算机名à更改à其它…à此计算机的主DNS后缀’中设置了‘primary dns suffix’,因为在这种情况下安装客户端时,会在sqlnetora文件中自动设置NAMESDEFAULT_DOMAIN参数,或许当把计算机加入域中安装oracle客户端时也会出现这种情况,有条件的话大家可以试一下。
我在设置oracle的客户端时一般手工修改tnsnamesora文件,但是还有许多人喜欢用图形工具配置,该图形工具最终还是修改tnsnamesora文件,但是它有时会引起其它的问题:
在用oracle的图形配置软件'net assistant'或‘Net Configuration Assistant’配置网络服务名时,假如已经设置了‘primary dns suffix’,但是在图形配置软件中写的网络服务名的名字中没有‘primary dns suffix’,如只是写了test,则图形配置软件会自动在后面加上‘primary dns suffix’,使之变为testtestservercom,并存在tnsnamesora中,而不管你的sqlnetora文件中是否有NAMESDEFAULT_DOMAIN参数。此时,用图形工具进行测试连接是通过的,但是假如此时sqlnetora文件中没有NAMESDEFAULT_DOMAIN参数,则你在使用网络服务名时应该使用在tnsnamesora中的testtestservercom,而不是你在图形配置软件中键入的test。解决的办法为:
<1>可以在sqlnetora文件中设置NAMESDEFAULT_DOMAIN= testservercom,这时你可以用test或testtestservercom连接数据库
<2>在sqlnetora文件中不设置NAMESDEFAULT_DOMAIN参数,在tnsnamesora文件中将testtestservercom中的testservercom去掉,这时你可以用test连接数据库。
关于为什们在网络服务名后面加db_domain参数,需要了解sqlplus连接数据库的原理,我在后面解决12154常见故障中给出了详细的说明。
如果上面的招数还不奏效的话,只好用一下乾坤大挪移了。
将客户端的网络服务名部分
testtestservercom =
(DESCRIPTION=
(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))
)
(CONNECT_DATA=(SERVICE_NAME=orcltestservercom)
)
)
此处的笑脸为)。
拷贝到服务器的tnsnamesora文件中。然后再服务器端用sqlplus system/manager@testtestservercom连接到数据库。
如果能连接成功,说明你的客户端与服务器端的网络有问题。
如果连接不成功,用前面的部分检查网络服务名部分部分是否正确,如果确信网络服务名部分正确而且所有的客户端都连不上数据库则可能为系统TCP/IP或Oracle系统有问题,建议重新安装数据库。
常见故障解决办法:
TNS-12154 (ORA-12154):TNS:could not resolve service name
该错误表示用于连接的网络服务名在tnsnamesora文件中不存在,如上面的tnsnamesora中的网络服务名只有test,假如用户在连接时用sqlplus system/manager@test1则就会给出TNS-12154错误。
要注意的是,有时即使在tnsnamesora文件中有相应的网络服务名,可是用该网络服务名连接时还会出错,出现这种情况的典型配置如下(在客户端的机器上):
sqlnetora文件:
NAMESDIRECTORY_PATH = (TNSNAMES, …)
NAMESDEFAULT_DOMAIN = servercom
tnsnamesora文件:
test =
(DESCRIPTION=
(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))
)
(CONNECT_DATA=(SERVICE_NAME=orcltestservercom)
)
)
此处的笑脸为)。
sqlplus运行基本机理:
在用户输入sqlplus system/manager@test后,sqlplus程序会自动到sqlnetora文件中找NAMESDEFAULT_DOMAIN参数,假如该参数存在,则将该参数中的值取出,加到网络服务名的后面,即此例中你的输入由sqlplus system/manager@test自动变为sqlplus system/manager@testservercom ,然后再到tnsnamesora文件中找testservercom网络服务名,这当然找不到了,因为该文件中只有test网络服务名,所以报错。解决的办法就是将sqlnetora文件中的NAMESDEFAULT_DOMAIN参数注释掉即可,如#NAMESDEFAULT_DOMAIN = servercom。假如NAMESDEFAULT_DOMAIN参数不存在,则sqlplus程序会直接到tnsnamesora文件中找test网络服务名,然后取出其中的host,port,tcp,service_name,利用这些信息将连接请求发送到正确的数据库服务器上。
另外原则上tnsnamesora中的配置不区分大小写,但是我的确遇到区分大小写的情况,所以最好将使用的网络服务与tnsnamesora中配置的完全一样。
ORA-12514: TNS:listener could not resolve SERVICE_NAME given in connect Descriptor
该错误表示能在tnsnamesora中找到网络服务名,但是在tnsnamesora中指定的SERVICE_NAME与服务器端的SERVICE_NAME不一致。解决的办法是修改tnsnamesora中的SERVICE_NAME。
易混淆术语介绍:
Db_name:对一个数据库(Oracle database)的唯一标识,该数据库为第一章讲到的Oracle database。这种表示对于单个数据库是足够的,但是随着由多个数据库构成的分布式数据库的普及,这种命令数据库的方法给数据库的管理造成一定的负担,因为各个数据库的名字可能一样,造成管理上的混乱。为了解决这种情况,引入了Db_domain参数,这样在数据库的标识是由Db_name和Db_domain两个参数共同决定的,避免了因为数据库重名而造成管理上的混乱。这类似于互连网上的机器名的管理。我们将Db_name和Db_domain两个参数用’’连接起来,表示一个数据库,并将该数据库的名称称为Global_name,即它扩展了Db_name。Db_name参数只能由字母、数字、’_’、’#’、’$’组成,而且最多8个字符。
Db_domain:定义一个数据库所在的域,该域的命名同互联网的’域’没有任何关系,只是数据库管理员为了更好的管理分布式数据库而根据实际情况决定的。当然为了管理方便,可以将其等于互联网的域。
Global_name:对一个数据库(Oracle database)的唯一标识,oracle建议用此种方法命令数据库。该值是在创建数据库是决定的,缺省值为Db_name Db_domain。在以后对参数文件中Db_name与Db_domain参数的任何修改不影响Global_name的值,如果要修改Global_name,只能用ALTER DATABASE RENAME GLOBAL_NAME TO <db_namedb_domain>命令进行修改,然后修改相应参数。
Service_name:该参数是oracle8i新引进的。在8i以前,我们用SID来表示标识数据库的一个实例,但是在Oracle的并行环境中,一个数据库对应多个实例,这样就需要多个网络服务名,设置繁琐。为了方便并行环境中的设置,引进了Service_name参数,该参数对应一个数据库,而不是一个实例,而且该参数有许多其它的好处。该参数的缺省值为Db_name Db_domain,即等于Global_name。一个数据库可以对应多个Service_name,以便实现更灵活的配置。该参数与SID没有直接关系,即不必Service name 必须与SID一样。
Net service name:网络服务名,又可以称为数据库别名(database alias)。是客户端程序访问数据库时所需要,屏蔽了客户端如何连接到服务器端的细节,实现了数据库的位置透明的特性。

ORACLE表空间错误现象:
在启动数据库时出现ORA-01157,ORA-01110或 *** 作系统级错
误例如ORA-07360,在关闭数据库(使用shutdown normal或shutdown immediate) 时将导致错误ORA-01116,ORA-01110以及 *** 作系统级错误ORA-07368
解决:
以下有两种解决方案:
方案一、用户的表空间可以被轻易地重建
导出的对象是可用的或表空间中的对象可以被轻易地重建等。在这种情况下,最简单的方法是offline并删除该数据文件,删除表空间并重建表空间以及所有的对象。
svrmgrl> startup mount
svrmgrl> alter database datafile filename offline drop;
svrmgrl> alter database open;
svrmgrl> drop tablespace tablespace_name including contents;
重建表空间及所有对象。
方案二、用户的表空间不能够被轻易地重建
在大多数情况下,重建表空间是不可能及太辛苦的工作方法是倒备份及做介质恢复如果您的系统运行在NOARCHIVELOG模式下,则只有丢失的数据,在online redo log中方可被恢复。
步骤如下:
1)Restore the lost datafile from a backup
2)svrmgrl> startup mount
3)svrmgrl> select v1group#,member,sequence#,first_change# from v$log v1,v$logfile v2 where v1group#=v2group#;
4)如果数据库运行在NOARCHIVELOG模式下则:svrmgrl> select file#,change# from v$recover_file;
如果 CHANGE# 大于最小的FIRST_CHANGE#则数据文件可以被恢复。
如果 CHANGE# 小于最小的FIRST_CHANGE#则数据文件不可恢复。恢复最近一次的全备份或采用方案一。
5)svrmgrl> recover datafile filename;
6)确认恢复成功
7)svrmgrl> alter database open resetlogs;
只读表空间无需做介质恢复,只要将备份恢复即可。唯一的例外是:
表空间在最后一次备份后被改为read-write 模式
表空间在最后一次备份后被改为read-only 模式
在这种情况下,均需进行介质恢复。 有三种种情况:
1、数据库已经完全关闭(使用shutdown immediate或shutdown命令)
1) 确认数据库完全关闭
2) 修改initora文件,注释"rollback-segment"
3) svrmgrl> startup restrict mount
4) svrmgrl> alter database datafile filename offline drop;
5) svrmgrl> alter database open;
基于出现的结果:"statement PRocessed" 转(7);"ORA-00604,ORA-00376,ORA-01110"转(6)
6) svrmgrl> shutdown immediate
修改initora文件,增加如下一行:_corrupted_rollback_segments = (<roll1>,<rolln>)
svrmgrl> startup restrict
7) svrmgrl> drop tablespace tablespace_name including contents;
8) 重建表空间及回滚段
9) svrmgrl> alter system disable restricted session;
10) 修改initora文件
2、数据库未完全关闭(数据库崩溃或使用shutdown abort命令关闭数据库)
1) 恢复备份
2) svrmgrl> startup mount
3) svrmgrl> select file#,name,status from v$datafile;
svrmgrl> alter database datafile filename online;
4) svrmgrl> select v1group#,member,sequence#,first_change# from v$log v1,v$logfile v2 where v1group#=v2group#;
5) svrmgrl> select file#,change# from v$recover_file; #参见方案2-4
6) svrmgrl> recover datafile filename;
7) svrmgrl> alter database open;
3、数据库处于打开状态
1) 删除回滚段和表空间
2) 重建表空间和回滚段


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13371157.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-23
下一篇 2023-07-23

发表评论

登录后才能评论

评论列表(0条)

保存