数据库运行中的故障主要有哪些？_sql

数据库运行过程中常见的故障有3类：事物故障、系统故障、介质故障。

恢复策略：

1、事物故障：

发生事务故障时，被迫中断的事务可能已对数据库进行丁修改，为了消除该事务对数据库的影响，要利用日志文件中所记载的信息，强行回滚该事务，将数据库恢复到修改前的初始状态。

为此，要检查日志文件中由这些事务所引起的发生变化的记录，取消这些没有完成的事务所做的一切改变，这类恢复 *** 作称为事务撤销。

2、系统故障：

系统故障的恢复要完成两方面的工作，既要撤销所有末完成的事务，还要重做所有已提交的事务，这样才能将数据库真正恢复到一致的状态。

3、介质故障：

介质故障比事务故障和系统故障发生的可能性要小，但这是最严重的一种故障，破坏性很大，磁盘上的物理数据和日志文件可能被破坏，这需要装入发生介质故障前最新的后备数据库副本，然后利用日志文件重做该副本后所运行的所有事务。

扩展资料：

“数据故障恢复”和“完整性约束”、“并发控制”一样，都是数据库数据保护机制中的一种完整性控制。所有的系统都免不了会发生故障，有可能是硬件失灵，有可能是软件系统崩溃，也有可能是其他外界的原因，比如断电等等。

数据库运行的突然中断会使数据库处在一个错误的状态，而且故障排除后没有办法让系统精确地从断点继续执行下去。这就要求DBMS要有一套故障后的数据恢复机构，保证数据库能够回复到一致的、正确地状态去。

参考资料来源：百度百科-事务故障

参考资料来源：百度百科-系统故障

参考资料来源：百度百科-介质故障

可以分为三类：

1.事务故障

2.系统故障

3.介质故障

事务故障：事务故障是由于程序执行错误而引起事务非预期的、异常终止的故障。它发生在单个事务的局部范围内，实际上就是程序的故障。有的事务故障可以通过事务程序本身发现。

系统故障：若系统在运行过程中，由于某种原因，造成系统停止运行，以致事务在执行过程中以非正常的方式终止，这是内存中的信息丢失，而存储在外存上的数据未受影响，这种情况称为系统故障。

介质故障：介质故障是指外存储设备故障，主要有磁盘损坏，磁头碰撞盘面，突然的强磁场干扰，数据传输部件出错，磁盘控制器出错等。

新增archives 时的状况：

条件和假设：自上次镜像备份以来已经生成新的archive log(s)Archivelog Mode有同步的datafile(s) 和control file(s) 的镜像（冷）拷贝；archive log(s) 可用。

恢复步骤：

1. 如果数据库尚未关闭，则首先把它关闭： $ svrmgrl svrmgrl>connect internal

svrmgrl>shutdown abort

2. 将备份文件抄送回原始地点：所有Database Files

所有Control Files（没有archive(s) 或redo(s) 的情况下，control files 的更新无任何意义）

所有On-Line Redo Logs (Not archives) init.ora file（选项）

3. 启动数据库： $ svrmgrl

svrmgrl>connect internal

svrmgrl>startup

数据文件, 重作日志和控制文件同时丢失或损坏：

条件和假设：Archivelog Mode有同步的所有所失文件的镜像（冷）拷贝；archive log(s) 可用

恢复步骤（必须采用不完全恢复的手法）：

1. 如果数据库尚未关闭，则首先把它关闭： $ svrmgrl svrmgrl>connect internal

svrmgrl>shutdown abort

2. 将备份文件抄送回原始地点：

所有Database Files

所有Control Files

所有On-Line Redo Logs(Not archives)

init.ora file（选项）

3. 启动数据库然而并不打开：

svrmgrl>startup mount

4. 做不完全数据库恢复，应用所有从上次镜像（冷）备份始积累起来的archives：

svrmgrl>recover database until cancel using backup controlfile

......

cancel

5. Reset the logfiles （对启动而言不可省略）：

svrmgrl>alter database open resetlogs

6. 关闭数据库并做一次全库冷备份。

数据文件和控制文件同时丢失或损坏：

条件和假设：Archivelog Mode有同步的datafile(s) 和control file(s) 的冷拷贝；archive log(s) 可用

恢复步骤：

1. 将冷拷贝的datafiles(s) 和control file(s) 抄送回原始地点:

$ cp /backup/good_one.dbf /orig_loc/bad_one.dbf

$ cp /backup/control1.ctl /disk1/control1.ctl

2. 以mount 选项启动数据库：

$ svrmgrl

svrmgrl>connect internal

svrmgrl>startup mount

3. 以旧的control file 来恢复数据库：

svrmgrl>recover database until cancel using backup controlfile

*** 介质恢复完成

（须在应用完最后一个archive log 后cancel ）

4. Reset the logfiles （对启动而言不可省略）：

svrmgrl>alter database open resetlogs

重作日志和控制文件同时丢失或损坏时：

条件和假设：Control Files 全部丢失或损坏；Archivelog Mode有Control Files 的镜像（冷）拷贝

恢复步骤：

1. 如果数据库尚未关闭，则首先把它关闭：

$ svrmgrl

svrmgrl>connect internal

svrmgrl>shutdown abort

svrmgrl>exit

2. 以Control File 的镜像（冷）拷贝覆盖损坏了的Control File:

$ cp /backup/control1.ctl /disk1/control1.ctl

3. 启动数据库然而并不打开：

$ svrmgrl

svrmgrl>connect internal

svrmgrl>startup mount

4. Drop 坏掉的redo log （排除硬件故障）：

svrmgrl>alter database drop logfile group 2

5. 重新创建redo log:

svrmgrl>alter database add logfile group 2 '/orig_loc/log2.dbf' size 10M

6. 以旧的control file 来恢复数据库：

svrmgrl>recover database until cancel using backup controlfile

（必须马上cancel ）

7. Reset the logfiles （对启动而言不可省略）：

svrmgrl>alter database open resetlogs

8. 关闭数据库并做一次全库冷备份

只发生归档重作日志丢失或损坏时：

根据不同环境和情况，选择下述手段之一：

a. 马上backup 全部datafiles （如果系统采用一般热备份或RMAN 热备份）

b. 马上正常关闭数据库并进行冷备份（如果系统采用冷备份）

c. 冒险前进！不做备份而让数据库接着跑，直等到下一个备份周期再做备份。这是在赌数据库在下一个备份周期到来之前不会有需要恢复的错误发生。

注意:冒险前进的选择：如果发生错误而需要数据库恢复，则最多只能恢复到出问题archive log 之前的 *** 作现场。从另一个角度讲，archive log(s) 出现问题时，数据库若不需要恢复则其本身并没有任何问题。

Oracle逻辑结构故障的处理方法：

逻辑结构的故障一般指由于人为的误 *** 作而导致重要数据丢失的情况。在这种情况下数据库物理结构是完整的也是一致的。对于这种情况采取对原来数据库的全恢复是不合适的，我们一般采用三种方法来恢复用户数据。

采用exp/imp工具来恢复用户数据：

如果丢失的数据存在一个以前用exp命令的备份，则可以才用这种方式。

1. 在数据库内创建一个临时用户：

svrmgrl>create user test_user identified by test

svrmgrl>grant connect，resource to test_user

2. 从以前exp命令备份的文件中把丢失数据的表按照用户方式倒入测试用户：

$imp system/manager file=export_file_name tables=(lost_data_table_name…) fromuser=lost_data_table_owner touser=test_user constraint=n

3. 用相应的DML语句将丢失的数据从测试用户恢复到原用户。

4. 将测试用户删除：

svrmgrl>drop user test_user cascede

采用logminer来恢复用户数据：

Logminer是oracle提供的一个日志分析工具。它可以根据数据字典对在线联机日志、归档日志进行分析，从而可以获得数据库的各种DML *** 作的历史记录以及各种DML *** 作的回退信息。根据这些用户就可以将由于误 *** 作而丢失的数据重新加入数据库内。

1. 确认数据库的utl_file_dir参数已经设置，如果没有则需要把这个参数加入oracle的初始化参数文件，然后重新启动数据库。下面例子中假设utl_file_dir=’/opt/oracle/db01’；

2. 创建logminer所需要的数据字典信息，假设生成的数据字典文本文件为dict.ora：

svrmgrl>execute dbms_logmnr_d.build(dictionary_filename=>'dict.ora'， dictionary_location=>'/opt/oracle/db01’)

3. 确定所需要分析的日志或者归档日志的范围。这可以根据用户误 *** 作的时间来确定大概的日志范围。假设用户误 *** 作时可能的日志文件为/opt/oracle/db02/oradata/ORCL/redo3.log和归档日志’/opt/oracle/arch/orcl/orclarc_1_113.ora’。

4. 创建要分析的日志文件列表，按日志文件的先后顺序依次加入：

svrmgrl>execute dbms_logmnr.add_logfile(logfilename=>’/opt/oracle/arch/orcl/orclarc_1_113.ora’，options=>dbms_logmnr.NEW)

svrmgrl>execute dbms_logmnr.add_logfile(logfilename=>’ /opt/oracle/db02/oradata/ORCL/redo3.log’，options=>dbms_logmnr.ADDFILE)

5. 开始日志分析，假设需要分析的时间在’2003-06-28 12:00:00’和’2003-06-28 13:00:00’之间：

svrmgrl>execute dbms_logmnr.start_logmnr(dictfilename=>’ /opt/oracle/db01/dict.ora’，starttime=>to_date(’ 2003-06-28 12:00:00’，’YYYY-MM-DD HH:MI:SS’)，endtime=>to_date(to_date(‘2003-06-28 13:00:00’，’YYYY-MM-DD HH:MI:SS’))

6. 获取分析结果：

svrmgrl>select operation，sql_redo，sql_undo from v$logmnr_contents

7. 根据分析结果修复数据。

8.结束logmnr:

svrmgrl>dbms_logmnr.end_logmnr

9. 用适当的方法对原数据库进行数据库全备份。

利用备份恢复用户数据：

采用这种方法时并不是在原数据库进行恢复，而是利用数据库备份在新的机器上重新建立一个新的数据库。通过备份恢复在新机器上将数据库恢复到用户误 *** 作前，这样就可以获得丢失的数据将其恢复到原数据库。

1. 在新的机器上安装数据库软件。

2. 对于采用带库备份的现场，需要在新的数据库服务器上安装调试相应的备份管软件。

3. 根据用户误 *** 作的时间点进行基于时间点的数据库恢复 *** 作。对于没有采用带库备份的现场，可以选取用户误 *** 作前最近的备份磁带进行恢复；对于才用带库备份的点可以通过基于时间恢复点恢复的rman脚本来进行恢复。

4.重新打开数据库：

svrmgrl>alter database open resetlogs

5. 从新的数据库中获取丢失的用户数据，通过DML *** 作将其恢复到原数据库中。

6. 用适当的方法对原数据库进行数据库全备份。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9952456.html

数据库运行中的故障主要有哪些？

发表评论

评论列表（0条）