如何处理数据库并发问题_工具

想要知道如何处理数据并发，自然需要先了解数据并发。

什么是数据并发 *** 作呢？

就是同一时间内，不同的线程同时对一条数据进行读写 *** 作。

在互联网时代，一个系统常常有很多人在使用，因此就可能出现高并发的现象，也就是不同的用户同时对一条数据进行 *** 作，如果没有有效的处理，自然就会出现数据的异常。而最常见的一种数据并发的场景就是电商中的秒杀，成千上万个用户对在极端的时间内，抢购一个商品。针对这种场景，商品的库存就是一个需要控制的数据，而多个用户对在同一时间对库存进行重写，一个不小心就可能出现超卖的情况。

针对这种情况，我们如何有效的处理数据并发呢？

第一种方案、数据库锁

从锁的基本属性来说，可以分为两种：一种是共享锁（S），一种是排它锁（X）。在MySQL的数据库中，是有四种隔离级别的，会在读写的时候，自动的使用这两种锁，防止数据出现混乱。

这四种隔离级别分别是：

读未提交（Read Uncommitted）

读提交（Read Committed）

可重复读（Repeated Read）

串行化（Serializable）

当然，不同的隔离级别，效率也是不同的，对于数据的一致性保证也就有不同的结果。而这些可能出现的又有哪些呢？

脏读（dirty read）

当事务与事务之间没有任何隔离的时候，就可能会出现脏读。例如：商家想看看所有的订单有哪些，这时，用户A提交了一个订单，但事务还没提交，商家却看到了这个订单。而这时就会出现一种问题，当商家去 *** 作这个订单时，可能用户A的订单由于部分问题，导致数据回滚，事务没有提交，这时商家的 *** 作就会失去目标。

不可重复读（unrepeatable read）

一个事务中，两次读 *** 作出来的同一条数据值不同，就是不可重复读。

例如：我们有一个事务A，需要去查询一下商品库存，然后做扣减，这时，事务B *** 作了这个商品，扣减了一部分库存，当事务A再次去查询商品库存的时候，发现这一次的结果和上次不同了，这就是不可重复读。

幻读（phantom problem）

一个事务中，两次读 *** 作出来的结果集不同，就是幻读。

例如：一个事务A，去查询现在已经支付的订单有哪些，得到了一个结果集。这时，事务B新提交了一个订单，当事务A再次去查询时，就会出现，两次得到的结果集不同的情况，也就是幻读了。

那针对这些结果，不同的隔离级别可以干什么呢？

“读未提（Read Uncommitted）”能预防啥？啥都预防不了。

“读提交（Read Committed）”能预防啥？使用“快照读（Snapshot Read）”方式，避免“脏读”，但是可能出现“不可重复读”和“幻读”。

“可重复读（Repeated Red）”能预防啥？使用“快照读（Snapshot Read）”方式，锁住被读取记录，避免出现“脏读”、“不可重复读”，但是可能出现“幻读”。

“串行化（Serializable）”能预防啥？有效避免“脏读”、“不可重复读”、“幻读”，不过运行效率奇差。

好了，锁说完了，但是，我们的数据库锁，并不能有效的解决并发的问题，只是尽可能保证数据的一致性，当并发量特别大时，数据库还是容易扛不住。那解决数据并发的另一个手段就是，尽可能的提高处理的速度。

因为数据的IO要提升难度比较大，那么通过其他的方式，对数据进行处理，减少数据库的IO，就是提高并发能力的有效手段了。

最有效的一种方式就是：缓存

想要减少并发出现的概率，那么读写的效率越高，读写的执行时间越短，自然数据并发的可能性就变小了，并发性能也有提高了。

还是用刚才的秒杀举例，我们为的就是保证库存的数据不出错，卖出一个商品，减一个库存，那么，我们就可以将库存放在内存中进行处理。这样，就能够保证库存有序的及时扣减，并且不出现问题。这样，我们的数据库的写 *** 作也变少了，执行效率也就大大提高了。

当然，常用的分布式缓存方式有：Redis和Memcache，Redis可以持久化到硬盘，而Memcache不行，应该怎么选择，就看具体的使用场景了。

当然，缓存毕竟使用的范围有限，很多的数据我们还是必须持久化到硬盘中，那我们就需要提高数据库的IO能力，这样避免一个线程执行时间太长，造成线程的阻塞。

那么，读写分离就是另一种有效的方式了

当我们的写成为了瓶颈的时候，读写分离就是一种可以选择的方式了。

我们的读库就只需要执行读，写库就只需要执行写，把读的压力从主库中分离出去，让主库的资源只是用来保证写的效率，从而提高写 *** 作的性能。

RAID0已经是读写很好的RAId模式了，要想再提高性能，可以在raid卡和磁盘上想想办法，更高速的硬盘和磁盘控制器可以解决你的问题；你也可以考虑修改一下你数据库语句，尽量减少不必要的I/O访问。

数据库慢一般有三种情况

逐渐变慢

突然变慢

不定时变慢

第一种情况逐渐变慢要建立一个长期的监控机制比如写个shell脚本每天的忙时(通常 ~ etc )定时收集os neork db的信息每个星期出report对收集到的信息进行分析这些数据的积累可以决定后期的优化决策并且可以是DBA说服manager采用自己决策的重要数据 DBA的价值就在每个星期的report中体现

第二种情况突然变慢也是最容易解决的先从业务的角度看是DB的使用跟以前有何不同然后做进一步判断硬件/网络故障通常也会引起DB性能的突然下降

第一步: 察看DB/OS/NEORK的系统log 排除硬件/网络问题

第二步察看数据库的等待事件根据等待事件来判断可能出问题的环节如果没有等待事件可以排除数据库的问题如果有等待时间根据不同的等待事件来找引起这些事件的根源

比如latch free等跟SQL parse有关系的等待事件 OS的表现是CPU 的占用率高

db file scattered read等跟SQL disk read有关系的等待时间 OS的表现是iostat可以看到磁盘读写量增加

第三步: 察看os的信息 CPU/IO/MEMORY等

a Cpu 的占用率

CPU占用率与数据库性能不成反比 CPU占用率高不能说明数据库性能慢通常情况一个优化很好而且业务量确实很大的数据库 CPU的占用率都会高而且会平均分布在每个进程上反过来 CPU的占用率都会高也不代表数据库性能就好要结合数据库的等待事件来判断CPU占用率高是否合理

如果某个进程的cpu占用高肯定是这个进程有问题如果不是oracle的进程可以让application察看是否程序有死循环等漏洞如果是oracle的进程可以根据pid查找oracle数据字典看看这个进程的发起程序正在执行的sql语句以及等待事件然后不同情况使用不同的方法来解决

b IO

排除硬件的IO问题数据库突然变慢一般来说都是一个或几个SQL语句引起的

如果IO很频繁可以通过优化disk reads高的TOP SQL来解决当然这也是解决IO问题的最笨也是最有效的办法

OS以及存储的配置也是影响IO的一个重要的原因

比如最常见的HP unix下异步IO的问题如果DBA GROUP没有MLOCK的权限 ORACLE是不使用AIO的偏偏OS与DB的两方的admin如果配合不够好地话这个配置就很容易给漏掉了

c Memory

第二种情况与memory的关系比较小只要SGA区配置合理没有变化一般来说只要不是Application Memory leak 不会引起突然变慢的现象

第三种情况不定时变慢是最难解决的现场出现的问题原因也是五花八门千奇百怪最重要的是出现慢的现象时以最快的速度抓取到最多的信息以供分析先写好抓取数据的shell 脚本并在现象发生时及时按下回车键

一个例子

数据库突然变慢

背景: 一个新应用上线后数据库突然变慢

第一步调查新应用

据开发人员讲新应用访问的都是新建立的表表的数据量很小没有复杂的SQL查询

查询 v$sqlarea 分别按照disk_reads / buffer_gets / executions 排序 TOP SQL 中没有新应用的SQL 排除新应用数据库访问照成的性能问题

第二步察看数据库log/ OS log

数据库log中可以看到大量的ORA 错误以及大量的dump文件分析dump文件(时间久了没有dump文件可参考具体细节没法描述下来 ) 发现是新应用通过dblink访问remote DB时生成的dump文件应用开发人说没法修改 Oracle也没有相应的patch解决

OS log中没有错误信息

第三步察看statspack report

从wait events中看到 Top event是 buffer busy waits db file parallel write 等于IO相关的等待事件

从buffer busy waits 的统计信息来看是等待data block

还有些physical reads等信息与从前比没有太多的异常

Tablespace 的IO reads/writes也没有异常但是wait明显增加

初步确定是IO问题

第四步察看OS的信息

top 命令(输出为实验室数据仅作格式参考)

load averages: : :

processes: sleeping zombie stopped on cpu

CPU states: % idle % user % kernel % iowait % swap

Memory: M real M free M swap in use M swap free

PID USERNAME THR PRI NICE SIZE RES STATE TIME CPU MAND

a K K cpu/ : % top

mpgj M K sleep : % view_server

当时现场数据显示 iowait 值与以前相比大很多没有异常进程

sar –d (输出为实验室数据仅作格式参考)

SunOS sc Generic_ sun u / /

: : device %busy avque r+w/s blks/s avwait avserv

sd a

sd b

sd c

sd g

当时现场数据显示放数据文件的设备 avwait avque blks/s值偏大

第五步察看数据库的等待事件

一个大业务量的数据库如果性能不好的话一般来说都会有大量的等待事件上百个等待事件很常见我通常会按照EVENT进行group

Select count() event from v$session_wait where event not in ( on timer pmon timer rdbms ipc message SQLNet message from client ) group by event order by desc;

输出结果显示最多的等待事件是buffer busy waits

进一步分析找出等待的原因

Select count() p p p from v$session_wait where event = buffer busy waits group by p p p ;

在buffer busy waits等待事件中

P = file#

P = block#

P = id ( 此id对应为等待的原因)

按照p p p group是为了明确buffer busy waits的等待集中在哪些对象上

Metalink对buffer busy waits等待事件的描述有如下一段话

If P shows that the buffer busy wait is waiting for a block read to plete then the blocking session is likely to be waiting on an IO wait (eg: db file sequential read or db file scattered read for the same file# and block#

输出结果显示等待分布在多个不同的对象上等待原因为 waiting for a block read to plete 进一步分析为IO的问题

如果 buffer busy waits等待集中在某个对象上说明有hot block 通过重新rebuild这个对象增加freelist来解决 RAC环境增加freelist group

通过以下SQL可以找到具体的object

Select owner segment_name segment_type from dba_extents where file_id=P and P beeen block_id and block_id+blocks;

P P 是上面v$session_wait查出的具体的值

第六步明确原因找出解决步骤

分析

磁盘的IO流量增加

磁盘的IO等待增加

DB的IO流量没有增加

DB的IO等待增加

由可以推出有数据库以外的IO访问磁盘

察看磁盘配置该VG只存放了数据库数据文件和数据库系统文件排除数据文件产生IO的是数据库系统文件

数据库系统文件一般来说不会产生IO 有IO读写的地方只有log和dump文件

结论 ora 产生的大量core dump文件堵塞IO

解决办法

消除ora (应用不改的情况下无法解决)

把dump目录指向别的VG

让oracle尽量少的去写core dump文件

background_core_dump = partial

lishixinzhi/Article/program/Oracle/201311/18969

以上就是关于如何处理数据库并发问题全部的内容，包括:如何处理数据库并发问题、2硬磁盘组成RAID0阵列，如何解决数据库访问时的IO瓶颈、数据库变慢的情况及处理方法等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/9671161.html

如何处理数据库并发问题

发表评论

评论列表（0条）