如何处理大量数据并发 *** 作_sql

处理大量数据并发 *** 作可以采用如下几种方法:

1.使用缓存：使用程序直接保存到内存中。或者使用缓存框架: 用一个特定的类型值来保存，以区别空数据和未缓存的两种状态。

2.数据库优化：表结构优化SQL语句优化，语法优化和处理逻辑优化分区分表索引优化使用存储过程代替直接 *** 作。

3.分离活跃数据:可以分为活跃用户和不活跃用户。

4.批量读取和延迟修改: 高并发情况可以将多个查询请求合并到一个。高并发且频繁修改的可以暂存缓存中。

5.读写分离: 数据库服务器配置多个，配置主从数据库。写用主数据库，读用从数据库。

6.分布式数据库: 将不同的表存放到不同的数据库中，然后再放到不同的服务器中。

7.NoSql和Hadoop: NoSql，not only SQL。没有关系型数据库那么多限制，比较灵活高效。Hadoop，将一个表中的数据分层多块，保存到多个节点（分布式）。每一块数据都有多个节点保存（集群）。集群可以并行处理相同的数据，还可以保证数据的完整性。

拓展资料:

大数据（big data），指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法（抽样调查）这样捷径，而采用所有数据进行分析处理。大数据的5V特点（IBM提出）：Volume（大量）、Velocity（高速）、Variety（多样）、Value（低价值密度）、Veracity（真实性）。

参考资料:网页链接

检查前台应用程序的日志应该是前台的访问造成了数据库的访问增加，尤其是要注意哪些SQL语句被使用的最多，从而确定前台的那些业务被经常使用。

另外，也要确认这些访问是否来自统一IP，排除爬虫。

补充楼主：

其实我没什么经验，只不过是了解一些基础的东西罢了。

一楼的一朵瘩红花实际经验很丰富，你可以向她咨询一下。

你问的问题挺好得。三个概念紧密联系在一起。

这样说吧：并发的几个事务同时发生，不加锁控制的话数据就会乱套了，而加了锁后，又是并发访问会出现死锁，所以就会出现避免死锁的一些措施。

首先谈并发：理论指的是在一段时间同时对某件事进行 *** 作。注意精度问题，修改数据库是在一段时间内 *** 作，不是在某个时刻，而日志则会从时刻开始记录你的 *** 作。

造成死锁的原因是为了防止不同的用户同时间（不是时刻）都对某个数据修改，造成访问不一致的问题。

比如你读了数据库的一个数据然后把它修改了并存回去，是需要时间的（假如是student表中的有个grade属性，你改了一条记录的一个值）在这个过程当中，有人又访问了数据库并且恰恰访问的是存回去之前的数据，然后他要进行 *** 作，过了一段时间，此时你已经存回去了数据。会发现原来的数据被改动了。这时数据就乱套了。（专业术语叫读脏数据，其实还有很多其他类似这种导致前后数据不一致的问题）所以为了限定这种 *** 作，数据库设计了-----锁---来锁定这种 *** 作。就是你正在 *** 作某个数据的时候----通常之前会先锁定这个数据，这样别人就不能对此数据 *** 作了（严格来说就是只能读，不能改），必须等你 *** 作完才能对此数据修改等 *** 作，这就在一定程度上避免了前后 *** 作数据不一致的问题。

但是有了锁后，新问题出现了，就是死锁：

简单解释死锁：进程A等待进程B释放他的资源，B又等待A释放他的资源，这样就互相等待就形成死锁

官方解释死锁

死锁，根本原因在于对共享存储区的访问。在数据库中也一样，如果需要“修改”一条数据，首先数据库管理系统会在上面加锁，以保证在同一时间只有一个事务能进行修改 *** 作。锁有多种实现方式，比如意向锁，共享－排他锁，锁表，树形协议，时间戳协议等等。锁还有多种粒度，比如可以在表上加锁，也可以在记录上加锁。

在并发控制中，锁是非常重要的。

至于在Oracle还是别的数据库管理系统中，死锁产生的原因没有不同，不同的顶多是锁的实现或者死锁的恢复等罢了

再来说说事务：

事务简单来说就是一系列的对数据库的 *** 作揉在一起，要么同时完成，要么就都不完成。

比如---你要取钱的过程就可以当成是一个小的事务：插卡，输入取钱金额，取走钱，拿出来卡。此过程缺一不可。把所有这些过程细节封装起来就成为一个事务。

以oracle数据库为例：

一个事务（你可以认为是一系列业务的 *** 作）起始于dml语句（insert、update、delete）

即一条dml语句就做为一个事务的起始，然后根据业务需要，进行其他的dml *** 作都算是事务的一部分。

最后碰到commit。或者rollback，或者其他意外什么的都算作一个事务的结束。

整个过程就是一个事务。

事务的理论解释就是那四个什么特性：什么原子性、一致性、隔离性和持久性

简称ACID

剩下的：数据库是建立在 *** 作系统之上的一个层次。

你问的是数据库的存储机制？？工作机制？？还是什么的？？

数据库就是存数据的。数据库管理系统是对存的数据进行高效率的管理

大的结构分物理数据跟逻辑数据。

物理数据就是数据在存储设备上的存储方式，什么物理联系，物理结构，物理记录等术语。

逻辑数据就是程序员和用户看到的数据形式。什么逻辑联系，逻辑结构==同上

数据库管理类系统就是把这些逻辑跟物理相互转换。好比你输入的叫逻辑数据存储在磁盘上叫物理数据。等等。

废话了一堆，也不知道回答对你的问题没~~

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6709222.html

如何处理大量数据并发 *** 作

发表评论

评论列表（0条）