大数据量的数据库表设计技巧_工具

大数据量的数据库表设计技巧

即使是一个非常简单的数据库应用系统，它的数据量增加到一定程度也会引起发一系列问题。如果在设计数据库的时候，就提前考虑这些问题，可以避免由于系统反映迟缓而引起的用户抱怨。

技巧1：尽量不要使用代码。比如性别这个字段常见的做法：1代表男，0代表女。这样的做法意味着每一次查询都需要关联代码表。

技巧2：历史数据中所有字段与业务表不要有依赖关系。如保存打印发票的时候，不要只保留单位代码，而应当把单位名称也保存下来。

技巧3：使用中间表。比如职工工资，可以把每一位职工工资的合计保存在一张中间表中，当职工某一工资项目发生变化的时候，同时对中间表的数据做相应更新。

技巧4：使用统计表。需要经常使用的统计数据，生成之后可以用专门的表来保存。

技巧5：分批保存历史数据。历史数据可以分段保存，比如2003年的历史数据保存在《2003表名》中，而2004年的历史数据则保存在《2004表名》中。

技巧6：把不常用的数据从业务表中移到历史表。比如职工档案表，当某一职工离开公司以后，应该把他的职工档案表中的信息移动到《离职职工档案表》中。

1、经常查询的和不常用的分开几个表，也就是横向切分

2、把不同类型的分成几个表，纵向切分

3、常用联接的建索引

4、服务器放几个硬盘，把数据、日志、索引分盘存放，这样可以提高IO吞吐率

5、用优化器，优化你的查询

6、考虑冗余，这样可以减少连接

7、可以考虑建立统计表，就是实时生成总计表，这样可以避免每次查询都统计一次

8、用极量数据测试一下数据

速度，影响它的因数太多了，且数据量越大越明显。

1、存储将硬盘分成NTFS格式，NTFS比FAT32快，并看你的数据文件大小，1G以上你可以采用多数据库文件，这样可以将存取负载分散到多个物理硬盘或磁盘阵列上。

2、tempdbtempdb也应该被单独的物理硬盘或磁盘阵列上,建议放在RAID0上，这样它的性能最高,不要对它设置最大值让它自动增长

3、日志文件日志文件也应该和数据文件分开在不同的理硬盘或磁盘阵列上，这样也可以提高硬盘I/O性能。

4、分区视图就是将你的数据水平分割在集群服务器上，它适合大规模OLTP,SQL群集上，如果你数据库不是访问特别大不建议使用。

5、簇索引你的表一定有个簇索引，在使用簇索引查询的时候，区块查询是最快的，如用between，应为他是物理连续的，你应该尽量减少对它的updaet,应为这可以使它物理不连续。

6、非簇索引非簇索引与物理顺序无关，设计它时必须有高度的可选择性，可以提高查询速度，但对表update的时候这些非簇索引会影响速度，且占用空间大，如果你愿意用空间和修改时间换取速度可以考虑。

7、索引视图如果在视图上建立索引,那视图的结果集就会被存储起来，对与特定的查询性能可以提高很多，但同样对update语句时它也会严重减低性能，一般用在数据相对稳定的数据仓库中。

8、维护索引你在将索引建好后，定期维护是很重要的，用dbccshowcontig来观察页密度、扫描密度等等，及时用dbccindexdefrag来整理表或视图的索引,在必要的时候用dbccdbreindex来重建索引可以受到良好的效果。

不论你是用几个表1、2、3点都可以提高一定的性能，5、6、8点你是必须做的，至于4、7点看你的需求，我个人是不建议的。

其实我想你的数据大是数据库崩溃掉的原因不是数据库的问题，是你的系统设置的问题，如果是你加载的时候出错多半是因为你的置换空间或者内存设置的有问题，如果是你分批加载就应该是你的存储空间的问题或者是你加载的数据量超出的你索引的范围就会导致当库的情况！

解决方案：

1、HTML静态化

效率最高、消耗最小的就是纯静态化的html页面，所以尽可能使网站上的页面采用静态页面来实现，这个最简单的方法其实也是最有效的方法。但是对于大量内容并且频繁更新的网站，无法全部手动去挨个实现，于是出现了常见的信息发布系统CMS，像常访问的各个门户站点的新闻频道，甚至他们的其他频道，都是通过信息发布系统来管理和实现的，信息发布系统可以实现最简单的信息录入自动生成静态页面，还能具备频道管理、权限管理、自动抓取等功能，对于一个大型网站来说，拥有一套高效、可管理的CMS是必不可少的。

2、服务器分离

对于Web服务器来说，不管是Apache、IIS还是其他容器，是最消耗资源的，于是有必要将与页面进行分离，这是基本上大型网站都会采用的策略，他们都有独立的服务器，甚至很多台服务器。这样的架构可以降低提供页面访问请求的服务器系统压力，并且可以保证系统不会因为问题而崩溃，在应用服务器和服务器上，可以进行不同的配置优化，比如apache在配置ContentType的时候可以尽量少支持，尽可能少的LoadModule，保证更高的系统消耗和执行效率。这一实现起来是比较容易的一现，如果服务器集群 *** 作起来更方便，如果是独立的服务器，新手可能出现上传只能在服务器本地的情况下，可以在令一台服务器设置的IIS采用网络路径来实现服务器，即不用改变程序，又能提高性能，但对于服务器本身的IO处理性能是没有任何的改变。

3、数据库集群和库表散列

大型网站都有复杂的应用，这些应用必须使用数据库，那么在面对大量访问的时候，数据库的瓶颈很快就能显现出来，这时一台数据库将很快无法满足应用，于是需要使用数据库集群或者库表散列。

4、缓存

缓存一词搞技术的都接触过，很多地方用到缓存。网站架构和网站开发中的缓存也是非常重要。架构方面的缓存，对Apache比较熟悉的人都能知道Apache提供了自己的缓存模块，也可以使用外加的Squid模块进行缓存，这两种方式均可以有效的提高Apache的访问响应能力。

网站程序开发方面的缓存，Linux上提供的Memory Cache是常用的缓存接口，可以在web开发中使用，比如用Java开发的时候就可以调用MemoryCache对一些数据进行缓存和通讯共享，一些大型社区使用了这样的架构。另外，在使用web语言开发的时候，各种语言基本都有自己的缓存模块和方法，PHP有Pear的Cache模块，Java就更多了，net不是很熟悉，相信也肯定有。

sql的每一个数据库中有一个名名为’sysobjects’的表，这个系统表中储存了当前数据库中所有对象（包括系统表，用户表、日志、存储过程）的信息，可以用这个表链获取数据库中表的数目和名称，之后向获得某个制定数据库的信息，可以使用带参数的 sp_helpbd过程

我想不管是什么db总是有相应的业务逻辑的，最大的那几个表，一定有她的特殊的业务逻辑，从表名上应该能判断出来，一般存，歌曲或者其他资料的表象对比较大，但是存用户名以及关联表，一般都不会太大，

关于数据库更新，如果是xp或者me 以上的系统看看先把系统还原暂时停止，这样可以节省出来一些空间，或者在挂一块硬盘看看

基本的建立主键，索引什么的，我就不说了，

表设计可以采取拆分表的方式

纵向拆分表：根据字段拆分为多个表，每个表都有关联字段，可以将他们关联起来

（例如：订单表，几个根据字段拆分的表中都有1个订单号字段）

横向拆分表：不知道你具体什么数据，假定其中有时间字段，根据时间来拆分

（例如：1年有12个月，1个月的数据放入一个表中）

以上就是关于大数据量的数据库表设计技巧全部的内容，包括:大数据量的数据库表设计技巧、如果数据库存放的数据量大，我们有什么方法解决这个问题啊、需要处理的数据量太大怎么处理等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9756309.html

大数据量的数据库表设计技巧

发表评论

评论列表（0条）