如何进行高效的文章分类和标签的数据库设计_sql

几乎在所有web项目中，都涉及文章分类和标签的设计，应该说这是一个比较常见、典型的案例。站长并不保证我的思路就是最好的，只是分享出来大家一起交流一下，互相促进与提高。我们假设的开发项目是一个博客系统，最核心的部分就是与文章相关的，那么我们今天讨论如何设计博客系统的文章分类和标签。1、首先，分类和标签都是要和具体的文章相关联的，当然也可能一些文章既没有分类也没有标签，这一点是大家在写查询的时候容易疏忽的地方。因为我们的第一感觉就是，在查询文章列表的时候关联分类表，查出所有的文章和分类，对应关系一般是文章表的分类id对应分类表的id，使用where子句进行限定。这里就存在一个问题了，由于使用了where子句，那么只能查询有分类的文章，而没有分类的文章就查询不到了。这时候怎么办？应该使用连接查询，left join，这要没有分类的文章，在文章分类id那一栏会显示null。通常我们只使用left join，而很少使用right join。2、一般，一篇文章最好只对应一个分类，当然如果你想要对应多个分类也可以。但站长并不提倡，文章在多个分类中重复会给人很不专业的感觉，即使有些文章可能确实设计到多方面的内容，那么你应就其中的侧重点来分类。而标签就不一样了，一篇文章可能有多个标签。这就意味着我们无法靠一个sql语句既查出所有文章的分类和标签，又做到查询结果中的文章id不重复。通常我们需要把查询出来的结果直接循环出来，那么这个结果一般是二维数组，第二维的都存储了唯一一篇文章的相关信息。但是，标签和文章是多对一的关系，多个标签对应一篇文章，如果你只用一条sql语句的话，那么我们查询出来的结果，当然也是多行，这不符合我们目标数据的要求。应此，需要在查询完文章和分类之后，在前面结果的基础上再查询一次文章标签，把两次的结果结合起来，存在数组中，这是对应文章列表页面的查询方法。对于具体文章页面，可以分两次查询。好了，还没有给出具体的数据库设计，就先说了如何查询结果，相信大家也看烦了，下面就举例说明：一、文章表：post，字段如下：id【唯一标识】，aid【作者id】，title【标题】,content【内容】，cid【分类id】二、分类表，category，字段如下：id【唯一标识，与post表的cid关联】,name【分类名】三、标签表，tag，字段如下：id【唯一标识】，name【标签名】四、标签与文章对应关系表，tag_relationship，字段如下：id【唯一标识】，postid【文章id，与post表的id关联】，tagid【标签id，tag表的id关联】有朋友可能会问：为什么要单独用一个表来存储文章与标签的对应关系，为什么不可以直接在tag表中增加一个文章id字段呢，比如：tag表：id，postid，name这样做的话，并不是不可以，但是，由于一篇文章对应多个标签，所以name字段的值会出现很多重复，比如一篇文章，假设文章id为1，有2个标签，php和mysql，那么在tag表会这样存储：id:1,postid:1,name:phpid2,postid:1,name:mysql另一篇文章，假设id为2，有2个标签，也是php和mysql，那么在tag表中它会这样存储：id:3,postid:2,name:phpid4,postid:2,name:mysql大家很快就发现了问题，这样的设计name字段也就是标签的名称在同一张表中可能会大量重复。但是这样设计的好处是，如果你要查询一个标签下有多少篇文章，只要单独查这个表就可以了，比如要查询含有php标签的文章有多少篇，只需要select count(name) 02from tag where name=’php’,就可以查出来。不好的地方是，如果要查询所有标签的集合，使用这种设计需要使用group by name语句来去除重复的行。如果用之前的那种，只需要select * from tag就可以了。一时之间，好像不太好取舍。这两种设计都会有数据冢余，第一种tag_relationship表中，存在tagid字段的重复；而这两种设计又都有各自的好处。那么我们到底该怎么选择呢？站长也说不好，所以无法为大家下结论。但是站长在研究wordpress数据结构的时候，发现wp是采用的单独建表存储文章与标签对应关系的方式。另外，如何设计有时候也是取决具体功能的需求的，所以这个问题就留给大家一起来讨论吧~ 标签：分类和标签, 博客数据库设计

举个例子，一篇文章，比如《大陆＊＊明星又离婚了》这属于「娱乐」类新闻，又属于「中国」分类下的新闻，所以文章和分类的关系一般是 1 对 N 。

数据库表结构设计

article ：

字段名注释

title 文章标题

author 作者

create_time 创建时间

edit_time 修改时间

creator 创建者

editor 修改者

等等...

category:

字段名注释

article_id 文章 id

category_name 分类名

subcategory_id 子分类（与分类一对多的关系，不一定需要子分类）

子分类可以依次类推，想分多细分多细，看需求

就以只有分类为例（是否含子分类其实原理类似），这样其实 left join 就可以出来结果，但是这样的结果不适合展示，因为多个分类查出的一篇文章就有几行结果（对于 SQL 来说几个分类就几条数据），所以在后台管理的文章列表页面中，一次查文章，还有一次根据文章 id 查出所有分类，两次查询结果和起来才能显示一条结果，如下表格所示：

标题分类

《大陆＊＊明星又离婚了》「大陆」「娱乐」

楼主您好，文章发布系统数据库的创建，首先考虑系统框架（也就是文章中是否含有不同的类别）表1：ID主键自增长（便于统计和计数），文章类别ID（分辨文章所属类别），文章类别名称（前一字段中文名称）（此表可当主表进行后表的延续）表2：ID自增长（计数），文章类别ID，文章类别名称，文章标题，文章内容，发布时间，发布人，是否转载，转载来源，是否显示表3：ID自增长（计数），文章ID，文章标题，评论人名称，评论人ID（根据系统是否含有用户名来判断如果该字段可以为空，如果为空显示为匿名评论），评论时间，评论人IP（可根据个人需要取决是否需要该字段），评论支持数（用于其他用户对此评论的支持数，根据个人需要取决是否需要）大概就是这几张表，如果需要更详细的可与QQ和我联系

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6789913.html

如何进行高效的文章分类和标签的数据库设计

发表评论

评论列表（0条）