查询两张表数据不一致的记录,可以用求差集(非交集)的办法来解决。
SQL语言求"差集"的办法相对于求"交集"的办法要少很多,一般可用not exists(非存在子句)或 左(右)连接后所产生空字段值来筛选两表的差集。
下面举个例子供参考
选出a表中与b表中id不一致的记录
select a.* from a where not exists (select 1 from b where b.id=c.id)
说明:上述语句只比对id一个字段,我们可以根据需要比对多个字段。not exists在比对字段有可利用的索引时,其运行效率是非常高,但是如果没有索引的情况下运行在大数据表时,其运行效率极差,这时应避免使用它,这时我们可改用左(右)连接来求差集。
下面是用左连接来求差集的例子:
select a.* from a left join b on a.id=b.id where b.id is null用左(右)连接来求差集,由于需要实施两表连接会导致笛卡尔效应其输出集的记录行可能会增多,若果不是一对一或一对多,我们应该将多对多的情况处理成多对一后才进行连接,否则输出的记录集可能不正确。
求差集的两种方法,有索引可利用时,not exists的效率要高于left join,反之left join效率更好。
可以用select “空值”或“常量”办法来虚拟补齐两表互相没有的字段,进而实现两个不同结构数据表查询结果集的合并。
下面举例做示范演示:
A(a,b,c,d)
B(d,e,f,g)
A、B两表只存在一个共有字段d
select a,b,c,d,null as e,null as f,null as gfrom A where d LIKE '%abc%'
union all
select null,null,null,d,e,f,g
from B where d LIKE '%abc%'
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)