假设存在一个产品信息表Products,其表结构如下:
CREATE TABLE Products (ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)
表中数据如图:
图中可以看出,产品Chang和Tofu的记录在产品信息表中存在重复。现在要删除这些重复的记录,只保留其中的一条。步骤如下:
第一步——建立一张具有相同结构的临时表
CREATE TABLE Products_temp (ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)
第二步——为该表加上索引,并使其忽略重复的值
方法是在企业管理器中找到上面建立的临时表Products _temp,单击鼠标右键,选择所有任务,选择管理索引,选择新建。如图2所示。
按照图2中圈出来的地方设置索引选项
第三步——拷贝产品信息到临时表
insert into Products_temp Select * from Products此时SQL Server会返回如下提示:
服务器: 消息 3604,级别 16,状态 1,行 1
已忽略重复的键。
它表明在产品信息临时表Products_temp中不会有重复的行出现。
第四步——将新的数据导入原表
将原产品信息表Products清空,并将临时表Products_temp中数据导入,最后删除临时表Products_temp。
delete Products insert into Products select * from Products_temp drop table Products_temp这样就完成了对表中重复记录的删除。无论表有多大,它的执行速度都是相当快的,而且因为几乎不用写语句,所以它也是很安全的
重复行就是有两条记录是一样的,如果该表有主键,那重复行就是除了主键之外其余列的值完全相同。为啥表中会出现重复行?按照我的看法,应该是只有两个途径:1.程序逻辑错误,2.用户的 *** 作问题。程序逻辑错误,那没啥好说的,只要能发现修改其他也挺简单的;用户不知情的情况下添加了相同的数据,比如我的系统中有个把联系人从excel文件导入数据库的功能,导入会耗时,抑或是界面卡住,用户可能没耐心再次点击导入,数据就重复导入了。当然我的问题很好解决,,因为是导入所以那些数据都是相邻的,况且我的每个表都有一个自增的id字段,所以,直接写个sql语句把那堆数据删掉(delete table where id x and id <y)当然解决问题的方式多种多样,我介绍另一种比较有技术含量一点的,因为不是每次数据库重复行都像是我这种情况,有时候重复行数目不定,在数据库中的位置是离散的,用下面的sql语句有点可行Delete table where Id not in (select max(ID) from User group by field)我稍微解释一下上面这句的含义,1.以某个字段为分组依据,相同的数据就被分到一组,2.取得每个分组的最大id,也就是得到数据库行唯一的id集合,3.删除不在这个id集合的数据库行。。。。等等,如果直接拿上面的sql语句去数据库中运行,那会有大麻烦,为啥呢?因为,我们不能确定某个字段值在表中是否是唯一的,比如名字,总有同名的人存在,,,额,你可能会说:id就不会重复了,但是对我们这个有啥意义,如果在数据库中id被设置成唯一的,那根本就不可能存在重复的id,你在插入重复的id时,数据库已经报错不允许你插入,也就不会出现重复了。。。。所以说上面的sql有点小问题,正确的思路就是把上面的第1步改为:根据表中除唯一键之外的所有字段进行分组。就能完美的删除表中的重复行了,,,不过,这个性能嘛。。。。当我没说。。。。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)