以学生表为例,我们创建一个简单的数据表来做实验:
往表里面插入一些实验数据:
我们可以根据分组查询先将重复数据查询出来,同时也可以获取到最后的更新时间,然后再与原表联表查询小于最大时间的数据,将查询出来的数据删除。
------先来慢慢消化-------
在做删除前,我们可以先看看有哪些数据是有重复的:
可以看到张三,李四,王五的数据是有重复的,赵六没有重复,下面我们查找最后更新的记录。
可以看到,最后更新的数据为15:57:46的记录没有在结果中。
可以看到重复记录已经被清理掉。
假如有两行记录是完全一样的,这个方法就不可行了,往表里面在跑一次数据插入:
执行删除计划:
创建一个临时表存放最后插入的一条数据(包含重复与没有重复的),然后清空原表,再将临时表的数据复制到原表中,最后把临时表删除。
这个很好理解,相当于ctrl+c,ctrl+v的 *** 作,数据表如下:
这样数据去重就完成了,需要注意的是, 如果表数据量很大,注意在group by 里面的字段建立索引,同时,生产环境注意好先进行数据备份 *** 作 。
删除的办法是执行truncat方法,只是不需要每次手动的输入truncate命令进行删除。
通过sql命令的方式生成所有的truncate语句并写入到.sql脚本文件中,然后执行脚本即可完成删除 *** 作,并且保留了表结构。
生成truncate命令的sql语句为:
SELECTCONCAT('TRUNCATETABLE',TABLE_NAME,';')FROMinformation_schema.TABLESWHERETABLE_SCHEMA='test'intooutfile'/tmp/truncate_test.sql';。
然后将生成的.sql脚本拷贝到当前文件夹下面:
mv/tmp/truncate_test.sql$current_dir/。
然后执行.sql脚本将数据库中所有表中数据删除:
source$current_dir/truncate_test.sql。
注意:
在进行select....intooutfile...... *** 作时,默认只能将文件写入到tmp路径下,可以不用将tmp文件夹下面的.sql脚本移动到当前文件夹下,直接在tmp路径下执行.sql脚本即可。
扩展资料:
常见的删除数据库表中数据的方法是通过delete或者truncate的方法进行删除 *** 作,如果删除的是表中某一条或者部分数据的话适合用delete *** 作进行删除,如果要删除表中所有的数据的话,适合是同truncate进行删除 *** 作。
如果不需要保留数据库中所有表的结构,那么答案很简单,执行命令dropdatabase数据库名即可达到目的。
但是如果需要保留该数据库中所有表的结构,只想删除所有表中的数据,多执行几次truncate可以达到。
参考资料:百度百科-数据表
在网上查找删除重复数据保留id最小的数据,方法如下:DELETE
FROM
people
WHERE
peopleName
IN
(
SELECT
peopleName
FROM
people
GROUP
BY
peopleName
HAVING
count(peopleName)
>
1
)
AND
peopleId
NOT
IN
(
SELECT
min(peopleId)
FROM
people
GROUP
BY
peopleName
HAVING
count(peopleName)
>
1
)
自己使用的时候显示报错:
delete
from
tb
where
id
in
(SELECT
max(id)
from
tb
GROUP
BY
user
HAVING
count(user)>1)
[Err]
1093
-
You
can't
specify
target
table
‘XXX'
for
update
in
FROM
clause
暂时不知道是什么原因导致的。
然后想办法分布 *** 作,首先筛选出有重复user的数据,然后用max()选出其中较大的那一行:
SELECT
max(id)
from
tb
GROUP
BY
user
HAVING
count(user)>1
然后再根据得到的max(id)逐条删除多余的数据
delete
from
tb
where
id=xx
是个笨方法,暂时先解决问题吧。
总结
以上所述是小编给大家介绍的Mysql删除重复数据保留最小的id
的解决方法,希望对大家有所帮助,如果大家有任何疑问欢迎给我留言,小编会及时回复大家的!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)