Mysql去掉重复数据的做法：distinct , group by。以及数据库的拓展_sql

一张user表中的name字段，里面有10个张三。我要只查询出一个张三。

SQL： select distinct name from user

如果还要查询出id

SQL: select distinct name,id from user

SQL ：select name from user group by name

group by理解：表里的某一个字段（比如：name）当出现相同的数据时，group by就将这2条数据合二为一。name就显示一条数据了。但是name达到合二为一了，这2条数据的其他数据怎么办呢？这时候需要配合聚合函数的使用。

where条件：分组前的条件，配合任何关键字使用

Having 条件：分组后的条件（事后条件） ,只配合group by使用。having条件通常使用聚合函数

SQL ：select deptno,sum(sal) from emp group by deptno having sum(sal) >9000

SQL： select deptno,count(*) from emp where sal >1000 group by deptno haing sum(sal) >8000

拓展：

聚合函数定义：聚合函数对一组值进行计算并返回单一的值。（以下都属于聚合函数）

count(*) : 不包括空值。返回对行数目的计数。计算出有多少行，多少条数据。

count() : 包含空值。返回对数目的计数。计算表里有多少行，相当于多少条数据。

sum() : 求和运算

max()最大值

min(): 最小值

avg(): 平均值

mysql数据表中有多条重复数据记录，现在想删除删除部分重复数据，保留最后一条更新或者插入的数据。

以学生表为例，我们创建一个简单的数据表来做实验：

往表里面插入一些实验数据：

我们可以根据分组查询先将重复数据查询出来，同时也可以获取到最后的更新时间，然后再与原表联表查询小于最大时间的数据，将查询出来的数据删除。

------先来慢慢消化-------

在做删除前，我们可以先看看有哪些数据是有重复的：

可以看到张三，李四，王五的数据是有重复的，赵六没有重复，下面我们查找最后更新的记录。

可以看到，最后更新的数据为15:57:46的记录没有在结果中。

可以看到重复记录已经被清理掉。

假如有两行记录是完全一样的，这个方法就不可行了，往表里面在跑一次数据插入：

执行删除计划：

创建一个临时表存放最后插入的一条数据（包含重复与没有重复的），然后清空原表，再将临时表的数据复制到原表中，最后把临时表删除。

这个很好理解，相当于ctrl+c，ctrl+v的 *** 作，数据表如下：

这样数据去重就完成了，需要注意的是，如果表数据量很大，注意在group by 里面的字段建立索引，同时，生产环境注意好先进行数据备份 *** 作。

欢迎分享，转载请注明来源：内存溢出

Mysql去掉重复数据的做法：distinct , group by。以及数据库的拓展