1、先查询本库所有表,本文以TEST开头表为例,select * from user_tables t where table_name like 'TEST%'
2、查询表的数量,select count(*) from user_tables t where table_name like 'TEST%'
3、编写删除表的sql脚本,
declare
v_sql varchar2(200)
v_cnt number(10)
begin
for v_tab in (select table_name from user_tables t where table_name like 'TEST%') loop
v_sql := 'drop table '|| v_tab.table_name
execute immediate v_sql
end loop
end
4、再次查看TEST开头的表,select * from user_tables t where table_name like 'TEST%',已无记录,
plsql删除⼤量数据_oracle快速删除⼤批量数据⽅法(全部删除,条件删除,删除⼤量重。。。全部删除
如果是删除某个表的所有数据,并且不需要回滚,使⽤ TRUNCATE 就ok了。
SQL>truncate table table_name
条件删除
如果删除数据有条件,如 delete from tablename where col1 = 'lucy';这时除了加索引外, 你可以删除时加NO LOGGING选项,不写⽇志加快删除速度
引⽤某⼈的⼀句话“⼏千万条记录的表都不分区,明显有问题嘛。Oracle的技术⽀持⼯程师建议,2,000,000条以上记录的表,应该考虑分区,你完全可以按照时间为维度来建表,每个⽉的数据存放在⼀个分区表中,以后要删除⼀个⽉的数据,直接truncate table即可,不记录⽇志,速度很快。”
删除⼤量重复记录
《转》做项⽬的时候,⼀位同事导数据的时候,不⼩⼼把⼀个表中的数据全都搞重了,也就是说,这个表⾥所有的记录都有⼀条重复的。这个表的数据是千万级的,⽽且是⽣产系统。也就是说,不能把所有的记录都删除,⽽且必须快速的把重复记录删掉。
对此,总结了⼀下删除重复记录的⽅法,以及每种⽅法的优缺点。
为了陈诉⽅便,假设表名为Tbl,表中有三列col1,col2,col3,其中col1,col2是主键,并且,col1,col2上加了索引。
1、通过创建临时表
可以把数据先导⼊到⼀个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:
creat table tbl_tmp (select distinct* from tbl)
truncate table tbl//清空表记录i
nsert into tbl select * from tbl_tmp//将临时表中的数据插回来。
这种⽅法可以实现需求,但是很明显,对于⼀个千万级记录的表,这种⽅法很慢,在⽣产系统中,这会给系统带来很⼤的开销,不可⾏。
2、利⽤rowid
在oracle中,每⼀条记录都有⼀个rowid,rowid在整个数据库中是唯⼀的,rowid确定了每条记录是oracle中的哪⼀个数据⽂件、块、⾏上。在重复的记录中,可能所有列的内容都相同,但rowid不会相同。SQL语句如下:
delete from tbl where rowid in (select a.rowid
from tbl a, tbl b
where a.rowid>b.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已经知道每条记录只有⼀条重复的,这个sql语句适⽤。但是如果每条记录的重复记录有N条,这个N是未知的,就要考虑适⽤下⾯这种⽅法了。
3、利⽤max或min函数
这⾥也要使⽤rowid,与上⾯不同的是结合max或min函数来实现。SQL语句如下
delete from tbl a
where rowid not in (
select max(b.rowid)
from tbl b
where a.col1=b.col1 and a.col2 = b.col2)//这⾥max使⽤min也可以
或者⽤下⾯的语句
delete from tbl awhere rowid
select max(b.rowid)
from tbl b
where a.col1=b.col1 and a.col2 = b.col2)//这⾥如果把max换成min的话,前⾯的where⼦句中需要把""
跟上⾯的⽅法思路基本是⼀样的,不过使⽤了group by,减少了显性的⽐较条件,提⾼效率。SQL语句如下:
deletefrom tbl where rowid not in (
select max(rowid)
from tbl tgroup by t.col1, t.col2)
delete from tbl where (col1, col2) in (
select col1,col2
from tblgroup bycol1,col2havingcount(*) >1) and rowidnotin(selectnin(rowid)fromtblgroup bycol1,
col2havingcount(*) >1) ----
还有⼀种⽅法,对于表中有重复记录的记录⽐较少的,并且有索引的情况,⽐较适⽤。假定col1,col2上有索引,并且tbl表中有重复记录的记录⽐较少,SQL语句如下4、利⽤group by,提⾼效率
¥
5
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
plsql删除大量数据_oracle快速删除大批量数据方法(全部删除,条件删除,删除大量重。。。
plsql删除⼤量数据_oracle快速删除⼤批量数据⽅法(全部删除,条件删除,删除⼤量重。。。
全部删除
如果是删除某个表的所有数据,并且不需要回滚,使⽤ TRUNCATE 就ok了。
SQL>truncate table table_name
条件删除
如果删除数据有条件,如 delete from tablename where col1 = 'lucy';这时除了加索引外, 你可以删除时加NO LOGGING选项,不写⽇志加快删除速度
第 1 页
引⽤某⼈的⼀句话“⼏千万条记录的表都不分区,明显有问题嘛。Oracle的技术⽀持⼯程师建议,2,000,000条以上记录的表,应该考虑分区,你完全可以按照时间为维度来建表,每个⽉的数据存放在⼀个分区表中,以后要删除⼀个⽉的数据,直接truncate table即可,不记录⽇志,速度很快。”
删除⼤量重复记录
《转》做项⽬的时候,⼀位同事导数据的时候,不⼩⼼把⼀个表中的数据全都搞重了,也就是说,这个表⾥所有的记录都有⼀条重复的。这个表的数据是千万级的,⽽且是⽣产系统。也就是说,不能把所有的记录都删除,⽽且必须快速的把重复记录删掉。
第 2 页
对此,总结了⼀下删除重复记录的⽅法,以及每种⽅法的优缺点。
为了陈诉⽅便,假设表名为Tbl,表中有三列col1,col2,col3,其中col1,col2是主键,并且,col1,col2上加了索引。
1、通过创建临时表
可以把数据先导⼊到⼀个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:
creat table tbl_tmp (select distinct* from tbl)
truncate table tbl//清空表记录i
第 3 页
nsert into tbl select * from tbl_tmp//将临时表中的数据插回来。
这种⽅法可以实现需求,但是很明显,对于⼀个千万级记录的表,这种⽅法很慢,在⽣产系统中,这会给系统带来很⼤的开销,不可⾏。
2、利⽤rowid
在oracle中,每⼀条记录都有⼀个rowid,rowid在整个数据库中是唯⼀的,rowid确定了每条记录是oracle中的哪⼀个数据⽂件、块、⾏上。在重复的记录中,可能所有列的内容都相同,但rowid不会相同。SQL语句如下:
第 4 页
delete from tbl where rowid in (select a.rowid
from tbl a, tbl b
where a.rowid>b.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已经知道每条记录只有⼀条重复的,这个sql语句适⽤。但是如果每条记录的重复记录有N条,这个N是未知的,就要考虑适⽤下⾯这种⽅法了。
3、利⽤max或min函数
这⾥也要使⽤rowid,与上⾯不同的是结合max或min函数来实现。SQL语句如下
第 5 页
delete from tbl a
where rowid not in (
select max(b.rowid)
from tbl b
where a.col1=b.col1 and a.col2 = b.col2)//这⾥max使⽤min也可以
或者⽤下⾯的语句
delete from tbl awhere rowid
select max(b.rowid)
from tbl b
第 6 页
where a.col1=b.col1 and a.col2 = b.col2)//这⾥如果把max换成min的话,前⾯的where⼦句中需要把""
跟上⾯的⽅法思路基本是⼀样的,不过使⽤了group by,减少了显性的⽐较条件,提⾼效率。SQL语句如下:
deletefrom tbl where rowid not in (
select max(rowid)
from tbl tgroup by t.col1, t.col2)
delete from tbl where (col1, col2) in (
select col1,col2
第 7 页
from tblgroup bycol1,col2havingcount(*) >1) and rowidnotin(selectnin(rowid)fromtblgroup bycol1,
col2havingcount(*) >1) ----
还有⼀种⽅法,对于表中有重复记录的记录⽐较少的,并且有索引的情况,⽐较适⽤。假定col1,col2上有索引,并且tbl表中有重复记录的记录⽐较少,SQL语句如下4、利⽤group by,提⾼效率
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)