咨询干货

了解优化推广技术相关资讯

记一次生产数据库千万级以上大表历史数据清理过程

2023-02-01来自网络作者: 波波说运维

概述

这部分内容是要在数据已备份或者迁移成功的基础上才做的,前面我们已经针对这表空间千万级别以上的表做了迁移,并数据校验一致了,下面主要是来删除源库上的数据了。


1、删除源库数据

1.1、存储过程删除

因为有一张上亿的表,如果直接删除怕UNDO空间爆了,所以写了个存储过程来循环删除,内容如下:

create table t_jindu(id int,name varchar2(60),sum int);

declare 
i int; --定义变量
v_count int; --定义变量
v_loop int; --定义变量
begin 
 select count(*) into v_count from TAB_SP_OTMSHIPMENT where insert_time<=to_date('20180630 00:00:00','yyyymmdd hh24:mi:ss') ; --计算表
 select ceil(v_count/5000) into v_loop from dual; --计算需要循环次数
 i:=1; --为i赋值
 while i<=v_loop loop --循环退出条件
 delete from TAB_SP_OTMSHIPMENT where insert_time<=to_date('20180630 00:00:00','yyyymmdd hh24:mi:ss') and rownum<5000;
 insert into t_jindu values(i,'TAB_SP_OTMSHIPMENT',v_loop); --记录删除次数进度
 commit; --提交
 i:=i+1; --i依次加1
 end loop;
EXCEPTION 
 WHEN OTHERS THEN
 ROLLBACK; --有问题回滚
end;
/ 

因为删除比较久,所以每次删除都会记录到进度表里面,这样直接查这个表就知道目前删除的进度了,这种方法是最稳妥的,基本不会对目前系统造成太大的影响。但是在测试环境测试删除一张一亿的表删除了整整5天5夜还没删除完,所以最后还是放弃了~


1.2、开并行度删除

遵循数据量从小到大删除、删除后业务验证后再继续删除原则。

注意观察UNDO表空间使用率(观察连接的是哪个实例,然后看对应的UNDO空间,假设UDNOTBS1使用了比较多空间,就需要连接到RFDB2实例,充分利用UNDO空间),归档空间情况(虽然已经nologging,但归档日志还是有发生切换,需要注意)及数据库服务器负载和告警日志。

删除命令如下:

alter table TABRECEIVING_LINE nologging;
delete /*+parallel(t 6)*/ from TABRECEIVING_LINE t where insert_time<=to_date('20180630 00:00:00','yyyymmdd hh24:mi:ss');
commit;
alter table TABRECEIVING_LINE logging;
记一次生产数据库千万级以上大表历史数据清理过程

一亿的表删除7千万记录


2、高水位回收&收集统计信息

这里针对每个大表,删除大量数据后,都需进行高水位回收和收集统计信息。

2.1、高水位回收

涉及命令如下:

alter table my_objects nologging;
alter table my_objects enable row movement;
alter table my_objects shrink space;
alter table my_objects logging;
记一次生产数据库千万级以上大表历史数据清理过程

一亿的表shrink花费了9个小时

2.2、收集统计信息

涉及命令如下:

ANALYZE TABLE my_objects COMPUTE STATISTICS;

3、输出清单

记录清单如下:

记一次生产数据库千万级以上大表历史数据清理过程



数据库大表历史数据清理这块的内容就介绍到这了,后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下!

声明:本站发布的内容以原创、转载、分享网络内容为主,如有侵权,请联系电话:021-51697771-8029,邮箱:mj@cndns.com,我们将会在第一时间删除。文章观点不代表本站立场,如需处理请联系我们。