oracle上億條記錄大表delete
delete /*+ use_hash(a,b) parallel(a,15)*/ from tabacca where exists (select 1 from temptablea b where a.id=b.id and b.type='1');
可以試試多個job分工,同時進行。
比如開10個job,每個job分十萬資料
DECLARE
x NUMBER;
BEGIN
FOR i IN 0 .. 9
LOOP
DBMS_JOB.submit (
x,
'begin DELETE tabacca t1
WHERE EXISTS
(SELECT 1
FROM (SELECT id
FROM (SELECT SUBSTR (TO_CHAR (ROWNUM), -1) rn,
id
FROM temptablea
WHERE TYPE = ''1'')
WHERE rn = '''
|| i
|| ''') t2
WHERE t2.id = t1.id);
COMMIT; end;'
);
END LOOP;
END;
分割槽表的話,就加一層分割槽進行迴圈。
for 分割槽
for i in 0.. 9
DBMS_JOB.SUBMIT(:jobno,//job號
'your_procedure;',//要執行的過程
trunc(sysdate)+1/24,//下次執行時間
'trunc(sysdate)+1/24+1'//每次間隔時間
);
刪除job:dbms_job.remove(jobno);
修改要執行的操作:job:dbms_job.what(jobno,what);
修改下次執行時間:dbms_job.next_date(job,next_date);
修改間隔時間:dbms_job.interval(job,interval);
停止job:dbms.broken(job,broken,nextdate);
啟動job:dbms_job.run(jobno);
附:呼叫語句和引數說明:
dbms_job.submit( job out binary_integer,
what in archar2,
next_date in date,
interval in varchar2,
no_parse in boolean)
其中:
● job:輸出變數,是此任務在任務佇列中的編號;
● what:執行的任務的名稱及其輸入引數;
● next_date:任務執行的時間;
● interval:任務執行的時間間隔
ORACLE的INSERT、UPDATE和DELETE在執行過過程中都是會產生日誌的,因此,當插入大量資料的時候可以新增“nologging”選項,以提高執行速度,三種操作所做的具體東西而相關資料是這樣寫的:
常INSERT產生最少的Undo,Update產生的Undo居中,而Delete操作產生的Undo最多。
對於INSERT操作,回滾段只需要記錄插入記錄的rowid,如果回退,只需將該記錄根據rowid刪除即可;
對於UPDATE操作,回滾段只需要記錄被更新欄位的舊值即可(前映象),回退時通過舊值覆蓋新值即可完成回退;
對於DELETE操作,Oracle則必須記錄整行的資料,在回退時,Oracle通過一個反向操作恢復刪除的資料。
因此INSERT是最快的
所以當遇到大量資料修改的時候,可以考慮用INSERT來代替UPDATE。
例子:
有一個表A有100萬條記錄,我現在要把這個表A備份成另外一個表B。我用了兩種方式
create table b as select * from a
第二種是
create table b as select * from a where 1=0 可以加上(alter table b nologging)
insert into b select * from a
這兩種速度,差別是十幾倍。為什麼啊?
第一種屬於ddl語句,不產生redo,日誌量小
而第二種用到的insert 屬於dml,產生日誌,由於記錄多,產生的redo量也是很大的,還要寫很多log