1. 程式人生 > >oracle上億條記錄大表delete

oracle上億條記錄大表delete

delete /*+ use_hash(a,b) parallel(a,15)*/ from tabacca where exists (select 1 from temptablea b where a.id=b.id and b.type='1');

可以試試多個job分工,同時進行。
比如開10個job,每個job分十萬資料

DECLARE
   x   NUMBER;
BEGIN
   FOR i IN 0 .. 9
   LOOP
      DBMS_JOB.submit (
         x,
         'begin DELETE   tabacca t1
 WHERE   EXISTS
            (SELECT   1
               FROM   (SELECT   id
                         FROM   (SELECT   SUBSTR (TO_CHAR (ROWNUM), -1) rn,
                                          id
                                   FROM   temptablea
                                  WHERE   TYPE = ''1'')
                        WHERE   rn = '''
         || i
         || ''') t2
              WHERE   t2.id = t1.id);

COMMIT; end;'
      );
   END LOOP;
END;

分割槽表的話,就加一層分割槽進行迴圈。

for 分割槽
  for i in 0.. 9

DBMS_JOB.SUBMIT(:jobno,//job號  
                                     'your_procedure;',//要執行的過程  
                                     trunc(sysdate)+1/24,//下次執行時間  
                                     'trunc(sysdate)+1/24+1'//每次間隔時間  
                                   );  
     刪除job:dbms_job.remove(jobno);  
     修改要執行的操作:job:dbms_job.what(jobno,what);  
     修改下次執行時間:dbms_job.next_date(job,next_date);  
     修改間隔時間:dbms_job.interval(job,interval);  
     停止job:dbms.broken(job,broken,nextdate);  
     啟動job:dbms_job.run(jobno);  

附:呼叫語句和引數說明:  

dbms_job.submit( job out binary_integer,

what       in   archar2,
next_date     in   date,
interval     in   varchar2,
no_parse     in   boolean)
其中:
●    job:輸出變數,是此任務在任務佇列中的編號;
●    what:執行的任務的名稱及其輸入引數;
●    next_date:任務執行的時間;
●    interval:任務執行的時間間隔

ORACLE的INSERT、UPDATE和DELETE在執行過過程中都是會產生日誌的,因此,當插入大量資料的時候可以新增“nologging”選項,以提高執行速度,三種操作所做的具體東西而相關資料是這樣寫的:
      常INSERT產生最少的Undo,Update產生的Undo居中,而Delete操作產生的Undo最多。
      對於INSERT操作,回滾段只需要記錄插入記錄的rowid,如果回退,只需將該記錄根據rowid刪除即可;
      對於UPDATE操作,回滾段只需要記錄被更新欄位的舊值即可(前映象),回退時通過舊值覆蓋新值即可完成回退;
      對於DELETE操作,Oracle則必須記錄整行的資料,在回退時,Oracle通過一個反向操作恢復刪除的資料。
  因此INSERT是最快的
  所以當遇到大量資料修改的時候,可以考慮用INSERT來代替UPDATE。
 
  例子:
    有一個表A有100萬條記錄,我現在要把這個表A備份成另外一個表B。我用了兩種方式
    create table b as select * from a
    第二種是
    create table b as select * from a where 1=0    可以加上(alter table b nologging)
    insert into b select * from a
    這兩種速度,差別是十幾倍。為什麼啊?

    第一種屬於ddl語句,不產生redo,日誌量小

   而第二種用到的insert 屬於dml,產生日誌,由於記錄多,產生的redo量也是很大的,還要寫很多log