【Oracle批量更新】根據一個大表批量更新另一大表的方法比較
【問題】現在有兩個千萬級別的結構相同資料不同資料表T_SMS_PHONENO(目的表),T_SMS_PHONENO2(源表),根據源表資料更新目的表的資料。
【分析】根據經驗,更新方法一般有以下幾種:
1、直接update。
update T_SMS_PHONENO T Set T.NAME=(select NAME from T_SMS_PHONENO2 where PHONENO=T.PHONENO)
2、採用分條更新。根據記錄ID逐條更新。
open cur is select phoneno,name from T_SMS_PHONENO;
loop
fetch cur in v_pn,v_name;
update T_SMS_PHONENO T set T.NAME=v_name where v_pn=T.phoneno;
exit when cur% notfound;
end loop
3、採用分批次更新。將資料按表分割槽欄位或其他欄位依次進行分批次更新。
open cur is select region from T_SMS_PHONENO group by region;
loop
fetch cur in v_region;
update T_SMS_PHONENO T set T.NAME=(select name from T_SMS_PHONENO2 where phoneno=T.Phoneno) where T.region=v_region;
exit when cur% notfound;
end loop
4、虛擬一張表,唯一關聯後進行更新。
update (select T.name,T2.name name2 from T_SMS_PHONENO T,T_SMS_PHONENO2 T2 where T.phoneno=T2.phoneno) set name=name2;
5、Create 一張新表後進行更新。
create table TEMP_SMS_PHONENO as select * from T_SMS_PHONENO T,T_SMS_PHONENO2 T2 where T.phoneno=T2.phoneno;
生成新表,然後重命名錶為T_SMS_PHONENO
【結論】
1、對於大表的更新如果採用直接update語句,則會直接產生大量回滾,並且時間很長,出現假死現象。
2、1小時。
3、30分鐘。
4、2分鐘。
5、30秒,因為不產生redo,undo動作,insert語句會很快。
如果存在唯一性關聯欄位的話,則採用第四種方法更新,是很快的,如果不存在唯一關聯欄位則需要分批次更新,或者create 個新表。