1. 程式人生 > >logical_backup: expdp/impdp

logical_backup: expdp/impdp

sms 方便 任務 重新 磁盤 itl ner title stop

Table of Contents

  • 1. 註意事項
  • 2. 前期準備
  • 3. 常用參數及示例
  • 4. 常用語句示例
  • 5. 交互式命令
  • 6. 技巧
    • 6.1. 不生成文件直接導入目標數據庫
    • 6.2. 通過shell腳本自動導入
    • 6.3. 如何導出數百張表

1 註意事項

  • 檢查數據庫版本(用於決定導出時生成為哪個版本的dmp頭文件) select version from v$instance; 也可以用sqlplus -v 查看。
  • 檢查字符集是否一致(字符集不一致,不能導入) select userenv(‘language‘) from dual;
  • 檢查數據量及磁盤空間(決定采取什麽樣的方式導出及導入)

2 前期準備

  • 創建目錄

create directory DUMP_DIR as ‘&PATH‘;

  • 查看目錄

select * from dba_directories;

  • 授權其他用戶使用該目錄

grant read,write on directory dpdata1 to scott;

3 常用參數及示例

  • ATTACH
作用
    當我們使用ctrl+C 退出交互式命令時,可心使用attach參數重新進入到交互模式
語法
    ATTACH=[schema_name.]job_name
    Schema_name用戶名,job_name任務名
示例
    Expdp scott/tiger ATTACH=scott.export_job
  • CONTENT
作用
    限制了導出的內容,包括三個級別:全部/數據/元數據(結構)
語法
   CONTENT={ALL | DATA_ONLY | METADATA_ONLY}
   ALL           -- 導出所有數據,包括元數據及數據
   DATA_ONLY     -- 只導出數據
   METADATA_ONLY -- 只包含元數據
示例
   Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump CONTENT=METADATA_ONLY
  • DIRECTORY
作用
    此路徑可以理解為實際絕對路徑在oracle數據庫裏的別名,是導出文件的存儲位置
    路徑的創建: create directory &DIRECTORY_NAME AS ‘&PATH‘;
    查看已存在路徑: select  * from dba_directories;
語法
    directory=[directory_name]
示例
    Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=lhb.dump
  • DUMPFILE
作用
    此參數用戶命名導出文件,默認是 expdat.dmp. 文件的存儲位置如果在文件名前沒有指定directory,則會默認存儲到directory參數指定的路徑下。
語法
    DUMPFILE=[dump_dir:]file_name
示例
    Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=dump_dir1:a.dmp
  • ESTIMATE
在使用Expdp進行導出時,Expdp需要計算導出數據大小容量,Oracle可以通過兩種方式進行容量估算,一種是通過數據塊(blocks)數量、一種是通過統計信息中記錄的內容(statistics)估算.

語法結構:
    EXTIMATE={BLOCKS | STATISTICS}
示例:
    Expdp scott/tiger TABLES=emp ESTIMATE=STATISTICS DIRECTORY=dump_dir DUMPFILE=halberd.dump
    Expdp scott/tiger TABLES=emp ESTIMATE=BLOCKS DIRECTORY=dump_dir DUMPFILE=halberd.dump
  • EXTIMATE_ONLY
作用
    此參數用於統計導出的數據量大小及統計過程耗時長短。
語法
    EXTIMATE_ONLY={Y | N}
示例
    Expdp scott/tiger ESTIMATE_ONLY=y NOLOGFILE=y directory=dump_dir schemas=halberd
  • EXCLUDE
作用
    此參數用於排除不需要導出的內容,如我們進行全庫導出,但是不需要導出用戶scott,此時需要在exlude後先指定排除類型為schema,再指定具體的schema。具體使用方法見include參數. EXCLUDE與include的使用方法是一樣的
語法
    EXCLUDE=object_type[:name_clause] [,object_type[:name_clause] ]
    name_clause
        "=‘object_name‘"
        "in (‘object_name‘[,‘object_name‘,....])"
        "in (select_clause) "
    Object_type對象類型,如:table,view,procedure,schema等
    name_clause指定名稱的語句,如果不具體指定是哪個對象,則此類所有對象都不導出, select 語句中表名不要加用戶名。用戶名,通過schemas 指定。

示例
    expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dup EXCLUDE=VIEW
    expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dup EXCLUDE=TABLE:\" IN\(\‘TEMP\‘,\‘GRADE\‘\)\"
    EXCLUDE=TABLE:"=‘APPLICATION_AUDIT‘"
  • FILESIZE
作用
    用於指定單個導出的數據文件的最大值,與%U一起使用。比如,我們需要導出100G的數據,文件全部存儲到一個文件內,在文件傳輸時,會耗費大量的時間,此時我們就可以使用這個參數,限制每個文件的大小,在傳輸導出文件時,就可以多個文件同時傳送,大大的節省了文件傳輸時間。提高了工作的效率。
語法
  FILESIZE=integer[B | K | M | G]
示例
   Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd%U.dup FILESIZE=20g
  • FLASHBACK_SCN/FLASHBACK_TIME
作用
    基於undo 及scn號(時間點)進行的數據導出。使用此參數設置會進行flashback query的功能,查詢到對應指定的SCN時的數據,然後進行導出。只要UNDO不被覆蓋,無論數據庫是否重啟,都可以進行導出. flashback_time參數與flashback_scn的原理是一樣的。在導出的數據裏保持數據的一致性是很有必要的。這個。。我想,沒誰傻忽忽的把這兩個參數一起使用吧?所以我就不提醒你兩個參數不可以同時使用了。
語法
   FLASHBACK_SCN=scn_value
   FLASHBACK_TIME 有多種設定值的格式:
   flashback_time=to_timestamp (localtimestamp)
   flashback_time=to_timestamp_tz (systimestamp)
   flashback_time="TO_TIMESTAMP (""25-08-2003 14:35:00"", ""DD-MM-YYYY HH24:MI:SS"")"  使用此格式可能會遇到ORA-39150錯誤。
示例
   Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dmp FLASHBACK_SCN= 12345567789
   Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dmp FLASHBACK_TIME= to_timestamp (localtimestamp)
  • FULL
作用
   指定導出內容為全庫導出。這裏需要特別註意的是,expdp 不能導出sys用戶對象。即使是全庫導出也不包含sys用戶。
語法
   FULL={Y | N}
示例
   expdp \‘\/ as sysdba\‘ directory=dump_dir full=y
  • HELP
作用
    當我們對參數的意義不了解時,或者忘記參數怎麽寫時,就可以用這個參數,來尋求幫助,實際上和操作系統裏的man命令是一樣的。
示例
    impdp -help
    expdp help=y
  • INCLUDE
作用
    限制範圍,指定自己想要的內容,比如要導出某個用戶的某張表。
語法
    INCLUDE = object_type[:name_clause],object_type[:name_clause]
示例
    impdp dbmon/dbmon_123 directory=dump_dir network_link=zjzwb2 SCHEMAS=AICBS remap_schema=aicbs:aicbsb include=table:\"IN\(SELECT TABLE_NAME FROM dbmon.TABLES_TOBE_MASKED\)\"  LOGFILE=zjzwb.log transform=segment_attributes:n
    PARFILE中設置:
        INCLUDE=table:"in(select table_name from dba_tables where owner=‘AA‘)"
        INCLUDE=TABLE:"IN(‘TEST1‘,‘TEST2‘)"
    SHELL環境設置:
        INCLUDE=TABLE:\"IN\(SELECT TABLE_NAME FROM DBA_TABLES WHERE OWNER=\‘AA\‘\)\"
        INCLUDE=TABLE:\"IN\(\‘TEST1\‘,\‘TEST2\‘\)\"
說明
    當導入命令在目標端發起時,select 子句所涉及的表要在源端,並且dblink 所使用的用戶有訪問的權限。
  • JOB_NAME
作用
    指定任務名,如果不指定的話,系統會默認自動命名:SYS_EXPORT_mode_nn
語法
    JOB_NAME=&JOB_NAME
其他
    查看有哪些expdp/impdp job,可以通過dba_datapump_jobs查看,其實你通過v$session.action也可以查看到
    大多與attach參數一起使用,重新進行expdp交互命令時使用。
  • LOGFILE
作用: 指定導出日誌名稱。默認是:expdp.log
語法
    LOGFILE=[DIRECTORY:]file_name   , 如果參數值裏沒有指定路徑,會默認使用directory參數值所指向的路徑。
    directory : 存儲路徑,
    file_name :日誌文件名
示例
    expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dmp logfile=halberd.log
    impdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dmp logfile=halberd.log
  • NETWORK_LINK
作用
    此參數只有在導入(impdp)時使用,可通過本地數據庫裏的db_link連接到其他數據庫A,將數據庫A的數據直接導入到本地數據庫。中間可節省導出數據文件,傳送數據文件的過程。很方便。
語法
    network_link=[db_link]
示例
    impdp scott/tiger DIRECTORY=dump_dir DUMPFILE=halberd.dmp NETWORK_LINK=to_tjj SCHEMAS=halberd logfile=halberd.log
  • NOLOGFILE
作用
    不寫導入導出日誌,這個筆者是灰常灰常滴不建議設置為“Y”滴。
語法
    nologfile=[y|n]
  • PARALLEL
作用
    指定導出/導入時使用多少個並發,默認是1.
語法
    parallel=[digit]
示例
    expdp \‘\/ as sysdba\‘ directory=dump_dir schemas=halberd dumpfile=halberd%U.dmp parallel=8 logfile=halberd.log
  • PARFILE
作用
    參數文件,這個參數文件裏,存儲著一些參數的設置。比如上面說過的,parallel,network_link,等。導出時,可以使用此參數,expdp/impdp會自動讀取文件中的參數設置,進行操作。
語法
    PARFILE=[directory_path] file_name
示例
    expdp \‘\/ as sysdba\‘ parfile=halberd.par

   cat halberd.par
   directory=dump_dir                                                                                                                                                                                          
   logfile=test.log                                                                                                                                                                                            
   schemas=test                                                                                                                                                                                                
   query="where create_date > last_day(add_months(sysdate,-1)) and create_date <= last_day(sysdate)"                                                                                                           
   transform=segment_attributes:n                                                                                                                                                                              
   network_link=to_aibcrm                                                                                                                                                                                      
   table_exists_action=append                                                                                                                                                                                  
   impdp \‘\/ as sysdba\‘ parfile=test.par
  • QUERY
作用
    此參數指定在導入導出時的限制條件,和SQL語句中的 "where" 語句是一樣兒一樣兒滴
語法
    QUERY=([schema.] [table_name:] query_clause, [schema.] [table_name:] query_clause,……)
    CONTENT=METADATA_ONLY, EXTIMATE_ONLY=Y,TRANSPORT_TABLESPACES.
示例
   Expdp scott/tiger directory=dump dumpfiel=a.dmp Tables=emp query="WHERE deptno<>20"
  • SCHEMAS
作用
    指定導出/導入哪個用戶
語法
    schemas=schema_name[,schemaname,....]
示例
    expdp \‘\/ as sysdba\‘ directory=dump_dir schemas=halberd
  • REMAP_SCHEMA
 只在導入時使用
作用
    當把用戶A的對象導入到用戶(其實應該叫schema,將就看吧)B時,使用此參數,可實現要求
格式
    remap_schema=schema1: schema2
示例
    impdp \‘\/ as sysdba\‘ directory=dump_dir dumpfile=halberd.dmp logfile=halberd.log remap_schema=scott:halberd
  • TABLES
作用
    指定導出哪些表。
格式
    TABLES=[schema.]table_name[:partition_name][,[schema.]table_name[:partition_name]]
說明
    Schema 表的所有者;table_name表名;partition_name分區名.可以同時導出不同用戶的不同的表
示例
    expdp \‘\/ as sysdba\‘ directory=dump_dir tables=emp.emp_no,emp.dept
  • TABLESPACES
作用
    指定導出/導入哪個表空間。
語法
    tablespaces=tablespace_name[,tablespace_name,....]
示例
    expdp \‘\/ as sysdba\‘ directory=dump_dir tablespace=user
  • REMAP_TABLESPACE
作用
    只有在導入時使用,用於進行數據的表空間遷移。 把前一個表空間中的對象導入到冒號後面的表空間
用法
    remap_tablespace=a:b
說明
   a: 數據所在的原表空間; b: 目標表空間
示例
   impdp \‘\/ as sysdba\‘ directory=dump_dir tables=emp.dept remap_tablespace=user:user1
  • TRANSPORT_FULL_CHECK
     檢查需要進行傳輸的表空間與其他不需要傳輸的表空間之間的信賴關系,默認為N。當設置為“Y”時,會對表空間之間的信賴關系進行檢查,如A(索引表空間)信賴於B(表數據表空間),那麽傳輸A而不傳輸B,則會出錯,相反則不會報錯。
  • TRANSPORT_TABLESPACES
作用
    列出需要進行數據傳輸的表空間
格式
     TRANSPORT_TABLESPACES=tablespace1[,tablespace2,.............]
  • TRANSFORM
作用
    此參數只在導入時使用,是一個用於設定存儲相關的參數,有時候也是相當方便的。假如數據對應的表空間都存在的話,就根本用不到這個參數,但是,假如數據存儲的表空間不存在,使用此參數導入到用戶默認表空間就可以了。更靈活的,可以使用remap_tablespace參數來指定。
格式
    transform=transform_name:value[bject_type]
    transform_name = [OID | PCTSPACE | SEGMENT_ATTRIBUTES | STORAGE]:[Y|N]
    segment attributes:段屬性包括物理屬性、存儲屬性、表空間和日誌,Y 值按照導出時的存儲屬性導入,N時按照用戶、表的默認屬性導入
    storage:默認為Y,只取對象的存儲屬性作為導入作業的一部分
    oid:  owner_id,如果指定oid=Y(默認),則在導入過程中將分配一個新的oid給對象表,這個參數我們基本不用管。
    pctspace:通過提供一個正數作為該轉換的值,可以增加對象的分配尺寸,並且數據文件尺寸等於pctspace的值(按百分比)
示例
    transform=segment_attributes:n --表示將用戶所有對象創建到用戶默認表空間,而不再考慮原來的存儲屬性。
  • VERSION
       此參數主要在跨版本之間進行導數據時使用,更具體一點,是在從高版本數據庫導入到低版本數據庫時使用,從低版本導入到高版本,這個參數是不可用的。默認值是:compatible。此參數基本在導出時使用,導入時基本不可用。
VERSION={COMPATIBLE | LATEST | version_string}
COMPATIBLE       : 以參數compatible的值為準,可以通過show parameter 查看compatible參數的值
LATEST           : 以數據庫版本為準
version_string   : 指定版本。如: version=10.2.0.1
  • SAMPLE
       SAMPLE 給出導出表數據的百分比,參數值可以取.000001~100(不包括100)。不過導出過程不會和這裏給出的百分比一樣精確,是一個近似值。 
     格式: SAMPLE=[[schema_name.]table_name:]sample_percent 
     示例: SAMPLE="HR"."EMPLOYEES":50
  • table_exists_action
此參數只在導入時使用。
作用:導入時,假如目標庫中已存在對應的表,對於這種情況,提供三種不同的處理方式:append,truncate,skip,replace
格式: table_exists_action=[append | replace| skip |truncate]
說明: append :   追加數據到表中
       truncate:  將目標庫中的同名表的數據truncate掉。
       skip :      遇到同名表,則跳過,不進行處理,註意:使用此參數值時,與該表相關的所有操作都會skip掉。
       replace:    導入過程中,遇到同名表,則替換到目標庫的那張表(先drop,再創建)。
示例:  table_exists_action=replace
  • SQLFILE
只在導入時使用!
作用: 使用此參數時,主要是將DMP文件中的metadata語句取出到一個單獨的SQLfile中,而數據並不導入到數據庫中
格式: sqlfile=&file_name.sql
示例: impdp \‘\/ as sysdba\‘ directory=dump_dir dumpfile=halberd.dmp logfile=halberd.log sqlfile=halberd.sql
legacy mode
在11g中,才有這種模式。這種模式裏兼容了以前版本中的部分參數,如:consistent,reuse_dumpfiles等(其實我現在也就知道這兩個參數,哈哈,以後再遇到再補充)
  • consistent
這個是保持數據一致性的一個參數。在11g中使用時,如果設置 consistent=true,則會默認轉換成 flashback_time參數,時間設置為命令開始執行的那個時間點。
格式: consistent=[true|false]
  • reuse_dumpfiles
作用:重用導出的dmp文件 。假如第一次我們導失敗了,雖然導出失敗,但是dmp文件 還 是會生成的。在修改導出命令,第二次執行時,就可以 加上這個參數。
格式: reuse_dumpfile=[true|false]
  • partition_options
1 NONE 不對分區做特殊處理。在系統上的分區表一樣創建。
2 DEPARTITION 每個分區表和子分區表作為一個獨立的表創建,名字使用表和分區(子分區)名字的組合。
3 MERGE 將所有分區合並到一個表 
註意:如果導出時使用了TRANSPORTABLE參數,這裏就不能使用NONE和MERGE

4 常用語句示例

  • expdp導出
1)導出表
expdp  tables=dbmon.lihaibo_exp dumpfile=sms.dmp DIRECTORY=dump_dir;
2)並發導出parallel,指定job名
我們需要特別註意一點,parallel 一定要與 dumpfile=...%U.dmp結合 使用,或者有多個表需要同時導出。單表,或者其他諸如network_link方式,指定parallel,也無法開啟並發進程
expdp scott/tiger@orcl directory=dpdata1 dumpfile=scott3%U.dmp parallel=4 job_name=scott3
3)全表
expdp scott/tiger@orcl TABLES=emp,dept dumpfile=expdp.dmp DIRECTORY=dpdata1;
4)導出表,並指定表中的內容
expdp scott/tiger@orcl directory=dpdata1 dumpfile=expdp.dmp Tables=emp query="WHERE deptno=20";
5)導出表空間
expdp system/manager DIRECTORY=dpdata1 DUMPFILE=tablespace.dmp TABLESPACES=temp,example;
6)導出全庫
expdp system/manager DIRECTORY=dpdata1 DUMPFILE=full.dmp FULL=y;
  • impdp導入
1) 全用戶導入
impdp scott/tiger DIRECTORY=dpdata1 DUMPFILE=expdp.dmp SCHEMAS=scott;
2) 用戶對象遷移
impdp system/manager DIRECTORY=dump_dir DUMPFILE=expdp.dmp TABLES=scott.dept REMAP_SCHEMA=scott:system; (SCOTT為原用戶,system為目標用戶)
3) 導入指定表空間
impdp system/manager DIRECTORY=dump_dir DUMPFILE=tablespace.dmp TABLESPACES=example;
4) 全庫導入
impdb system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=y;
5) 表已存在的處理
impdp system/manager DIRECTORY=dump_dir DUMPFILE=expdp.dmp SCHEMAS=system TABLE_EXISTS_ACTION=append;
6) 表空間遷移
impdp system/manager directory=dump_dir dumpfile=remap_tablespace.dmp logfile=remap_tablespace.log remap_tablespace=A:B (A為原表空間名,B為指定的目標表空間名)

5 交互式命令

  1. 連接到對應的job impdp \‘\/ as sysdba\‘ attach=&job_name 不知道job_name 去哪兒找?看上面的參數:job_name
  2. 查看運行狀態: status
  3. 停止導入導出: kill_job(直接kill 掉進程,不自動退出交互模式)
  4. 停止導入導出:stop_job(逐一停止job進程的運行,並退出交互模式)
  5. 修改並發值: parallel
  6. 退出交互模式: exit / exit_client(退出到日誌模式,對job無影響)

6 技巧

6.1 不生成文件直接導入目標數據庫

在一些情況下,我們並沒有足夠的存儲空間允許我們存儲導出的dmp文件。這個時候,我們就無計可施了麽? 不是的。我們可以不生成dmp文件,直接將數據抽取到目標數據。在遷移大量數據而沒有充足存儲空間時,這是一個救命稻草。 最關鍵的點就是在目標端執行impdp的時候,使用network_link,直接從源庫抽取數據。 示例如下:

cat test.par
directory=dump_dir
logfile=test.log
schemas=test
query="where create_date > last_day(add_months(sysdate,-1)) and create_date <= last_day(sysdate)"
transform=segment_attributes:n
network_link=to_aibcrm
table_exists_action=append
impdp \‘\/ as sysdba\‘ parfile=test.par

6.2 通過shell腳本自動導入

此處只關註,impdp 命令在shell腳本中執行,需要轉義的地方。

cat import_sr.sh
#!/bin/sh
cd /u01/app
for da in 2012-10 2013-09 2013-08 2013-07 2013-06 2013-05 2013-04 2013-03 2013-02 2013-01 2012-12 2012-11 2014-08 2014-07 2014-06 2014-05 2014-04 2014-03 2014-02 2014-01 2013-12 2013-11 2013-10 2015-07 2015-06 2015-05 2015-04 2015-03 2015-02 2015-01 2014-12 2014-11 2014-10 2014-09 2016-06 2016-05 2016-04 2016-03 2016-02 2016-01 2015-12 2015-11 2015-10 2015-09 2015-08 2017-05 2017-04 2017-03 2017-02 2017-01 2016-12 2016-11 2016-10 2016-09 2016-08 2016-07;
do
impdp \‘\/ as sysdba\‘ parfile=import_sr.par logfile=sr${da}.log query=\" where create_date\> last_day\(add_months\(to_date\(\‘$da\‘,\‘yyyy-mm\‘\),-1\)\) and create_date \<\=last_day\(to_date\(\‘$da\‘,\‘yyyy-mm\‘\)\)\"
done

-- 參數文件內容
directory=dump_dir
tables=SR.SR_VOUCHER_FILE_tomig
remap_table=sr.SR_VOUCHER_FILE_tomig:sr_his.sr_voucher_file
transform=segment_attributes:n
network_link=to_aibcrm
table_exists_action=append

6.3 如何導出數百張表

include=table:"in (select * from &table_name where_clause)" &table_name :+: 在表裏存儲需要導出的表明細

Author: Halberd E-mail: [email protected] Tel:18258160531

Created: 2017-11-09 Thu 00:18

Emacs 26.0.50.1 (Org mode 8.2.10)

Validate

logical_backup: expdp/impdp