Oracle告警日誌介紹
告警日誌介紹
告警日誌檔案是一類特殊的跟蹤檔案(trace file)。告警日誌檔案命名一般為alert_<SID>.log,其中SID為ORACLE資料庫例項名稱。資料庫告警日誌是按時間順序記錄message和錯誤資訊。
告警日誌位置
在ORACLE 10g中,BACKGROUND_DUMP_DEST引數確定了告警日誌的位置,但是告警日誌的檔名無法修改,告警日誌的名稱為:alert_<SID>.log ,其中<SID>是例項的名稱。BACKGROUND_DUMP_DEST引數是動態的。
SQL> show parameter background_dump_dest;
NAME TYPE VALUE
--------------------- ----------- ------------------------------
background_dump_dest string /u01/app/oracle/admin/GSP/bdump
SQL>
告警日誌以及所有後臺跟蹤檔案都會被寫至BACKGROUND_DUMP_DEST引數所指定的目錄。
在ORACLE 11g 以及ORACLE 12c中,告警日誌檔案的位置有了變化。主要是因為引入了ADR(Automatic Diagnostic Repository:一個存放資料庫診斷日誌、跟蹤檔案的目錄),關於ADR對應的目錄位置可以通過檢視v$diag_info系統檢視。如下所示(ORACLE 12c )
SQL> select * from v$diag_info;
INST_ID NAME VALUE CON_ID
------- -------------------- -------------------------------------------------- -------
1 Diag Enabled TRUE 0
1 ADR Base /u01/app/oracle 0
1 ADR Home /u01/app/oracle/diag/rdbms/ignite/epps 0
1 Diag Trace /u01/app/oracle/diag/rdbms/ignite/epps/trace 0
1 Diag Alert /u01/app/oracle/diag/rdbms/ignite/epps/alert 0
1 Diag Incident /u01/app/oracle/diag/rdbms/ignite/epps/incident 0
1 Diag Cdump /u01/app/oracle/diag/rdbms/ignite/epps/cdump 0
1 Health Monitor /u01/app/oracle/diag/rdbms/ignite/epps/hm 0
1 Default Trace File /u01/app/oracle/diag/rdbms/ignite/epps/trace/epps_ 0
ora_13810.trc
1 Active Problem Count 0 0
1 Active Incident Coun 0 0
t
11 rows selected.
如上所示,Diag Trace對應的目錄為文字格式的告警日誌檔案所在的目錄,而Diag Alert對應的目錄為XML格式的警告日誌(對應為log_x.xml)
[[email protected] trace]$ pwd
/u01/app/oracle/diag/rdbms/ignite/epps/trace
[[email protected] trace]$ ls alert_epps.log
alert_epps.log
[[email protected] trace]$ cd ../alert/
[[email protected] alert]$ pwd
/u01/app/oracle/diag/rdbms/ignite/epps/alert
[[email protected] alert]$ ls
log_1.xml log_2.xml log_3.xml log_4.xml log_5.xml log_6.xml log_7.xml log_8.xml log_9.xml log.xml
告警日誌內容:
那麼告警日誌非常關鍵與重要,那麼告警日誌裡面包含了那些內容資訊呢?告警日誌包含了下面一些內容的資訊。像一些ORA錯誤,對於監控資料庫有極其重要的作用。
1:所有的內部錯誤(ORA-600)資訊,塊損壞錯誤(ORA-1578)資訊,以及死鎖錯誤(ORA-60)資訊等。
2:管理操作,例如CREATE、ALTER、DROP語句等,以及資料庫啟動、關閉以及日誌歸檔的一些資訊。
2.1 涉及物理結構的所有操作:例如建立、刪除、重新命名資料檔案與聯機重做日誌檔案的ALTER DATABASE命令,此外還涉及重新分配資料檔案大小以及將資料檔案聯機與離線的操作。
2.2 表空間操作,例如DROP與CREATE命令,此外還包括為了進行使用者管理的備份而將表空間置入和取出熱備份模式的操作
3:與共享伺服器或排程程序相關功能的訊息和錯誤資訊。
4:物化檢視的自動重新整理過程中出現的錯誤。
5:動態引數的修改資訊。
告警日誌監控:
既然告警日誌如此重要,而我們也不可能隨時手工去檢視告警日誌檔案,那麼我們就必須監控告警日誌,那麼監控告警日誌有哪些方案呢?下面歸納一下
方案1:Tom大師給出的一個方案(僅適用於ORACLE 10g),將告警日誌檔案資訊讀入全域性臨時表,然後我們就可以定製一些SQL語句查詢告警日誌的資訊。
create global temporary table alert_log
( line int primary key,
text varchar2(4000)
)
on commit preserve rows
/
create or replace procedure load_alert
as
l_background_dump_dest v$parameter.value%type;
l_filename varchar2(255);
l_bfile bfile;
l_last number;
l_current number;
l_start number := dbms_utility.get_time;
begin
select a.value, 'alert_' || b.instance || '.log'
into l_background_dump_dest, l_filename
from v$parameter a, v$thread b
where a.name = 'background_dump_dest';
execute immediate
'create or replace directory x$alert_log$x as
''' || l_background_dump_dest || '''';
dbms_output.put_line( l_background_dump_dest );
dbms_output.put_line( l_filename );
delete from alert_log;
l_bfile := bfilename( 'X$ALERT_LOG$X', l_filename );
dbms_lob.fileopen( l_bfile );
l_last := 1;
for l_line in 1 .. 50000
loop
dbms_application_info.set_client_info( l_line || ', ' ||
to_char(round((dbms_utility.get_time-l_start)/100, 2 ) )
|| ', '||
to_char((dbms_utility.get_time-l_start)/l_line)
);
l_current := dbms_lob.instr( l_bfile, '0A', l_last, 1 );
exit when (nvl(l_current,0) = 0);
insert into alert_log
( line, text )
values
( l_line,
utl_raw.cast_to_varchar2(
dbms_lob.substr( l_bfile, l_current-l_last+1,
l_last ) )
);
l_last := l_current+1;
end loop;
dbms_lob.fileclose(l_bfile);
end;
/
但是這又一個問題,如果資料庫宕機了的情況下,是無法獲取這些錯誤資訊,比方案3(從作業系統監控告警日誌)對比,有些特定場景不適用。另外有一定不足之處,就是日誌檔案比較大的時候,監控告警日誌資訊比較頻繁的時候,會產生不必要的IO操作。
方案2:通過外部表來檢視告警日誌檔案的內容。相當的方便。然後也是使用定製SQL語句來查詢錯誤資訊。
SQL> create or replace directory bdump as '/u01/app/oracle/admin/GSP/bdump';
Directory created.
SQL> create table alert_logs
2 (
3 text varchar2(2000)
4 )
5 organization external
6 (
7 type oracle_loader
8 default directory bdump
9 access parameters
10 (
11 records delimited by newline
12 fields
13 reject rows with all null fields
14 )
15 location
16 (
17 'alert_GSP.log'
18 )
19 )
20 reject limit unlimited;
Table created.
SQL> select * from alert_logs;
TEXT
--------------------------------------------------------------------------------
Thu Aug 7 14:50:28 2014
Thread 1 advanced to log sequence 14
Current log# 1 seq# 14 mem# 0: /u01/app/oracle/oradata/GSP/redo01.log
SQL>
方案3:我以前一篇部落格歸檔—監控ORACLE資料庫告警日誌裡面介紹瞭如何對告警日誌進行歸檔、監控。這些指令碼也確實很有效的替我監控著資料庫的執行。
告警日誌歸檔
告警日誌如果不及時歸檔,時間長了,告警日誌檔案會變得非常大,檢視、讀取告警日誌會引起額外的IO開銷。所以一般應該按天歸檔告警日誌檔案,保留一段時間(例如 90天),超過規定時間的刪除。
告警日誌是否可以刪除呢? 以前有位同事說background_dump_dest目錄下的跟蹤檔案除了告警日誌外都能刪除,如果刪除告警日誌檔案有可能會產生意想不到的錯誤,我半信半疑,在測試伺服器刪除告警日誌,驗證後發現沒有什麼影響,系統會重新生成告警日誌檔案(時間上不會立即生成告警日誌檔案,而是當程序向告警日誌寫入記錄時就會生成新的告警日誌檔案)。
參考資料:
https://asktom.oracle.com/pls/asktom/f?p=100:11:0::::P11_QUESTION_ID:1352202934074