1. 程式人生 > >AIX盤rw_timeout值過小導致IO ERROR

AIX盤rw_timeout值過小導致IO ERROR

oracle 9i 磁盤 weak ora ror tro hat 訪問 錯誤

剛下班沒多久,接收到告警提示數據庫的數據文件異常,且同時收到主機硬盤的IO ERROR告警

該數據庫服務器為AIX+oracle 9i環境,登錄主機驗證關鍵日誌告警

技術分享

發現確實在18點48分有磁盤IO的報錯

從而查看查看存儲和交換機告警信息,都是正常狀態 繼續查看數據庫告警日誌 技術分享 可以看到數據文件45無法正常訪問 從數據庫中查看數據文件狀態 技術分享 該數據文件處於recover狀態 查看數據庫的備份和歸檔都正常,繼續進行數據文件級別的恢復操作 1 recover datafile 45; 2 alter database datafile 45 online;(因為之前做了offline的操作)
數據庫恢復正常 註:恢復操作不能在PLSQL中實施,必須在sqlplus中操作 繼續分析原因: 查看盤的具體報錯信息 技術分享

技術分享

這樣的錯誤,實際上,盤陣上也沒有報硬盤的錯誤,交換機也正常,經過檢查,最後修改了chdev -l hdisk6 -a rw_timeout=1000(這個值有點偏大)解決了此問題.

經過求證,在網上找到一個類似的說明:
Early vendor support recommendation is to increase rw_timeout, as they judge it as characteristic of a long fibre connection, but cables are only 15 metre, and due to its nature, we are loathe to start performing outages just to tweak settings that shouldn‘t be causing issue.

AIX盤rw_timeout值過小導致IO ERROR