轉 Oracle Cluster Health Monitor(CHM)簡介

阿新 • • 發佈：2017-11-17

linu dump nload mas inux database tar.gz 命令操作 ogg

Cluster Health Monitor（以下簡稱CHM）是一個Oracle提供的工具，用來自動收集操作系統的資源（CPU、內存、SWAP、進程、I/O以及網絡等）的使用情況。CHM會每秒收集一次數據。這些系統資源數據對於診斷集群系統的節點重啟、Hang、實例驅逐(Eviction)、性能問題等是非常有幫助的。另外，用戶可以使用CHM來及早發現一些系統負載高、內存異常等問題，從而避免產生更嚴重的問題。

CHM默認安裝在以下版本：

11.2.0.2 及更高版本的 Oracle Grid Infrastructure for Linux (不包括Linux Itanium) 、Solaris (Sparc 64 和 x86-64)
11.2.0.3 及更高版本 Oracle Grid Infrastructure for AIX 、 Windows (不包括Windows Itanium)。

CHM服務介紹（以下進程都可以使用ps -ef|grep 命令來查看）：

1、System Monitor Service(osysmond)：這個服務在所有節點都會運行，osysmond會將每個節點的資源使用情況發送給cluster logger service，後者將會把所有節點的信息都接收並保存到CHM的資料庫。

2、Cluster Logger Service(ologgerd)：在一個集群中的，ologgerd 會有一個主機點(master)，還有一個備節點(standby)。當ologgerd在當前的節點遇到問題無法啟動後，它會在備用節點啟用。

我們可以使用命令來查看CHM運行狀態

crsctl stat res -t -init

CHM Repository：用於存放收集到數據，在默認情況下，會存在於Grid Infrastructure home 下，需要1 GB 的磁盤空間，每個節點大約每天會占用0.5GB的空間。您可以使用OCLUMON來調整它的存放路徑以及允許的空間大小(最多只能保存3天的數據。

簡單命令操作：

1、查看當前目錄設置

oclumon manage -get reppath

2、查看當前收集大小（註意單位為秒）

oclumon manage -get repsize

3、修改路徑

oclumon manage -repo reploc /soft/chm/

4、修改大小

oclumon manage -repos resize 60000

獲取CHM數據的方法：

1、使用Grid_home/bin/diagcollection.pl

首先，確定cluster logger service的主節點
1. oclumon manage -get master

用root身份在主節點執行下面的命令

<Grid_home>/bin/diagcollection.pl -collect -chmos -incidenttime inc_time -incidentduration duration

incidenttime是指從什麽時間開始獲得數據，格式為MM/DD/YYYY24HH:MM:SS, incidentduration指的是獲得開始時間後多長時間的數據。
例如：

diagcollection.pl -collect -crshome /u01/app/11.2.0/grid -chmoshome  /u01/app/11.2.0/grid -chmos -incidenttime 06/15/201412:30:00 -incidentduration 00:05

運行這個命令之後，CHM的數據會生成在文件chmosData_rac2_20140615_1237.tar.gz。

2、使用oclumon來獲得CHM數據

oclumon dumpnodeview [[-allnodes] | [-n node1 node2] [-last "duration"] | [-s "time_stamp" -e "time_stamp"] [-v] [-warning]] [-h]
#(-s表示開始時間，-e表示結束時間)

例如：

oclumon dumpnodeview -allnodes -v -s "2012-06-15 07:40:00" -e "2012-06-15 07:57:00" > /tmp/chm1.txt
oclumon dumpnodeview -n node1 node2 -last "12:00:00" >/tmp/chm1.txt
oclumon dumpnodeview -allnodes -last "00:15:00" >/tmp/chm1.txt

關閉以及開啟CHM(使用grid在每個節點執行)

這個關閉類似Linux的service stop，重啟後還會自動打開，關閉後系統IO會有所下降

#關閉
crsctl stop res ora.crf -init
#啟動
crsctl start res ora.crf -init

禁用與啟用CHM（類似chkconfig）使用root用戶

#禁用
crsctl modify resource ora.crf -attr "AUTO_START=never" -init
#啟用
crsctl modify resource ora.crf -attr "AUTO_START=always" -init

參考Oracle官方文檔：
http://docs.Oracle.com/cd/E11882_01/rac.112/e16794/troubleshoot.htm#CWADD92242
Oracle? Clusterware Administration and Deployment Guide
11g Release 2 (11.2)
Part Number E16794-17

My Oracle Support文檔：
Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)

CHM及UI下載地址：
http://www.oracle.com/technetwork/database/clustering/downloads/ipd-download-homepage-087212.html

http://blog.csdn.net/mhmds/article/details/72843249

轉 Oracle Cluster Health Monitor(CHM)簡介

linu dump nload mas inux database tar.gz 命令操作 ogg Cluster Health Monitor（以下簡稱CHM）是一個Oracle提供的工具，用來自動收集操作系統的資源（CPU、內存、SWAP、進程、I/O以及網絡等）的

轉 Oracle Cluster Health Monitor(CHM)簡介

轉 Oracle Cluster Health Monitor(CHM)簡介

ORACLE:Health Monitor

轉://Oracle補丁及opatch工具介紹

轉：Windows Phone 7 設計簡介

[轉][Java]自定義標簽簡介

轉://Oracle A用戶給B用戶授權查詢指定表或視圖權限方案

[轉] Oracle學習之創建數據庫(新建實例)

轉 Oracle最新PSU大搜羅

【轉】Linux下/proc目錄簡介

(轉)oracle視圖詳解

轉://Oracle undo 自動調優

轉 [ORACLE]詳解not in與not exists的區別與用法（not in的性能並不差！）

[轉]Oracle的update語句優化研究

轉://Oracle Golden Gate 概念和原理

[轉]oracle in 多個字段

轉 ORACLE約束總結

(轉)Oracle與DB2在數據庫高可用技術上的相同與差異探討

[轉][Oracle]常見報錯及處理

轉://oracle 軟體的收費模式

oracle 11gR2 ASM新增和刪除磁碟轉 oracle 11gR2 ASM新增和刪除磁碟

轉 Oracle Cluster Health Monitor(CHM)簡介

相關推薦