一些集群操作以及問題查詢
linux 系統和機器指標相關
1. 查看機器的性能常用的命令
查看機器磁盤使用: df -h
查看 機器中占用磁盤最多的一個文件夾 : du -s * | sort -nr | head
查看當前目錄下的所有文件占用磁盤大小和總大小 du -ach *
查看當前目錄總大小 du -sh
查看所有子目錄大小 du -sh *
查看機器核數 lscpu
2. 批量處理機器
dsh命令,比如 做一些降級操作
dsh -M -r ssh -g ip_list "sh xxx.sh " 運行ip_list中的所有機器去執行 命令。
for ip in `cat ip_list`;do scp ./xxx $ip:/export/App/.xxx;done
需要註意:用dsh 命令時, -g groupname:指定需要執行指定命令的計算機組,主機名組在$HOME/.dsh/group/目錄是定義,每個計算機組一個文件,文件名即是組外,在文件中每行一個計算機IP地址。必須是在那個$HOME/.dsh/group/目錄下定義ip_list
3.
用pstack 和 strace分析程序在哪裏耗時?
ps 查找進程的pid ps -aux | grep nws
pstack 打印進程或者線程的棧信息 pstack 171211
strace 統計每一步系統調用花費的時間 strace -o output.txt -T -tt -e trace=all -p 171264 nws進程中的171264線程進行系統調用跟蹤, 將輸出的信息保存在output.txt中
一些集群操作以及問題查詢