Linux高效能叢集搭建(3)---MPICH2安裝測試
注意:保證各節點系統使用者名稱和mpich2安裝路徑檔名相同
一. MPICH安裝
1. 下載MPICH
網址:http://www.mpich.org/static/downloads/
下載 mpich2-1.0.2p1,因為高階版本已經不支援mpd(mpi管理器),可以下載到任意目錄
2、解壓縮
tar -zxvf mpich2-1.0.2p1.tar.gz
3、進入mpich2解壓目錄
cd mpich2-1.0.1
4、設定安裝目錄
./configure
5、編譯
make
6、安裝
make install
7. 測試mpich是否安裝好
which mpicc
which mpirun
which mpiexec
我們這裡是預設安裝, 可以自定義安裝目錄,然後在.bashrc中把mpich安裝檔案的bin新增到環境變數PATH下,然後source .bashrc 執行生效
二. mpd配置
1. 在使用者主目錄下(/home/liu)新建檔案.mpd.conf
mkdir .mdp.conf
在檔案新增 secretword=×××××,×××××為任意字串,各節點保持一致
chmod 600 /home/liu/.mpd.conf
2. 在使用者主目錄下新建檔案 mpd.hosts
內容:
Master
node1
node1
......
3. 測試mpd是否配置好
mpd & (啟動mpi)
mpdtrace (列印啟動mpi機器名)
mpdallexit (退出mpi)
三. 各節點均如此安裝
四. 測試集群系統
1.通過mpd.hosts執行集群系統(在任意節點主目錄下)
mpdboot -n number -f mpd.hosts number為要起動的機器個數
mpdtrace
mpdallexit
2.測試執行MPICH的例子程式
mpdboot -n 4 -f mpd.hosts 啟動4臺機器
mpirun -n number /usr/MPICH-install/examples/cpi number為使用的程序數
mpdallexit
3.如果測試不能通過,請進行第四步問題檢查
五、問題解決
1、通過mpdcheck獲得一寫幫助資訊
mpdcheck -pc
2、查錯
mpdcheck -l
3、通過mpd.hosts檔案查錯
mpdcheck -f mpd.hosts 如果無錯誤
mpdcheck -f mpd.hosts -ssh
4、如果上述無錯誤,可略過此步
對任意兩臺機器進行查錯
m1: mpdcheck -s 輸出主機名host和埠port
m2: mpdcheck -c host port
注意:以上4步都是在沒有執行mpd的情況下進行的
5、mpd查錯
m1: #mpd -e & 返回使用的埠
m2: #mpd -h m1 -p echoed_port_m1 &
注意:有的時候防火牆造成測試不能通過
sudo ufw disable 關閉防火牆
sudo ufw enable 開啟防火牆
以上測試通過,集群系統就建成了。