1. 程式人生 > >Linux高效能叢集搭建(3)---MPICH2安裝測試

Linux高效能叢集搭建(3)---MPICH2安裝測試

注意:保證各節點系統使用者名稱和mpich2安裝路徑檔名相同

一. MPICH安裝

1. 下載MPICH

     網址:http://www.mpich.org/static/downloads/

     下載 mpich2-1.0.2p1,因為高階版本已經不支援mpd(mpi管理器),可以下載到任意目錄

2、解壓縮
      tar -zxvf mpich2-1.0.2p1.tar.gz

3、進入mpich2解壓目錄
      cd mpich2-1.0.1

4、設定安裝目錄
      ./configure

5、編譯
      make

6、安裝
      make install

7.   測試mpich是否安裝好

      which mpicc

      which mpirun

      which mpiexec

我們這裡是預設安裝, 可以自定義安裝目錄,然後在.bashrc中把mpich安裝檔案的bin新增到環境變數PATH下,然後source .bashrc 執行生效

二. mpd配置

1.   在使用者主目錄下(/home/liu)新建檔案.mpd.conf

      mkdir .mdp.conf

      在檔案新增 secretword=×××××,×××××為任意字串,各節點保持一致

     chmod 600 /home/liu/.mpd.conf

2.   在使用者主目錄下新建檔案 mpd.hosts

       內容:

       Master

       node1

       node1

       ......

3.   測試mpd是否配置好

       mpd &    (啟動mpi)

       mpdtrace   (列印啟動mpi機器名)

       mpdallexit (退出mpi)

三.   各節點均如此安裝

四.   測試集群系統

      1.通過mpd.hosts執行集群系統(在任意節點主目錄下)
          mpdboot -n number -f mpd.hosts        number為要起動的機器個數
          mpdtrace
          mpdallexit

      2.測試執行MPICH的例子程式
          mpdboot -n 4 -f mpd.hosts   啟動4臺機器
          mpirun -n number /usr/MPICH-install/examples/cpi     number為使用的程序數
          mpdallexit

      3.如果測試不能通過,請進行第四步問題檢查

五、問題解決

1、通過mpdcheck獲得一寫幫助資訊
      mpdcheck -pc

2、查錯
       mpdcheck -l

3、通過mpd.hosts檔案查錯
       mpdcheck -f mpd.hosts 如果無錯誤
       mpdcheck -f mpd.hosts -ssh

4、如果上述無錯誤,可略過此步
      對任意兩臺機器進行查錯
      m1: mpdcheck -s 輸出主機名host和埠port
      m2: mpdcheck -c host port

      注意:以上4步都是在沒有執行mpd的情況下進行的

5、mpd查錯
      m1: #mpd -e & 返回使用的埠
      m2: #mpd -h m1 -p echoed_port_m1 &

注意:有的時候防火牆造成測試不能通過

       sudo ufw  disable  關閉防火牆 

       sudo ufw  enable   開啟防火牆

以上測試通過,集群系統就建成了。