1. 程式人生 > >配置google cloud

配置google cloud

自己的筆記本跑CNN感覺要炸了,於是想到配置個谷歌雲,還有300刀的免費額度,至少可以寫完論文了吧。
於是開始摸索,在網上找了一些教程,然後發現其實配置谷歌雲伺服器做深度學習,就是先在谷歌裡建立一個例項(可以理解為一個主機),然後裝一個Xshell讓自己的電腦可以遠端控制這臺主機,然後接下來的工作就像我們自己裝電腦一樣,給自己建立的例項裝驅動、裝自己需要的軟體……

先說自己的配置:
1個CPU
6.5GB記憶體
100GB的磁碟
1個GPU,型號是 NVIDIA Tesla K80
作業系統是 Ubuton 16.04LIS

關於這些的選擇,主要是為了學生黨為了省錢,如果經費充足可以自己往上加啦,谷歌會在頁面提示配置需要多少錢的,自己酌情考慮。
作業系統最好選擇主流的作業系統,剛開始沒注意選了18.04,導致裝驅動的時候看別人的教程給裝錯了,折騰了很久,主流的作業系統可以找到很多別人的成功案例,方便借鑑。
以及python版本的安裝不要安裝太新太前衛的版本,本人剛開始沒注意撞了3.7,等到要裝tensorflow的時候才發現不相容,裝不進去,只能解除安裝了重灌,來來回回折騰了很久。。

整個流程主要參考簡書 https://www.jianshu.com/p/893d622d1b5a?tdsourcetag=s_pctim_aiomsg
這篇文章真的寫的很好很詳細
其中GPU型號與我選擇的不一樣,安裝GPU驅動的時候需要特別注意一下

建立例項

具體流程參考以下兩個連結,講的都很詳細。
https://www.jianshu.com/p/893d622d1b5a?tdsourcetag=s_pctim_aiomsg
https://zhuanlan.zhihu.com/p/26419429

建立ssh

還是參考簡書的這篇,寫的真的很贊
https://www.jianshu.com/p/893d622d1b5a?tdsourcetag=s_pctim_aiomsg


關於其中提到的如何設定外部IP可以看這個補充資料
如何設定外部IP

安裝GPU驅動

依次輸入以下命令:
curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub


sudo apt-get update
sudo apt-get install cuda-9-0
以上參考https://cloud.google.com/compute/docs/gpus/add-gpus#verify-driver-install
用 nvidia-smi 測試是否安裝成功

安裝cuDNN7.1

wget https://s3.amazonaws.com/open-source-william-falcon/cudnn-9.0-linux-x64-v7.1.tgz
sudo tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

以上參考https://github.com/williamFalcon/tensorflow-gpu-install-ubuntu-16.04

裝python, tensorflow....

一定不要裝python 3.7
tensorflow截止目前2018.10.18還不支援