這篇文章帶給大家的內容是關於如何按照創建ECS實例的描述創建GPU計算型實例,有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。
GPU計算類型實例包括gn4、gn5、gn5i和gn6v。
建立實例
您可以依照 建立ECS實例 的說明建立GPU運算型實例,建立時需要注意下列配置。
地域:不同的實例規格族供應的地域資訊不同。如下圖所示:
gn4:華北2(可用區A)、華東2(可用區B)、華南1(可用區C)
gn5:華北2(可用區C、 E)、華北5(可用區A)、華東1(可用區G、F)、華東2(可用區D、B、E)、華南1(可用區D)、香港(可用區C、B)、亞太東南1(可用區B、A)、亞太東南2(可用區A)、亞太東南3(可用區A)、亞太東南5(可用區A)、美國西部1(可用區B、A)、美國東部1(可用區B、A)、歐洲中部1(可用區A)
說明
如果您要在gn5實例上部署NGC(NVIDIA GPU CLOUD)環境,選擇地域時請參閱在gn5實例上部署NGC環境。
gn5i:華北2(可用區C、E、A)、華東1(可用區B)、華東2(可用區D、B)、華南1(可用區A)
#gn6v:華東2(可用區F)
如果ECS建立頁面顯示的地域和可用區資訊與上述描述不符,以ECS建立頁面上顯示的資訊為準。
鏡像:
如果您需要安裝GPU驅動程式和CUDA庫,可以選擇以下任一種方式:
選擇系統映像中的CentOS 64位元(目前提供的所有版本都支援)、Ubuntu16.04 64位元或SUSE Linux Enterprise Server 12 SP2 64位元鏡像,並選擇自動安裝GPU驅動程式。再選擇所需的CUDA庫和GPU驅動的版本。
說明
您可以依照您的業務需求選擇合適的GPU驅動程式版本。如果是新業務系統,建議您在下拉式選單中選擇最新的GPU驅動版本。
如果選擇 自動安裝GPU驅動,系統配置 的 高級選項 中會自動產生 實例自訂數據,即自動安裝CUDA庫和GPU驅動的shell腳本。實例第一次啟動後,cloud-init會自動執行腳本,自動安裝GPU驅動。更多信息,請參閱 自動安裝GPU驅動腳本注意事項。
選擇 鏡像市場,並搜尋 NVIDIA,在搜尋結果中選擇所需的鏡像。目前只支援CentOS 7.3和Ubuntu 16.04。
如果GPU運算型實例要用於深度學習,可以選擇預先安裝深度學習框架的鏡像:選擇 鏡像市場,並蒐索 深度學習,在搜尋結果中選擇所需的鏡像。目前只支援Ubuntu 16.04和CentOS 7.3。
除上述以外的其他鏡像,實例建立完成後,自行 下載並安裝GPU驅動程式。
執行個體:選擇 異質運算GPU/FPGA > GPU運算型,依需求選擇適當的執行個體規格。
網路:選擇 專有網路。
公網頻寬:根據您的實際需求選擇頻寬。
說明
如果使用Windows 2008 R2映像,GPU驅動程式安裝生效後,您不能使用控制台的遠端連線功能連接GPU計算實例,所以,您必須選擇指派公網IP地址,或建立實例後綁定雲端資源。
登入憑證:根據實際需求設定登入憑證。
說明
建議您不要選擇 建立後設定。實例建立成功後,GPU驅動程式安裝成功之前,如果您需要登入實例,必須重設密碼或綁定SSH金鑰對,需要重新啟動實例使修改生效,而重新啟動操作會導致GPU驅動程式安裝失敗。
實例自訂資料:如果選擇了 自動安裝GPU驅動,這裡會顯示自動安裝CUDA庫和GPU驅動程式的shell腳本。請您仔細閱讀腳本內容和注意事項。
查看自動安裝GPU驅動程式
如果您選擇了自動安裝GPU驅動,實例建立完成後,您可以遠端連線實例,透過安裝日誌/root/ nvidia_install.log查看GPU驅動程式的安裝程序。
說明
GPU驅動程式安裝完成前,您無法操作GPU,也無法安裝其他GPU相關軟體,以免自動安裝失敗。
下載並安裝GPU驅動程式
如果使用沒有預先安裝GPU驅動程式的映像,您必須為實例安裝GPU驅動程式。操作步驟如下:
取得GPU驅動安裝套件:
#進入 NVIDIA 官網。
手動尋找適用於實例的驅動程序,並按一下 搜尋。篩選資訊說明如下表所示。
確認無誤後,按一下 下載 按鈕。
安裝GPU驅動程式:
Windows實例:直接雙擊安裝GPU驅動程式。
Linux實例:依照下列步驟安裝驅動程式
下載並安裝kernel對應版本的kernel-devel和kernel-header套件。
執行以下指令,確認已經完成下載並安裝kernel-devel和kernel-header套件:
sudo rpm -qa | grep $(uname -r)
以CentOS 7.3為例,如果出現以下類似訊息,表示已經完成安裝。
kernel-3.10.0-514.26.2.el7.x86_64 kernel-headers-3.10.0-514.26.2.el7.x86_64 kernel-tools-libs-3.10.0-514.26.2.el7.x86_64 python-perf-3.10.0-514.26.2.el7.x86_64 kernel-tools-3.10.0-514.26.2.el7.x86_64
按NVIDIA官網GPU驅動程式下載頁的 其他資訊 說明安裝GPU驅動程式。
以Linux 64-bit Ubuntu 14.04為例:
安裝GRID驅動程式
如果gn5、gn5i或gn6v實例需要支援OpenGL圖形顯示,必須安裝GRID驅動,具體操作,請參閱在GPU實例中安裝GRID驅動程式。
注意事項
遠端連線功能
對於Windows 2008 R2及以下版本,GPU驅動程式安裝生效後,控制台的遠端連線功能不可用,管理終端機會始終顯示黑屏或停留在啟動介面。請您透過其他協定進入系統,如Windows自帶的遠端連線(RDP)。
Windows自帶的遠端連線(RDP)協定不支援DirectX、OpenGL等相關應用,您需自行安裝VNC服務和用戶端,或其他支援的協議,例如PCOIP、XenDeskop HDX 3D等。
自動安裝GPU驅動程式腳本
關於自動安裝GPU驅動程式的shell腳本,注意事項如下:
此腳本會自動下載並安裝NVIDIA GPU的驅動程式和CUDA庫。
因實例規格的內部網路頻寬和vCPU核數不同,實際自動安裝時間為4.5分鐘 ~ 10分鐘不等。安裝GPU驅動時,您無法操作GPU,也無法安裝其他GPU相關軟體,以免自動安裝失敗。
自動安裝結束後,實例會自動重啟,使驅動生效。
腳本會自動開啟GPU驅動的 Persistence Mode,並將此設定加入系統自啟動腳本中,確保實例重新啟動後還能預設開啟該模式。此模式下GPU驅動工作較穩定。
更換作業系統 時:
如果原來的鏡像是Ubuntu16.04 64位元或SUSE Linux Enterprise Server 12 SP2 64位,換成其他鏡像後,無法自動安裝GPU驅動程式。
如果原來的鏡像是CentOS的某個版本,換成其他版本的CentOS映像後,GPU驅動程式能正常安裝。
如果換成其他不支援自動安裝GPU驅動程式腳本的鏡像,無法自動安裝GPU驅動程式。
安裝過程中會產生對應的安裝日誌,日誌存放路徑為 /root/nvidia_install.log。您可以透過日誌查看驅動程式安裝是否成功。如果失敗,您可以透過日誌查看失敗原因。
以上是如何依照建立ECS實例的說明建立GPU計算型實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!