vGPU 用户驱动安装+授权配置指南

滴滴云技术支持发表于:2020年03月05日 11:46:14更新于:2020年04月02日 14:58:48

一、说明

Nvidia vGPU 需要配置授权(License)才能正常工作。用户可以选择购买官方授权(入口)或者申请 90 天试用版授权(入口)。

为了加快客户验证流程,滴滴云也提供临时测试授权,具体配置信息请咨询滴滴云工作人员。

二、配置步骤

1、登录 vGPU 云主机

可以使用熟悉的 ssh 工具登录;

2、安装 vGPU 驱动

如果创建 vGPU 云主机时选择了带 vGPU 驱动的镜像,可跳过该步。

如果使用了标准镜像,则需要运行以下脚本:

CentOS:

sudo yum -y install gcc gcc-c++ kernel-headers kernel-devel
wget http://mirrors.intra.didiyun.com/gpu_resource/NVIDIA-Linux-x86_64-430.30-grid.run
chmod 755 NVIDIA-Linux-x86_64-430.30-grid.run
sudo ./NVIDIA-Linux-x86_64-430.30-grid.run -s
sudo nvidia-smi -pm 1

Ubuntu:

sudo apt install -y gcc g++ build-essential linux-headers-$(uname -r)
wget http://mirrors.intra.didiyun.com/gpu_resource/NVIDIA-Linux-x86_64-430.30-grid.run
chmod 755 NVIDIA-Linux-x86_64-430.30-grid.run
sudo ./NVIDIA-Linux-x86_64-430.30-grid.run -s 
sudo nvidia-smi -pm 1

安装好驱动的实例上,运行 nvidia-smi 可以打印 vGPU 信息,如下图:

0015e60762229245d7a8a16facb57cb

如果未能正常打印以上信息,请检查驱动安装过程或查看镜像是否选错。

注意:vGPU 实例不能安装普通 GPU 驱动!

3、修改 /etc/nvidia/gridd.conf

cd /etc/nvidia/
sudo cp gridd.conf.template gridd.conf
sudo chmod a+w gridd.conf

编辑 gridd.conf,其中 “ServerAddress=” 改为 “ServerAddress=你的LicenseServer IP” 

“ServerPort=” 改为 “ServerPort=你的 LicenseServer Port”(默认 7070)

 “FeatureType=” 改为 “FeatureType=4”(计算型实例) 或 “FeatureType=2” (渲染型实例)

其中 License Server IP 根据实际情况配置,例如已经购买 Nvidia 授权或已申请 90 天试用版的用户可以通过官网下载授权文件并自己搭建 License Server; 如果希望快速验证,可联系滴滴云工作人员获取临时测试授权。 

注意:临时测试授权仅供评估用途,不能用于生产任务。

配置完毕,重启下 nvidia-gridd 服务:

sudo systemctl restart nvidia-gridd
sudo systemctl status nvidia-gridd

0015e6077615d905337d8361b44348d

以上信息显示授权获取成功。

4、验证

用户可以通过运行 CUDA 程序验证授权是否获取成功。 安装 CUDA 时可以选择安装例程,默认路径为 /usr/local/cuda/samples/,我们选择其中较为常用的例程 /usr/local/cuda/samples/7_CUDALibraries/batchCUBLAS。

cd /usr/local/cuda/samples/7_CUDALibraries/batchCUBLAS
sudo make
./batchCUBLAS -m2048 -n2048 -k2048

正常运行结果:

0015e6077854f058aa907ef9426e7f5