共计 3407 个字符,预计需要花费 9 分钟才能阅读完成。
MindSpore 1.7 推出一个不便的装置形式,主动装置,试着体验一下官网操作指南链接是:https://www.mindspore.cn/install 我抉择的是 cuda 10.1+py3.7 的版本
- 第一步 依据装置阐明:在应用主动装置脚本之前,须要确保零碎正确装置了 NVIDIA GPU 驱动。CUDA 10.1 要求最低显卡驱动版本为 418.39;CUDA 11.1 要求最低显卡驱动版本为 450.80.02。执行以下指令查看驱动版本。nvidia-smi
确认是 418.39 真好适合 2. 第二步下载安装脚本
在官网解释中,说的是反对 1.6.0 及以上的版本,然而当我抉择 1.6 版本的时候,并没有写着主动装置,这个我也不确定 1.6 支不反对还是依照 1.7 的来获取装置脚本
- 执行脚本发现存在问题:MINDSPORE_VERSION=1.7.0 bash -i ./ubuntu-gpu-pip.shCUDA 11.1 minimum required driver version is 450.80.02, but current nvidia driver version is 418.39, please upgrade your driver manually.
我明明是 cuda10.1, 为什么报 11.1 呢查看脚本发现脚本外面 CUDA_VERSION=${CUDA_VERSION:-11.1} 设置的 cuda 是 11.1,须要手动改成 10.1
- 再次执行脚本
两头有点长,只截局部上面显示装置胜利
上面显示执行脚本胜利
- 最初咱们来剖析下脚本:PYTHON_VERSION=${PYTHON_VERSION:-3.7}MINDSPORE_VERSION=${MINDSPORE_VERSION:EMPTY}CUDA_VERSION=${CUDA_VERSION:-10.1}OPENMPI=${OPENMPI:-off}OPENMPI 为 on 能够主动装置 mpi 然而因为我的机器曾经装置,所以保留原来的 off 看本人机器有没有装置 mpi 能够执行一下 mpirun
下面就代表装置了 inimum_driver_version_map[“10.1”]=”418.39″minimum_driver_version_map[“11.1”]=”450.80.02″ 两个 cuda 别离匹配的显卡驱动版本脚本:# pythonsudo add-apt-repository -y ppa:deadsnakes/ppasudo apt-get install python$PYTHON_VERSION python$PYTHON_VERSION-distutils python3-pip -ysudo update-alternatives –install /usr/bin/python python /usr/bin/python$PYTHON_VERSION 100# pippython -m pip install -U pip -i https://pypi.tuna.tsinghua.edu.cn/simpleecho -e “alias pip=’python -m pip'” >> ~/.bashrcpython -m pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple 通过 APT 装置 Python3 和 pip3 脚本:# install cuda/cudnnecho “installing CUDA and cuDNN”cd /tmpdeclare -A cuda_url_map=()cuda_url_map[“10.1”]=https://developer.download.nvidia.cn/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.runcuda_url_map[“11.1”]=https://developer.download.nvidia.cn/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.runcuda_url=${cuda_url_map[$CUDA_VERSION]}wget $cuda_urlsudo sh ${cuda_url##*/} –silent –toolkitcd -sudo apt-key adv –fetch-keys https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pubsudo add-apt-repository “deb https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu1804/x86_64/ /”sudo add-apt-repository “deb https://developer.download.nvidia.cn/compute/machine-learning/repos/ubuntu1804/x86_64/ /”sudo apt-get updatedeclare -A cudnn_name_map=()cudnn_name_map[“10.1”]=”libcudnn7=7.6.5.32-1+cuda10.1 libcudnn7-dev=7.6.5.32-1+cuda10.1″cudnn_name_map[“11.1”]=”libcudnn8=8.0.4.30-1+cuda11.1 libcudnn8-dev=8.0.4.30-1+cuda11.1″sudo apt-get install –no-install-recommends ${cudnn_name_map[$CUDA_VERSION]} - y 解析:下载 CUDA 和 cuDNN 并装置脚本:sudo apt-get install curl make gcc-7 libgmp-dev linux-headers-“$(uname -r)” - y 解析:装置 gcc gmp 脚本:set +e && source ~/.bashrcset -eadd_env PATH /usr/local/cuda/binadd_env LD_LIBRARY_PATH /usr/local/cuda/lib64add_env LD_LIBRARY_PATH /usr/lib/x86_64-linux-gnuset +e && source ~/.bashrc 解析:增加 cuda 到环境变量 if [[X”$OPENMPI” == “Xon”]]; then echo “installing openmpi” cd /tmp curl -O https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.3.tar.gz tar xzf openmpi-4.0.3.tar.gz cd openmpi-4.0.3 ./configure –prefix=/usr/local/openmpi-4.0.3 make sudo make install add_env PATH /usr/local/openmpi-4.0.3/bin add_env LD_LIBRARY_PATH /usr/local/openmpi-4.0.3/libfi 若是 OPENMPI=on 就是装置 mpirunarch=
uname -m
python -m pip install https://ms-release.obs.cn-north-4.myhuaweicloud.com/${MINDSPORE_VERSION}/MindSpore/gpu/${arch}/${cuda_name}/mindspore_gpu-${version_map[“$PYTHON_VERSION”]}-linux_${arch}.whl –trusted-host ms-release.obs.cn-north-4.myhuaweicloud.com -i https://pypi.tuna.tsinghua.ed… 装置匹配的 whl 包最初装置和执行胜利