DSF服务器cuda驱动

摘要: 在实验室环境中安装CUDA驱动


〓 Table of Contents 〓




问题起源

〓 ReTURN 〓

Q: zxcpu1-4机器上,cuda安装位置是啥地方? 当我想指定一下cuda_home,发现/usr/local没有任何默认的cuda驱动。

解法

A: 都是自己安装的,管理员没有安装默认版本。 安装cuda是可以本地操作的, 先找到nvidia的对应版本driver的cuda 的地址,下载文件,下载之前用google搜索一遍检查是否是最新的:

1
2
3
wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda_12.3.0_545.23.06_linux.run

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run

然后直接执行即可

1
sh cuda_12.3.0_545.23.06_linux.run

然后就会进入配置页面,如果不是sudo,记得一定要修改安装的位置,不是在options里面改,一定是toolkits里面修改



安装流程

〓 ReTURN 〓




环境配置项

1
2
3
4
5
6
7
8
9
10
# CUDA
export PATH="/{你的路径}/cuda-12.3/bin:$PATH"
export LD_LIBRARY_PATH="/{你的路径}/cuda-12.3/lib64:$LD_LIBRARY_PATH"
export CUDA_HOME="/{你的路径}/cuda-12.3"
export CUDA_TOOLKIT_ROOT_DIR=$CUDA_HOME
export LD_LIBRARY_PATH="$CUDA_HOME/extras/CUPTI/lib64:$LD_LIBRARY_PATH"
export LIBRARY_PATH=$CUDA_HOME/lib64:$LIBRARY_PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
export CFLAGS="-I$CUDA_HOME/include $CFLAGS"
export LD_LIBRARY_PATH="$CUDA_HOME/include:$LD_LIBRARY_PATH"

常见问题

〓 ReTURN 〓

显示segment error

运行安装程序后出现报错:

1
2
log file not open.
Segmentation fault(core dumped)

原因: 文件/tmp/cuda-installer.log没有删除, 删除了就好了。

Existing package manager installation of the driver found

如下图所示。 选择continue即可。

作者

Jiawei Li

发布于

2024-06-02

更新于

2024-06-02

许可协议