安装显卡驱动(pt.1)
下载官方显卡驱动(官方下载地址):进入官网后,选择自己的显卡型号和操作系统,下载对应的显卡驱动文件
禁用nouveau驱动:
echo blacklist nouveau >> /etc/modprobe.d/blacklist.conf
echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist.conf
sudo update-initramfs -u
执行完毕后,重启
# 检查nouveau驱动是否禁用,如果没有内容输出,则说明禁用生效
lsmod | grep nouveau
安装Nvidia驱动:打开下载驱动的文件夹
sh ./NVIDIA-Linux-x86_64-525.78.01.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程中,出现下述情景
Install NVIDIA's 32-bit compatibility libraries?
Yes No
(我选的No)
Would you like to register the kernel module sources with DKMS? This will
allow DKMS to automatically build a new module, if you install a different
kernel later.
Yes No
(我选的No)
Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you restart X?
Any pre-existing X configuration file will be backed up.
Yes No
(我选的yes)
安装完成后
# 查看是否安装成功
nvidia-smi
# 如果出现下述内容
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.78.01 Driver Version: 525.78.01 CUDA Version: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:01:00.0 Off | N/A |
| N/A 41C P0 15W / 50W | 0MiB / 4096MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
可能是因为我的电脑的问题,装完之后,重启开机黑屏,不能正常开机,大概率是驱动的问题。如果出现这种情况,别慌(反正我是急了)。你需要将电脑关机,如果不能正常关机,就长按开机键,重新开机,在grub
界面先选择Advanced options for Debian GNU/Linux
这个选项,按回车。j将光标移动到recovery mode
这个选项,按e
键,移动光标到linux
开头的那一行,一般是倒数第三行,在这一行的末尾添加init=/bin/bash
,然后按ctrl+x
或F10
键,就可以进入rescue mode
了
进入之后,输入
# 以读写模式挂载根文件系统
mount -o remount,rw /
# 删除nvidia driver
nvidia-uninstall
重新启动即可,试了好几次,都会出现这种情况,最终我选择妥协,使用别的方法来进行安装。
安装显卡驱动(pt.2)
其实特别简单,在禁用nouveau驱动后,打开终端
su
apt update
apt install nvidia-driver firmware-misc-nonfree
等待执行完毕即可,重启后,输入nvidia-smi
进行验证即可
安装Cuda
进入Cuda的官网(点击进入),选择你要下载的版本(如果你拿不准,可以查看你的驱动版本,选择兼容驱动的版本),我选择的是11.4.4
,然后选择好你的操作系统,架构平台,发行版本,以及版本号和安装方式(我使用的runfile,直接输命令就行)
# 命令由官网生成
wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
sudo sh cuda_11.4.4_470.82.01_linux.run
安装时,不需要在安装显卡驱动,记得取消勾选。安装完成后
vim ~/.bashrc
# 在文件中加入下面两行
export PATH=/usr/local/cuda-11.4/bin:${PATH}
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:${LD_LIBRARY_PATH}
# 保存退出后
source ~/.bashrc
# 验证
nvcc --version
# 如果有版本信息,则安装成功
安装cuDNN
进入cuDNN官网(点击进入),下载相应的deb包即可,注意和Cuda版本匹配,以及选择正确的Linux发行版和版本号,打开下载文件的目录,在此处打开终端
# 将./cudnn-local-repo-debian11-8.6.0.163_1.0-1_amd64.deb换成你下载的包名
sudo apt install ./cudnn-local-repo-debian11-8.6.0.163_1.0-1_amd64.deb
安装Anaconda
进入Anaconda官网(点击进入),找到自己的系统版本,下载安装即可。
linux命令行安装
curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
sh Miniconda3-latest-Linux-x86_64.sh
# 查看协议的时候输入yes,并输入自定义安装的位置即可
安装Pytorch
进入pytorch官网(点击进入),按照自己的环境,选择操作系统,包管理器,编程语言以及cuda版本,将生成的命令复制进终端执行即可。
#如果使用conda管理
#创建虚拟环境
conda create -n torch_env python=3.9 # 官方说python环境必须大于等于3.7.0
#激活虚拟环境
conda activate torch_env
#官网给出的命令安装pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia
验证
# 在pycharm中用创建的conda环境创建一个项目
import torch
# 返回当前设备索引
print(torch.cuda.current_device())
# 返回gpu数量
print(torch.cuda.device_count())
# 返回gpu名称,索引从0开始
print(torch.cuda.get_device_name(0))
# cuda是否可用
print(torch.cuda.is_available())
如果最后一个返回true
,则说明环境配置成功。
参考
How to Boot Debian 11 into Rescue / Emergency Mode
Debian11.1.0安装人工智能深度学习环境(显卡驱动、cuda、cudnn、pytorch)-炼丹人士必看_Madclear的博客-CSDN博客_debian跑深度学习
评论区