说来十分的难绷,本人在配置环境的过程中几乎花了整整半天,是什么使得配置环境这件事情如此复杂抽象呢,且听我细细道来。

CUDA软件是英伟达开发的GPU计算调用的专门软件,但是入门门槛是比较高的,pytorch是深度学习的最主要的开发软件包之一。

在配置之前首先要确保自己的电脑装有英伟达显卡,怎么看呢,可以在自己显示器驱动栏里面找找但凡标有Intel的那是核心显卡,不是独立显卡,要确保装的英伟达显卡至少是3060以上的版本。我就犯过如此唐氏的错误,我曾经在我的原来的联想小新上花费了两天的时间,先是卸载了以前装的ubuntu双系统,因为当时安装的时候没有规划好空间导致装不下cuda,在花了很多的时间重新装了一遍系统又在BIOS启动界面的配置犯了很多错误又安装了CUDA for ubuntu后,又发现版本不对,回过头去改,这时候我看到一篇帖子想起没检查自己电脑装没装英伟达显卡,再回去看的时候才发现我电脑就没英伟达显卡,数日的功夫全部付诸东流。大家不要笑话我,我是微电子专业的,学这些全靠自己,白手起家。

我随后重新买了一台电脑,是机械革命,装了16GB内存的英伟达4060RTX,这时候才放心去继续下一步的工作。首先要安装anaconda软件。

anaconda软件可以建设多个python版本的环境,这对于要从事多元工作的人是必须的,python版本更新很快,我上大学的时候是2022年秋,当时还是python3.7,现在都到python3.13了,不同python版本之间差的挺多的。

需要同时保证python,pytorch,cudnn,cuda四个软件的版本相互协调,还是比较麻烦的,我在这里直接给出我的亲测成功的一种版本搭配。

1.python版本不要选择太新的,选择3.8即可,在conda中创建环境完成后,需要继续在该环境中安装pytorch.

2.pytorch版本选择1.12.0,具体搭配可以参考pytorch官网往期版本。

Previous PyTorch Versions | PyTorch

pytorch安装命令行如下:

pip install torch==1.12.0+cu116 torchvision==0.13.0+cu116 torchaudio==0.12.0 --extra-index-url https://download.pytorch.org/whl/cu116

3.cuda版本也不可选择太新的,很多显卡都是向下兼容的,也就是说太高版本的cuda很可能是无法支持的,而且cuda版本太新也和业界主流不符合。cuda我选择的是11.6

4.cudnn这个我选择的版本是8.5.0,要和cuda匹配。

cuDNN 9.6.0 Downloads | NVIDIA Developer

可以参考b站上的具体教程来安装以上四个软件,python在conda中新建一个环境即可。

此外我安装pytorch这一项东西就花了三个多小时,具体的原因就是没有换源导致的,国内比较流行的有清华源,经过实际探测,在清华源里面确实是有符合以上cuda,python,cudnn的pytorch软件资源的,换源是比较麻烦的,可以尝试一下.

安装好后就可以切换到创建的conda环境中测试了,实测是有效的,测试代码如下:可以测试出来安装的英伟达GPU的数目.

import torch

# 检查CUDA是否可用
if torch.cuda.is_available():
 print("CUDA is available. Number of GPUs:", torch.cuda.device_count())
else:
 print("CUDA is not available.")

测试结果如下:

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐