https://pytorch.org/get-started/locally/
1. 概念
GPU(图形处理单元)是执行并行计算的硬件。
- 具有不同的型号,例如GeForce RTX 3080、Tesla V100等
- https://www.topcpu.net/gpu-r/fp32-float
CUDA是NVIDIA 提供的并行计算软件平台,使开发者能够利用 GPU 的强大计算能力
- 每个GPU设备都需要安装合适版本的CUDA(通常指CUDA Toolkit)
- 可通过
nvidia-smi
命令查找,如下图表示当前GPU驱动支持的最大CUDA版本为12.2(可向下兼容)
nvidia-smi
shows the highest version of CUDA supported by your driver.https://stackoverflow.com/questions/53422407/different-cuda-versions-shown-by-nvcc-and-nvidia-smi
(但后来发现有时安装12.4的cuda也依旧可以进行pytorch运算)
PyTorch 是一个开源的深度学习框架
- CUDA 是连接 PyTorch 和 GPU 的桥梁。PyTorch 可利用 CUDA 将计算任务放到 GPU,从而加速深度学习模型的训练和推理。
- Pytorch的版本与CUDA的版本也要匹配,每个Pytorch版本可以支持多个CUDA版本,具体可查看 https://pytorch.org/get-started/previous-versions/
2. 安装顺序
- 首先检查当前服务器,有无GPU设备,以及型号数量,支持的CUDA版本等信息,
|
|
- 然后根据上述信息,安装合适版本的cuda-toolkit (optional but recommended)
|
|
- 最后,安装合适版本的Pytorch框架(一般已包含cuda和cudnn)
|
|
- 检查上述是否安装成功
|
|