解决报错 pynvml.NVMLError_LibraryNotFound: NVML Shared Library Not Found

在 Windows 下微调大模型训练结束时,出现了一个关于 NVML 的报错。

FileNotFoundError: Could not find module 'C:\Program Files\NVIDIA Corporation\NVSMI\nvml.dll' (or one of its dependencies). Try using the full path with constructor syntax.
pynvml.NVMLError_LibraryNotFound: NVML Shared Library Not Found

可以发现是因为缺少 nvml.dll 文件。

解决方案:

where nvidia-smi
C:\Windows\System32\nvidia-smi.exe

查看 nvidia-smi 的安装路径,在此路径下会有 nvml.dll 文件,只需要在 C:\Program Files\NVIDIA Corporation\ 下创建 NVSMI 目录,然后把 nvml.dll 文件 copy 过去即可。

这个解决方法的前提是已经安装好 CUDA 和 nvidia-smi

暂无评论

发送评论 编辑评论


				
上一篇
下一篇