我按照文章《基于NVIDIA GeForce MX150 的Windows10安装TensorFlow-GPU详解》中的内容进行安装,但是碰到了一些问题。
- 首先是安装的选择问题,文中选择的是自定义安装,但是取消了 NVIDIA GeForce Experience... 的安装。我也不知道这个组件是干嘛用的,所以我没取消它,但是我取消了 CUDA 下的 Visual Studio Integration,因为我不使用 VS;
- 按照以上操作,我安装失败了。我上网搜了一下,我发现可能是我 NVIDIA 版本的问题,所以建议下载驱动精灵,它会自动升级你的版本,我从 9.1 升级到了 10.0;
- 再去 CUDA 官网下载新版本的 NVIDIA 安装;
- 但是更新完毕之后,NVIDIA 控制面板不见了!参考这篇文章将服务开启就可以了;
- 这次再根据以上的步骤安装,安装成功了。
安装完 CUDA 后,根据文章中的说法,cuDNN 可以在 GPU 的基础上再次提速 1.5 倍速。然而必须在 NVIDIA 注册账户才能安装 cuDNN 。这里有个坑需要注意:在注册时,有一个选项是“请向我发送 NVIDIA 的开发人员最新动态、公告及更多内容。我可以随时取消订阅。”这个选项不能勾选,否则无法注册。
总之,这个注册挺麻烦的。
还有一点,上面的文章对于安装 cuDNN 写得不太好,可以参考这篇。
安装完上面的软件之后,发现还是不能使用 gpu 版的 pytorch,可能是因为电脑上的 pytorch 是 cput 版的。所以将原先的 pytoch 删除,重新下载一个。
访问 pytorch 官网,按照你想要的配置获取下载链接。有一点需要注意,你获取到的链接末尾有代码 -c pytorch
,这意味着你不会从你设置的镜像中获取下载链接,导致下载极卡,所以只需要去掉这段代码即可。
其次,即使去掉这段代码,也仅仅是让 pytorch 的下载速度变快。gpu 版本的 pytorch 还需要 cudatoolkit,它在各大镜像源中都没有,所以下载速度特别慢(如果电脑会开 VPN,应该可以直接下载,下面的步骤可以不看)。
接下来介绍如何下载它:
- 安装 cudatoolkit
- 如果你使用原来的命令去下载,你会下载失败,报出连接超时之类的错误。此时,anaconda 会告诉你哪个模块下载有问题,并且它会告诉你这个模块的下载链接。如果你没有这个提示,可以进入这个网站,这是 cudatoolkit10.0 的下载链接;
- 当然你用电脑下依旧很慢,将这个链接发到手机上,在手机上开 VPN。这样你就会下载得到压缩包
cudatoolkit-10.0.130-0.conda
,请注意,这个压缩包很奇怪,在 anaconda 中,你的虚拟环境目录下的pkgs
文件夹中,所有的压缩包都是.tar.bz2
结尾,不知道为什么它以.conda
结尾; - 不过没关系,它依旧是压缩包,你只需要运行命令
conda install --use-local D:\anaconda\pkgs\cudatoolkit-10.0.130-0.conda
,后面的路径,你需要自己设置; - 等几秒钟 cudatoolkit 就安装好了;
- 还有一点,我不知道这个操作有没有用,但是还是加上来了。在
anaconda/env/虚拟环境名/pkgs
文件夹中有一份urls.txt
文件,你需要把 cudatoolkit 的安装链接(安装链接上面已经给出,或者你可以自己获取)加在末尾; - 最后,你再运行 pytorch 提供的命令,它就会跳过安装 cudatoolkit 了;
- 安装 pytorch 和 torchvision
- 强烈建议对于下载 pytorch,不要使用 anaconda!而是使用 pip!
- 强烈建议不要使用 pytorch 官网提供的命令行去下载!因为它提供的命令行下载得到的 pytorch 和 torchvision 是 cpu 版本的!
- 找到 pytorch 和 torchvision 的 whl 文件(注意一定要是 gpu 版),如果找不到,可以访问 pytorch whl 文件 和 torchvision whl 文件;
- 下载下来后,使用
pip install whl文件名
安装; - 安装成功后,就可以使用了;
- 对于 cudatoolkit,我使用 1 中的命令安装之后,在 site-packages 文件夹中并没有发现它,我不知道这步是不是必需的,还是加上吧。