1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > conda cudnn版本升级_ubuntu18.04系统下NVIDIA显卡驱动+cuda+cudnn安装+conda虚拟环境配置...

conda cudnn版本升级_ubuntu18.04系统下NVIDIA显卡驱动+cuda+cudnn安装+conda虚拟环境配置...

时间:2023-12-07 06:41:29

相关推荐

conda cudnn版本升级_ubuntu18.04系统下NVIDIA显卡驱动+cuda+cudnn安装+conda虚拟环境配置...

深度学习的显卡环境配置是一个非常麻烦的问题,理论上这是一个深度学习开发必须要面临的问题,那么教程就应该很多,后人学习起来的时候应该会很容易,实际上却是教程良莠不齐,而且很多教程往往是针对特定显卡的,但是这个和作者无关,只是说随着显卡更新换代,之前的很多教程其实就是无法使用了。在这里笔者通过帮室友配置gtx1660ti和自己配置教研室1050ti所遇到的完全不一样的问题做出记录个解决,基本能够解决绝大部分问题。

教程会完成驱动安装,conda安装,cuda,cudnn安装以及相应的虚拟环境环境配置,直到最后测试成功调用GPU,考虑到可操作性,教程尽量以多图方式展示,或者就是解释性良好的参考资料。

教程的目标是完成是在各个装完ubuntu系统之后的深度学习环境配置。安装顺序如下:安装显卡驱动

安装conda(本教程不会介绍具体过程)

安装cuda

安装cudnn

创建虚拟环境,配置TensorFlow和pytorch的深度学习环境

驱动安装

划重点在安装好ubuntu系统后,首先第一步先装显卡驱动!先装显卡驱动!!先装显卡驱动!!!,重要的事情说三遍,有些电脑是不装驱动就不能用,自己肯定会先装驱动,但是有些电脑是不装驱动也照样用的好好的,可能最后才来弄自己的显卡驱动,但是装驱动坑太多,很容易开机之后无法登陆,最后只能重装系统,这样之前的工作就算是白费了。不要问我为什么知道,,,

快速安装一般早些的显卡版本,比如像是我教研室的1050ti,就可以可以参见命令教程中的第一种方式快速安装,简单到超乎你想象。当然其他版本也可以试一下第一种方法安装,反正这个方法没有副作用,成功了就万事大吉,不成功也是情理之中。像我室友的1660ti就没成功。切记,如果这个能成功,就不要想着去自己尝试装驱动,如果想尝试,请做好重装系统的准备

如果没法通过上面方法安装的,就可以考虑自己安装了。上面的不行,其他的的什么从software上安装的方式基本也不行。至于自己安装驱动的过程,不推荐上面教程的方法,至于原因,嗯,反正我是没有成功。

手动安装手动安装可以参见这个手动安装教程快速安装。

一般说要先把电脑安全启动改成disable,不过也可以先尝试,因为我室友的就是默认disable好像,而且这一步先尝试也没什么副作用,如果没有disable顶多就是失败报错而已小声比比,而且其实虽然很多教程,甚至视频都成功的disable了这个选项,但是我照着做的时候就是找不到Clear Secure Boot keys,这个选项,所以硬是没有成功。不过还是成功安装了。

就好像前面快速安装显卡驱动的教程一样,对于室友的1660ti就是不行,至于为什么,这背后的玄学还没弄明白。不过幸运的是我可以直接用命令安装驱动,嗯哼。

如果直接不行就可以参照disable安全启动教程尝试解决这个问题

conda安装

安装完驱动之后优先安装conda,反正最后都要安装的。至于为甚,嗯,因为我曾经遇到过后来安装conda然后把linux下的bashrc文档弄坏了。在把conda路径加到系统路径后就这样了。导致所有命令都不能用,吓得以为又要重装系统,最后还是在命令目录下恢复了文档才解决了问题

conda的安装还是很简单的,在之前的conda安装教程也有说到过

cuda和cudnn安装

版本问题众所周知,cuda和cudnn以及使用的TensorFlow是有版本对应的,而pytorch不是这样的,一是在安装pytorch的时候,可以指定cuda版本安装,如果直接pip安装,好像也会直接适配你安装好的cuda,也就是你不用担心pytorch安装的时候和你的cuda不匹配。是不是真的适配,也不清楚,反正每次pip直接安装的时候没啥事。

一般而言,现在都会选择cuda9.0的版本的,要求是9的时候,就不要想着去尝试9.2这样的,直接选9就好了,不然会遇到什么坑下面会有介绍

cuda一般选9.0是没问题,但是cudnn本身也有版本,但是网上的很多教程基本都不会在意cudnn小版本的问题,就是cudnn7.x.x好像和tensorflow还有对应关系,比如下面教程介绍conda环境,尝试的时候会发现不同tensorflow自动匹配安装的cudnn的版本是不一样的。不过一般装7.1.x都不会有问题,更新时间在,tensorflow绝大部分的版本更新都是在这一年。我们最后选择的cudnn7.1.5.

其次如果安装错了,也没什么,反正,这个的删除和安装很方便

而且也许有着cudnn本身有着向下兼容性。因为后面装过很多版本的tensorflow都可以用。

总的来说,为了安全可以装7.1.5(如果你看到这个教程的时候已经是很以后了,那么就不用看这个了,没有参考价值),尝试一下也可以直接装最新的

除了这些对应关系,注意cuda和显卡驱动版本还有对应关系!所以不是说cuda装什么都可以的,是显卡驱动限制了你的cuda版本,限制了你最高能用到几的tensorflow。

关于conda安装如果大家查了很多教程,会发现,conda配置pytorch或者tesorflow-gpu的环境的时候会自动根据要安装的版本,自己安装cuda和cudnn,所以其实可以说不用自己安装。理论上这么方便,我干嘛还要自己安装。事情当然没这么简单首先就是一般还是推荐安装cuda9.0,但是如果conda自己安装的时候往往会给你匹配到cuda8.0或者cuda9.2这种神奇的版本。

版本不对就算了,既然conda这么安装了,那么我肯定能调用啊。但是事情没这么简单,还真是就不可以。会提升找不到9.0的cuda版本的文档,具体如下:

其次conda装cuda的时候,可不管你的驱动版本,只看pytorch和tensorflow的版本,但是事实的真相是cuda版本和NVIDIA驱动版本还有一个驱动对应关系。比如我390的驱动,但是conda自动给我装了一个cuda9.2,而cuda9.2对应的驱动版本需要》=396.46,我还能怎样。

所以还是推荐自己安装,自己安装之后,就算你后面再用conda的自动安装也可以,如果不行,把自己安装好的文档,支付粘贴复制过去妥妥的,也能用。

快速安装在1sudo sh cuda_9.0.176_384.81_linux.run

中会有很多选项,其中有一个是否安装显卡驱动,因为之前以前安装过了,所以拒绝就可以,然后其他都接受就行了不要想着说那我这时候再来装驱动不就行了,一般这样最后都会卡死,我最开始就试过这样,所以大家还是好好按照顺序来

环境配置到这里,可能是终于结束了,有可能还是一样会失败,虽然我觉得这个教程我照着做了很多次都成功了,但是真的指不定到你们电脑上真的不行。嗯哼。

环境的配置不建议直接在base环境下面配置,这样万一弄坏了修复还是很麻烦的,但是虚拟环境就随便你玩了

注意之前提到的,不建议使用conda install 安装环境当然,你也可以这样尝试,反正时间开销也不大,不能用卸载了就可以

pytorch环境配置相对配置简单一些,创建虚拟环境之后,直接参见之前的安装教程安装就好了

测试命令:1

2

3import torch

print(torch.cuda.is_available())

如果返回True就成功了

如果不不行,这个问题可就多了,需要具体问题具体分析了,因为我这里是一步成功,所以可能暂时没有什么反面教材

tensorflow环境配置安装命令1pip3 install tensorflow==1.12.01.12.0是cuda9支持的最高版本,后面的版本就需要cuda10了

另一个比较常用的版本就是1.8.0

测试命令1tf.test.is_gpu_available()

返回true就是可以的

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。