CentOS集成GTX-1080Ti显卡搭建深度学习环境全过程
在一个由N多台普通的不能再普通的机器攒凑起来的机箱中,搭载了最强核心——NVIDIA GeForce GTX 1080 Ti。我们的深度学习环境搭建之旅,将从如何攒凑这款独一无二的机箱开始,一点一点完成从简单电脑维修装配到逼格爆棚的Deep Learning的华丽丽转身。
一、安装系统 centos 7.3使用 UltraISO 制作的U盘启动盘,镜像使用的是 CentOS-7-x86_64-DVD-1611.iso
二、准备显卡及相关驱动 硬件准备由于GeForce GTX-1080Ti需要两个8pin接口供电,且比较耗能,功率为280w,公司没有闲置的能满足需求的大功率电源,即使有的话,8pin的供电的接口一般都不够用(小主板一般为4pin)。最终方案是显卡单独供电,从几个不用的电源上攒出来包含两个8pin(此8pin接口实为3根黄线和3根黑线,另外两根黑线为黑线接口引线串联起来,见下图)接口的电源(额定功率为270w),另外一个给机箱主板供电的电源(额定功率270w)除去本身的24pin接口和硬盘供电接口外,再拼接一条8接口(此8pin实为4根黄线和4根黑线组成),以弥补供电不足(PS: 电源功率足够大的话阔以忽略以上折腾活儿)。
显卡8pin接口 主板辅助电源8pin接口 最终机箱全貌补充:目前主板供电的接口主要有24针与20针两种,在中高端的主板上,一般都采用24PIN的主板供电接口设计,低端的产品一般为20PIN。不论采用24PIN和20PIN,其插法都是一样的 。
另外随着CPU、显卡等功耗增大,主板上增加了 4pin或8pin 的辅助供电
软件准备
所需文件一览:
-rwxr-xr-x 1 root root 97546170 9月 20 10:24 cuda_8.0.61.2_linux-run cuda补丁 -rwxr-xr-x 1 root root 1465528129 9月 20 10:27 cuda_8.0.61_375.26_linux-run cuda8.0驱动 -rw-r--r-- 1 root root 201134139 9月 20 10:27 cudnn-8.0-linux-x64-v6.0.tgz cudnn6.0(针对cuda8.0) -rwxr-xr-x 1 root root 80803084 9月 20 10:27 NVIDIA-Linux-x86_64-384.69.run NVIDIA驱动 1.安装前准备工作
备份 initramfs 文件(系统内核镜像文件)
initramfs文件初探
Linux内核在初始化之后会执行init进程,而init进程会挂载我们的根文件系统,但由于init程序也是在根文件系统上的,所以这就有了悖论。Linux采用两步走的方法来解决这个问题。Linux2.6版以前的方法是:除了内核vmlinuz之外还有一个独立的initrd.img映像文件,其实它就是一个文件系统映像,linux内核在初始化后会mount initrd.img作为一个临时的根文件系统,而init进程就是在initrd.img里的,然后init进程会挂载真正的根文件系统,然后umount initrd.img。但Linux2.6内核的实现方式却不太一样,虽然完成的功能是一样的。Linux2.6采用initramfs。initramfs:init ram filesystem,它是一个cpio格式的内存文件系统,制作的方法有两个,一个是介绍的,但这样做出来的initramfs是和内核vmlinuz分开的,因此我们需要在grub里写上initramfs的路径。而另一种方法是把内核和initramfs制作在一起成为一个文件,方法是在linux源码make menuconfig,然后General setup–>选择Initial RAM filesystem and RAM disk (initramfs/initrd) support,然后在Initramfs source file(s)里输入我们的initramfs目录,然后make bzImage。这种方法做出来的内核就只有一个文件,不需要指定initramfs了。
# sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
重建 initramfs 文件(更新系统kernel后正常重启会在/boot目录下自动生成新内核镜像,可选)
# sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
关闭图形界面(如果有VNC服务, 请先关闭vnc服务),执行
# sudo systemctl disable gdm # sudo reboot 2.安装显卡驱动下载对应型号的 NVidia 驱动,此处下载最新支持 GTX1080 Ti 的驱动 NVIDIA-Linux-x86_64-384.69.run。 点击 官方下载。
下载完后执行, 按提示选择进行安装:
# ./NVIDIA-Linux-x86_64-384.69.run