近年来,人工智能AI越来越多被人们所了解,尤其是AlphaGo的人机围棋大战之后,机器学习的热潮也随之高涨。最近,公司采购了几批设备,通过深度学习(TensorFlow)来研究金融行业相关问题,学习机器学习我们需要满足一定的硬件要求,本文主要是介绍硬件选购的相关事宜。
现在主力的深度学习都是通过多显卡计算来提升系统的计算能力,所以硬件的采购核心是显卡(GPU),下面是整个硬件采购的清单及大致费用如下:
以上的配置一台设备的总共费用大致:2.8W左右。公司购买了2台,费用大致6W,两台设备的研究方向不一样。本来设备这些东西按理说应该是越来越便宜才对,但是这几年恰恰相反(%>_<%),尤其这两年比特币大热(大学那会到现在,翻了一千多倍,千金难买早知道~~),很多人都买显卡专业挖矿去了,一度导致显卡热销,经常断货,价格也自然水涨船高。不仅如此,内存这两年价格几乎至少翻了一倍以上,两年前DDR4的8G内存最低200不到,现在像样点的都至少500以上(现在不流行囤金银了,改为囤内存条了),SSD和机械硬盘也涨了不少,记得那年福岛地震和东南亚洪水之后,供应商工厂受损,价格貌似就没有再降下来过。这些都是题外话,我们言归正传,以上的价格仅供参考。
其实京东上面也有不少DIY定制的一套深度学习的服务器配置,不过主要也是分为两种:一种是至强E系列双CPU带4路GPU,还有一种是I7的CPU待2路GPU。
图1、至强 E5双路/4路GPU
图2、i7 6850K/GTX1080TI双卡(水冷)
可能有些人有疑问,为什么单I7不能带四路GPU,而是需要双路CPU,其实也有单CPU带4路GPU的特例,这个在下文会解释
1、主板
一般来说单块的GPU显卡占用16条PCIE通道,如果想配置4块的话,那么则需要16*4=64条PCIE通路。而我们选择常见的I7的CPU最高也只有40条PCIE通路,理论上来讲需要2块CPU实现双通道处理。上面京东上大多数都是这种配置模式,当然,如果我们不想使用双路CPU的话,要想实现单CPU支持16*4PCIE通道,目前只有Asus X99-E WS/USB 3.1,唯一 一块主板可以实现PCIE通路的拓展。所有如果有人想使用单个I7带4路GPU的话,那主板只能选择这一款了。推荐使用这一款,为了后期方便扩展,我们可以暂时只买1路或者2路GPU,后期可以扩至4路。
2、CPU
CPU的选购也是需要适配主板型号,为了支持上述的ASUS X99-E WS USB3.1主板,CPU为LGA2011-v3系列,同时支持最高40条PCIE通道。而且我们系统主要使用CPU显卡进行计算,CPU的核心数并不重要,只要拥有相对较高的主频就可以,因此对CPU的要求其实并不是很高。这我们选择主频相对较高的i7-6850K(不带核显),也可以选择相对较低点主频的i7-5930K。具体根据实际情况选购,预算多一点的,可以选择更好的。
3、显卡GPU
其实显卡才是我们的主角,我们的核心计算都是需要依托GPU计算的,当然并不是所有显卡都可以的,我们需要能够支持CUDA平台(一种由NVIDIA推出的通用并行计算架构)的GPU才行,实际上也只有部分高端NVIDIA显卡才支持此功能,NVIDIA也可以查询的到具体的支持列表,大家可以前往查询——>传送门
其实我们的另一个主角TensorFlow对GPU也是有要求的