当前位置: 首页 >  新闻动态 >  正文

GTC2018 英伟达GPU技术大会

宋易恒 2018-11-27 浏览


 

20181120-22日,年度 GPU 技术大会(GTC)在苏州国际会议中心正式开幕,参会人数超过8000。英伟达创始人兼首席执行官黄仁勋宣布了该公司在芯片、AI 平台、自动驾驶上的一系列新动作。课题组成员陈驰博士、宗泽亮前往参加研讨。

 

陈驰博士、车和家无人驾驶部湛逸飞博士、宗泽亮在会议现场

RTX系列显卡:实时光线追踪技术有望用加速太阳能分析研究

作为一家以高性能计算著称的GPU企业,黄仁勋介绍了其全新RTX系列图形处理器的强大能力,其网络游戏《逆水寒》将成为国内首款应用实时光线追踪技术的游戏。RTX系列显卡强大的实时光线追踪技术有望用于加速组内太阳能分析研究。

除了实时光线追踪,《逆水寒》也将同时支持基于AIDLSSDeepLearningSuperSampling)高性能抗锯齿技术,黄仁勋表示DLSS可带来1.8倍性能提升。DLSS类比技术可成为激光点云超分辨率的一个研究思路。

https://pic3.zhimg.com/80/v2-1e31edfc84fa1739ab7050f6335e0b1a_hd.jpg

 

GPU加速平台HGX-2

RTX之后,黄仁勋在现场介绍了其早前发布的GPU加速平台HGX-2HGX-2NVIDIA16个高端V100 GPU组成,使用NVSwitch高速互联总线将16GPU完全连接为一个整体来使用,其能在单节点中提供2PFLOPS计算性能。

作为云服务器平台,HGX-2具备多精度计算能力,支持面向科学计算和模拟的高精度FP64FP32计算,也支持AI训练和推理所用的FP16INT8精度。与仅使用CPU的服务器相比,它将AI机器学习工作负载的运行速度提升近550倍,将AI深度学习工作负载的运行速度提升近300倍,将高性能计算工作负载的运行速度提升近160倍。

现全球征集赞助商,赞助一台HGX-2  :)。

 

 

T4云计算卡

T4基于全新 NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,T4的多精度功能可支持4种不同精度等级的各类AI工作负载,助力实现突破性的AI性能,FP32精度能够提供8.1TFLOPSFP16精度能够提供65TFLOPSINT8精度能够提供130TOPSINT4精度能够提供260TOPS。黄仁勋在现场演示了基于百度图片识别引擎的demo,在使用Intel Skylake架构的纯CPU服务器时,运算速度只有4~5fps,而换用4T4计算卡后,运算速度飙升至6200fps。在将计算卡数量增至28块时,运算速度也呈线性增长至43500fps,可见其可扩展性非常优秀。

 

 

 

 

开源GPU加速平台Rapids

在详细阐述完上述计算加速硬件后,黄仁勋还简要推介了其开源的 GPU 加速平台 Rapids,该平台于今年10月发布,是一款针对数据科学和机器学习的GPU加速平台,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用CPU提升50倍。

 

 

RAPIDS构建于Apache ArrowPANDASSKLEARN等组件之上,通过CUDF数据过滤、CUML机器学习、CUGRAPH数据图像化来加速处理数据,为最流行的Python数据科学工具链带来了GPU提速。

这三套软件工具都是基于CUDA开发,可以把它们看成是CUDA的一部分。其中CUDFPandas的功能非常类似,Pandas的所有功能都可以在CUDF里找到对应的APICUML则对应SKLEARN,无论是分类、聚类、回归等算法都可以在CUML里面找到。而CUGRAPH目前尚未正式推出,预计会在明年正式集成到RAPIDS中。

 

自动驾驶:关键词“车规级”和“全面量产”

最后压轴出场的则是被NVIDIA寄予厚望的Jetson AGX Xavier AI计算平台。Xavier是世界首个用于自主机器的AI计算平台,在Xaiver基础上,NVIDIA打造了一个全新的产品家族DRIVE AGX,目前两大主力产品为基础的DIRVE AGX Xaiver和高性能的DRIVE AGX Pegasus

 

为了展示NVIDIA自动驾驶芯片的强大算力,黄仁勋在现场放出了搭载PegasusNVIDIA无人车在硅谷的高速道路上进行了一段实地路测。

在这段总长度为50英里的路测中,驾驶员全程都未触碰方向盘,由无人车自行完成了所有的行车操作。从车上的实时影像可以看出,Pegasus支持的无人车对车道线、标志、各类道路参与者进行实时的识别、分割、追踪,感知效果相当强大。此外,英伟达推出无人驾驶仿真平台,在仿真环境中进行模型与算法测试,规避路测危险。

Jetson AGX Xavier平台还配备了NVIDIA JetPack SDK。这套完整的AI开发软件解决方案,涵盖了最新版本的CUDAcuDNNTensorRT,以及用于简化并加速开发的高级软件代码。基于此,由软件定义的配送机器人等自主机器,完全可以通过线上更新完成性能提高及添加功能等工作。

正如核弹黄所说,AI is automating the world. DATA powers the AI. 在与车和家无人驾驶部湛逸飞博士的交流中得知,NVIDIA在印度投入千人级别的团队做数据标记、全球范围内千人团队做模型与算法,以驱动NVIDA DRIVE的稳定与落体。IT公司在人力与资源的优势碾压高校、院所。象牙塔中的研究工作如何继续进行、如何保持领先、如何与工业界直接结合落地,是我们需要思考的问题。另一方面,以营利为目标的商业体进入AI领域研究,也在另一方面反映 - AI automated world近在咫尺。黄教主在keynote演讲中说到的“Next yearI speak EnglishYou hear Chinese。”或将成为现实。GTC2019再见!