FPGA和GPU在深度神经网络方面谁更胜一筹

2021-02-23作者：电工小雨我要评论

英特尔最近在研究下一代DNN的各种GEMM操作。开发了用于FPGA的DNN硬件加速模板，为开发稀疏矩阵算法和自定义数据类型提供了一流的硬件支持。该模板是为了支持各种下一代DNN而开发，并且可以定制，为用户给定的DNN变体生成优化的FPGA硬件实例。

该模板被用于运行和评估下一代DNN的各种关键矩阵乘法操作，当前和下一代FPGA (Arria 10, Stratix 10)以及最新的高性能Titan X Pascal GPU.本研究结果发现，与Titan X Pascal GPU相比，在pruned, Int6和二值网络学习上（pruned, Int6, and binarized）DNNs的GEMM操作上，Stratix 10 FPGA的性能分别是Titan X Pascal GPU的1.1倍、1.5倍和5.4倍。

这些测试还表明，Arria 10和Stratix 10 FPGA相对于Titan X GPU提供了令人满意的能源效率(TOP/sec/watt)，与Titan X相比，这两种设备的能源效率都提高了3到10倍。虽然GPU一直是支持DNN的无可争议的选择，但最近对两代Intel FPGA (Arria 10和Stratix 10)和最新的Titan X GPU的性能比较表明，当前DNN算法的趋势有利于FPGA，甚至FPGA可能提供更好的性能。

（责任编辑：fqj）

关于可编程逻辑就介绍完了，您有什么想法可以联系小编。

UC3846控制芯片工作原理控制图逆变焊机原理与用途

数字万用表电阻档测试二极管正反向没有阻值(使用万用表测量二极管的正向电阻,为什么各档)

学单片机需要学数电模电吗(学单片机要先学数电模电吗)

电工怎么选择适合自己用的万用表(电工初学者买什么样的万用表好)

单片机需要同时运行多个任务怎么办(单片机怎么同时执行多个任务)

电机保护的方案取决于负载的机械特性

绝缘电阻表正负搭接不复零位是怎么回事

短路怎么用万用表查

FPGA和GPU在深度神经网络方面谁更胜一筹

相关资料

热门资料