英特尔最近在研究下一代DNN的各种GEMM操作。开发了用于FPGA的DNN硬件加速模板,为开发稀疏矩阵算法和自定义数据类型提供了一流的硬件支持。该模板是为了支持各种下一代DNN而开发,并且可以定制,为用户给定的DNN变体生成优化的FPGA硬件实例。

该模板被用于运行和评估下一代DNN的各种关键矩阵乘法操作,当前和下一代FPGA (Arria 10, Stratix 10)以及最新的高性能Titan X Pascal GPU.本研究结果发现,与Titan X Pascal GPU相比,在pruned, Int6和二值网络学习上(pruned, Int6, and binarized)DNNs的GEMM操作上,Stratix 10 FPGA的性能分别是Titan X Pascal GPU的1.1倍、1.5倍和5.4倍。

这些测试还表明,Arria 10和Stratix 10 FPGA相对于Titan X GPU提供了令人满意的能源效率(TOP/sec/watt),与Titan X相比,这两种设备的能源效率都提高了3到10倍。虽然GPU一直是支持DNN的无可争议的选择,但最近对两代Intel FPGA (Arria 10和Stratix 10)和最新的Titan X GPU的性能比较表明,当前DNN算法的趋势有利于FPGA,甚至FPGA可能提供更好的性能。

       (责任编辑:fqj)

关于可编程逻辑就介绍完了,您有什么想法可以联系小编。

  • UC3846控制芯片工作原理控制图 逆变焊机原理与用途
  • 数字万用表电阻档测试二极管正反向没有阻值(使用万用表测量二极管的正向电阻,为什么各档)
  • 学单片机需要学数电模电吗(学单片机要先学数电模电吗)
  • 电工怎么选择适合自己用的万用表(电工初学者买什么样的万用表好)
  • 单片机需要同时运行多个任务怎么办(单片机怎么同时执行多个任务)
  • 电机保护的方案取决于负载的机械特性
  • 绝缘电阻表正负搭接不复零位是怎么回事
  • 短路怎么用万用表查