Facebook 和英特尔合作改善了第三代英特尔® 至强® 可扩展处理器上的 PyTorch 性能。 利用英特尔® 深度学习加速的新 bfloat16 功能,该团队能够在多种培训工作负载下显着提高 PyTorch 性能与 FP32 相比,将代表性计算机视觉模型的培训性能提高了 1.64 倍,将 DLRM 模型的培训性能提高了 1.40 倍,并且 DLRM 模型的 INT8 推理性能是 FP32 的 2.85 倍。
英特尔与 Facebook 合作采用第三代英特尔® 至强® 可扩展处理器和支持 BFloat16 加速的英特尔® 深度学习加速技术,提高 PyTorch 性能
内容版权声明:除非注明,否则皆为本站原创文章。