燧原科技发布首款人工智能推理产品 — “云燧i10”

(全球TMT2020年12月21日讯)燧原科技发布首款人工智能推理产品 “云燧®i10”。这是一款面向云端数据中心的高性能推理卡。云燧i10是单槽位标准卡,支持PCIe 4.0,FP32算力达到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。同时,燧原科技发布了推理引擎“鉴算TopsInference”,可以为深度学习应用提供低延迟、高吞吐率的推理性能,并降低数据中心的部署成本。云燧i10将于明年第一季度上市。

燧原科技发布首款人工智能推理产品 -- “云燧i10”

“云燧i10”拥有卓越的算力、出色的通用性以及优异的价值特性:

  • 高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持从FP32到INT8等多种精度,而最大功耗仅为150W;
  • 高能效、高可靠性:采用动态调频调压(DVFS)技术,根据负载加速应用性能,支持RAS、ECC;
  • 设备虚拟化:实现多用户支持,最大可支持4个设备实例,具备计算与存储资源的独享性,多用户间安全隔离;单颗芯片上可同时部署不同的业务与负载,实现多任务并行,有效提高利用率;支持KVM、Xen等系统虚拟化平台;
  • 易编程、生态开放:开放C++和Python编程接口,支持CNN及NLP典型模型,支持主流机器学习框架,并通过SDK提供深度定制。

燧原科技同时推出针对推理产品的高性能神经网络模型推理引擎“鉴算TopsInference”,通过计算图优化、算子融合、模型压缩、量化等优化技术,可以为深度学习应用提供低延迟、高吞吐率的推理性能。通过TopsInference的推理加速,配合i10 的高算力及虚拟化技术,数据中心可以高性价比地部署计算密集型深度学习工作负载。此外TopsInference除TensorFlow、PyTorch模型格式外,还支持ONNX通用模型格式,借助燧原GCU-CARA架构的可编程性,可以应对未来深度神经网络日益多样化、复杂的增长趋势。