Trainium3 UltraServers正式可用,由亚马逊云科技首款3nm AI芯片驱动
(全球TMT2025年12月4日讯)亚马逊云科技在2025 re:Invent全球大会上,宣布Amazon EC2 Trainium3 UltraServers(Trn3 UltraServers)现已正式可用,由亚马逊云科技首款3nm AI芯片驱动,为不同规模的企业提供运行高强度AI训练与推理工作负载的能力,帮助客户更快更省地训练和部署AI模型。

与Trainium2 UltraServers相比,Trn3 UltraServers在AI场景中提供高性能,实现高达4.4倍的计算性能、4倍的能效提升以及近4倍的内存带宽,使AI开发速度更快、运营成本更低。Trn3 UltraServers可扩展至最多144颗Trainium3芯片,提供高达362 FP8 PFLOPs的性能,延迟降低4倍,可更快速训练更大规模的模型,并支持大规模推理场景。包括Anthropic、Karakuri、Metagenomics、Neto.ai、Ricoh与Splashmusic在内的客户已经通过Trainium将训练与推理成本降低至原来的50%。值得的一提的是,Amazon Bedrock也已在Trainium3上运行生产级工作负载。
亚马逊云科技已经着手研发下一代Trainium4,其设计目标是在各项性能指标上实现显著提升,包括至少6倍的FP4处理性能、3倍的FP8性能以及4倍的内存带宽,以支撑下一代前沿模型的训练与推理需求。Trainium4在FP8性能上的3倍提升是一次基础性飞跃,使AI模型的训练速度至少提升3倍,或处理至少3倍的推理请求,并可通过持续的软件增强与特定工作负载优化获得更多额外加速。为实现更强的扩展能力,Trainium4将支持NVIDIA NVLink Fusion高速芯片互连技术。

文章评论(0)