南开大学研发MDT模型,借助浪潮信息AIStation加速模型训练

南开大学研发MDT模型,借助浪潮信息AIStation加速模型训练

(全球TMT2024年9月24日讯)南开大学计算机学院研发了Masked Diffusion Transformer(MDT)图像生成模型,相比DiT训练速度提升10倍以上,实现了ImageNet Benchmark上1.58的FID score,再次刷新SOTA图像生成质量和学习速度。相关论文已在计算机视觉顶级会议ICCV 2023(计算机视觉国际大会)发表。为了建设满足MDT开发和训练需求的AI算力平台,南开大学与浪潮信息合作,借助浪潮信息AI服务器构建强大算力资源池,利用AIStation智能业务生产创新平台实现算力高效分发,提高计算资源利用率,加速MDT图像生成模型训练。

大模型技术进步的背后离不开强大算力支持,为进一步提升MDT开发和训练效率,同时实现算力成本效益最大化,南开大学对算力基础设施提出了诉求:需要强大的AI算力资源支持;快速构建大模型开发环境,提高模型训练效率;算力资源高效调度,降低算力使用成本。南开大学采用浪潮信息提供的方案,包括高性能AI服务器、网络交换机、存储系统,满足模型训练过程中对算力资源的需求。同时,为了最大化利用AI算力资源、提升大模型开发效率,南开大学利用AIStation平台实现AI算力资源的高效调度。