中南大学携手浪潮建设高校算力最强的智算平台

全球TMT2020年9月23日,2020年9月4日,浪潮集团“智驱新时代-浪潮云数智中国行”长沙站活动现场,中南大学信息与网络中心代表以“智算中南”为主题,介绍了中南大学高性能计算公共服务平台建设有关情况。中南大学与浪潮携手打造的国内首个高校智算平台即将落成,不仅将有力地支持中南大学的学科建设和人才培养,推动高校高性能计算的发展,更是智慧时代开展科学研究强有力的基础设施,“智算中南”将着力推进以算力为基础、以算法为核心、以模拟和仿真为手段的科学研究数字生态体系建设,赋能各行业的创新研究。

2020年上半年,中南大学携手浪潮开始“智算中南”的建设,智算平台共有上千台设备,采用浪潮成熟稳定的高性能计算和人工智能服务器以及浪潮AI微模块数据中心解决方案,合计42个高密度IT机柜,设备布局科学合理、密度高、功耗分布均匀且无热点。单IT机柜设计功率达到19千瓦,机房面积195平米,以前几乎无法想象在195平米的空间内,计算集群可以达到五千多万亿次的超高算力。

中南大学智算平台具有四大优势:

首先是超强算力,智算平台由1058个浪潮高密度HPC计算节点和AI服务器节点组成,采用英特尔高性能CPU和英伟达Tesla系列GPU,合计50896个计算核心,CPU理论计算能力为4856万亿次,GPU理论计算能力为788万亿次,整个计算集群聚合计算能力达到5644万亿次,计算能力位于当前国内高校顶尖水平。

第二是超强作业调度和管理能力,智算平台采用浪潮自主研发的Cluster Engine集群作业调度管理软件和AIStation人工智能资源平台,实现整个平台计算资源的统一调度和管理,科学分配高性能计算和深度学习等计算资源。

第三是超高性能的并行存储系统,智算平台采用国际领先的DDN商业版Lustre并行文件系统和统一集中式存储架构,可用存储容量超过2PB,最大持续读写带宽达到20GB/s。

第四是超大IB高速计算网络,智算平台采用Mellanox公司最新的HDR InfiniBand交换机,构建高带宽、低时延的计算网络,实现千余台设备的100Gb完全无拥塞高速互联。在成千上万的计算机组成超大规模计算集群中,节点或服务器之间的吞吐和速度极为重要,这也是“智算中南”解决方案选择InfiniBand实现集群高速互联的原因。

“智算中南”高性能计算平台将于今年9月底建成,目前正在按计划开展系统加电测试、机房环境系统测试、网络连通性测试、集群管理软件测试、并行编译环境测试、内存带宽测试、IB高速计算网络测试、存储系统测试、动环监控系统测试以及HP Linpack测试等。下一步将结合具体的专业领域应用,与学校不同学科的专家、教授一道,开展专业应用软件测试,预计10月份投入试运行。