浪潮信息InManage智能平台,应对超大规模数据中心管理挑战
(全球TMT2024年10月21日讯)随着数字化和智慧化的加速落地,数据中心的设备规模快速攀升。以拥有10万+设备的大规模数据中心为例,如何秒级反馈海量并发需求,保证管理平台稳定运行?如何避免将每秒近千条的大规模设备告警风暴强塞给客户,进行根因定位并避免误报、漏报?这些挑战伴随服务器、存储和网络设备规模的持续增长,成为超大规模数据中心管理亟待解决的问题。
浪潮信息InManage是一款面向数据中心基础设施的智能管理平台,通过统一接口、协议,可纳管多达400种不同厂商、不同型号的服务器、存储和网络等机型,设备规模最多可达10万台。InManage通过智能均衡作业调度平台,在秒级内处理超大规模数据中心亿级实时并发运维管理数据,并基于自研告警管理框架,实现5秒内响应上千条告警风暴,显著降低误报与漏报风险。InManage不仅创造了金融行业单一数据中心带外管理最大纪录,还实现了全生命周期管理,整体运维效率提升两倍,为超大规模数据中心稳定、高效运行奠定重要基础。
在超大规模监控场景下,作业调度不畅极易造成作业堆积、负载波峰波谷抖动,严重影响系统稳定性,进而影响采集进度。为此,浪潮信息InManage自研了ChaosJob作业调度中间件,突破了作业智能均衡调度技术,实现了采集作业的高效调度和稳定执行。InManage还提出了CDCAlarm告警管理框架,突破了告警集成管理技术,实现了告警的及时性、准确性和全面性,同时支持告警分析、聚合及根因分析等功能。
文章评论(0)