不要等待警报,需要采取更主动的方法
|
热失控问题在很短的时间就能产生,即使是经验丰富的数据中心运营团队也不会掉以轻心。冷却设备故障很容易升级为热失控情况,使全天候运行的数据中心面临停机风险。 调查发现,其中一个主要原因是现有的解决方案(如BMS)在及时发现热失控方面不是很有效。由于没有严重违反服务等级协议(SLA)或发生故障,冷却散热和气流问题通常不会过早地触发建筑管理系统(BMS)警报。但是一旦触发,则为时已晚,其结果是散热问题可能会迅组织需要预防潜在热失控故障,通过人工智能和机器学习技术,现在可以采用与BMS系统并行工作的软件解决方案,以识别和管理来自数据中心的热失控风险。 借助这种实时热监控技术,可以跟踪冷却输出并提前识别出性能不佳的冷却系统,以便及时进行改进。在这里,数据中心机架和精密空调监控对于发现典型的冷却系统和BMS系统无法发现或隐藏的但易于修复的冷却和气流问题至关重要。 A公司开发了数据中心的关键监视系统,现在能够完成对关键基础设施的远程热失控风险预测分析。在最近的一个示例中,关键监视系统的软件和分析功能用于远程识别异常热失控行为,远程诊断问题并建议如何减轻热失控影响。所有这些都是在BMS系统发现问题之前完成的。 A公司发布的视频演示了基于预测性分析的方法如何为数据中心设置预防故障所需的预警功能。在这一示例中,由于精密空调发生故障,具有正常和稳定的冷却负荷曲线的数据中心的温度很快就变得不稳定。其时间轴如下:
速升级,在数据中心运营团队解决问题之前,将会产生影响整体性能的局部数据中心热点。 (编辑:三门峡站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


