数据中心设施

应用

智能数据中心控制的液冷传感器

TE Connectivity传感器可实现压力、温度和液位的实时监测,保障系统高效运行、可靠性并具备扩展能力。

人工智能 (AI) 的快速发展正在实时重塑数据中心基础设施。 随着机架密度不断提升并突破纯风冷架构的极限,全球超大规模数据中心运营商、云服务提供商、托管服务商以及企业纷纷采用液冷方案,为AI和高性能计算 (HPC) 工作负载提供散热。根据业务需求,这些组织可能对现有设施进行改造,或建设全新的数据中心。液冷技术正以两位数的年增长率快速发展,直冷式 (D2C) 解决方案已占据接近一半的市场份额。

行业领导者正协同制定先进AI计算基础设施标准。包括NVIDIA、AMD、Google、Amazon、Vertiv、nVent、Boyd以及TE Connectivity在内的技术与基础设施企业,均参与开放计算项目 (OCP),共同推动下一代数据中心基础设施的开放标准与规范。随着机架计算密度不断提升,液冷将成为主流方案,这也对精确控制提出了更高要求。IT与基础设施团队在部署冷却系统时,需要评估工作负载需求、电力与热传导需求,并对多种数据中心散热方案进行比较分析。

 

在这一过程中,还需要决定适合实现PUE(电能使用效率)目标的D2C架构,例如液冷对风冷 (L2A) 或液冷对液冷 (L2L)。 

 

同时,还需部署包括冷却液分配单元 (CDU)、歧管、冷板、换热器、管路、过滤器以及相关工具设备。此外,还需要规划持续的监测与维护体系。

CDU冷却液循环

CDU负责冷却液的持续循环,是保障服务器正常运行的关键组件。 冷却液通常为去离子水或水-乙二醇混合液(如PG25),在封闭的技术冷却系统 (TCS) 回路中循环。该回路通常称为二级回路,包括泵、过滤器、换热器、膨胀罐、管路、歧管以及冷板,用于直接从IT设备中带走热量。冷却液的流量与温度均被实时调控,以确保在不同负载条件下实现稳定运行与高效散热。在液冷对风冷 (L2A) CDU中,热量通过带风扇的换热器释放到空气中。

数据中心
液体冷却中的传感器

在高散热需求场景中,液冷对液冷 (L2L) CDU通过换热器将热量传递至设施水系统 (FWS)。该一级回路由冷水机组或其他散热系统提供支持,在保持TCS冷却回路独立的同时,实现更高的散热能力。

行级液冷对液冷CDU架构示例

行级液冷对液冷CDU架构示例

通过关键组件(如泵、过滤器等)的N+1冗余设计以及热插拔结构,可在不中断运行的情况下进行维护,从而实现高运行可用性。随着冷却回路变得更加复杂和分布化,识别潜在故障模式对于防止诸如压力不稳定、微泄漏、气泡、泵空转以及冷却液性能劣化等问题至关重要。


如果未被及时发现,这些问题将降低散热效率、干扰泵运行,甚至影响价值数百万美元GPU集群的性能与可靠性。传感器在防止液冷系统不稳定及故障方面至关重要,同时也有助于优化系统性能。但要实现理想的精度、性能与成本平衡,传感器必须根据不同应用场景在设施侧与技术回路中进行合理配置。

获取专家见解

白皮书

填写表单,获取完整白皮书,了解传感器如何提升热管理可视性、优化性能并防止高密度环境中的高成本停机。深入了解先进传感技术如何在提升液冷系统可靠性、效率与可扩展性方面发挥关键作用,帮助企业在应对不断增长的散热复杂性的同时保持系统高可用性。
 
  • 为什么液冷正变得至关重要:了解从风冷向液冷系统的转变趋势及其在高密度环境中的优势。
  • 液冷系统的关键挑战:了解影响性能与可靠性的设计、监测与运行风险。
  • 传感器在热管理中的作用:了解传感技术如何提供实时数据、实现早期故障检测并优化系统运行。
  • 如何提升可用性与效率:探索防止故障并确保系统稳定运行的策略。
  • 下一代基础设施设计考量:了解构建可扩展、面向未来的AI与HPC冷却架构的关键要点。

关于作者

Alexandru Istrate,高级首席系统架构师

Alexandru拥有跨传感器技术的系统级经验,专注于高可靠性工业平台中的应用,重点关注半导体制造、先进热管理与数据中心冷却、机器人和状态监测等领域的长期架构需求与技术趋势。