高等级数据中心不间断电源的分析与选择

时间:2024-08-12    来源:《中国金融电脑》

近年来,“东数西算”工程建设如火如荼,一座座符合《数据中心设计规范》(GB50174-2017)标准的高等级数据中心投入使用,巨大的数据流量在数据中心的“坚实底座”上高速流转。不间断电源(UPS)作为数据中心供电系统的最后一道“防火墙”,时刻为数据流量全速通行保驾护航。


本文以保障“业务连续性”为前提,探讨了不同类型UPS的特点、差异及应用场景等,旨在为用户在不同场景下选用不同类别的UPS提供系统性评估方法。


一、UPS的分类及辨别方法


我国UPS产业化发展起步于上世纪80年代中期,较发达国家晚了将近20年。历经30多年的发展,UPS系列关键技术取得突破性进展,譬如高端大功率UPS已成功实现从千瓦到兆瓦级水平的飞跃,且与国外品牌UPS设备在功能性价值上已不分伯仲。


目前,国内外厂商已研发出多类“高频UPS”机型,可满足不同数据中心应用场景的需求,其中主要应用的三种类型为塔式UPS(高频一体式)、模块化UPS(全热插拔)和类模块UPS(业内俗称“假塔式”)。


在这其中,类模块UPS是在模块化UPS的基础上取消了模块热插拔套件,所以既失去了“功率模块故障后快速更换”的好处,又不具备塔式UPS的高可靠性。因此,高等级数据中心不适宜采用类模块UPS。各类型高频UPS的内部结构如图1所示。


1.jpg

图1 各类型高频UPS的内部结构示意


二、塔式UPS和模块化UPS的结构差异


现阶段,数据中心应用较多的是塔式UPS和模块化UPS。这两类UPS产品基于不同的内部结构,在运行效率上亦略有差异。


塔式UPS内部为独立的三相结构,无电流不均衡情况,参考的行业标准为《通信用交流不间断电源(UPS)》(YD/T1095-2018)。单台塔式UPS的最大功率为600kVA,整机效率可达96%以上,在20%~30%负载率下效率亦可达95%以上,低载高效特征明显。国标A级数据中心配合高效变压器,可将数据中心总能耗与关键设备能耗之比(Power Usage Effectiveness,PUE)中的供配电因子PLF控制在0.075以内,从而可较好地实现PUE小于1.3甚至1.2。


模块化UPS内部由三相功率模块并联而成,参考的行业标准为《通信用模块化交流不间断电源》(YD/T2165-2017)。单个三相功率模块的功率以50~100kVA居多,整机效率可达96.5%以上。国标A级数据中心结合高效变压器,可将PUE中的PLF控制在0.071以内。相较于塔式UPS,模块化UPS可更好地实现数据中心PUE小于1.3甚至1.2。塔式UPS和模块化UPS电路如图2所示。

2.jpg

图2 塔式UPS(左)和模块化UPS(右)电路示意


三、塔式UPS和模块化UPS的全方位对比


结合塔式UPS和模块化UPS的结构差异及其在项目中的实际应用表现,业内对两类机型的评价总结见表1。


表1 塔式UPS和模块化UPS的特征对比

3.jpg


除此之外,两类机型在以下几个方面亦有较大差异。


1.机内均流风险

得益于独立的三相结构,塔式机内不会出现模块输出不均流的现象;而模块机内部则存在模块输出不均流现象,且随着时间的推移,有不均流加大的风险。


2.电容更换成本

塔式机的电容安装方式是使用大电容螺栓将其安装在铜排上,模块机的电容安装方式则使用小电容器将其焊接在PCB板上,两者在电容器更换成本上有较大差异。塔式机电容器更换成本为整机成本的10%左右,模块机则需全部更换功率模块,更换成本攀升至整机成本的50%以上。


3.运行效率

通过采用功率模块休眠技术,模块机的休眠颗粒度为50kVA或100kVA,此外,可通过提升整机的负载率以获得更高的运行效率。整体而言,模块机运行效率高于塔式机0.5%左右。


4.故障概率及维修时间

独立的三相结构决定了塔式机整机内部器件发生故障的概率将远低于模块机功率模块的故障概率。若故障发生,维修塔式机内部器件的时间约为30分钟,而模块机在有备份模块的情况下,更换模块仅需10分钟。


5.尺寸及重量

塔式机尺寸较大,安规距离可达到国家标准的1.5倍以上;而模块机尺寸较小,在满足国家标准安规距离要求时散热能力较差,器件老化速度较快。在重量方面,塔式机较重,模块机重量仅为塔式机的70%左右,因而成本更低。


四、塔式UPS和模块化UPS适合的场景


基于不同的结构和特性,塔式UPS和模块化UPS均有相应适合的应用场景,用户可根据实际项目情况进行选型。整体而言,高等级数据中心选型可考虑以塔式UPS为主。


1.根据并机方案选型

模块化UPS主要通过并机实现功率模块冗余,并机数量越多,功率模块就越多,功率模块间环流也就越大。因此,并机数量在两台时应用模块化UPS或塔式UPS均可,并机数量在3台及以上的情况,建议使用塔式UPS。


2.高安全场景

对于将“高可靠运行”要求置于首位的数据中心,因其设计理念追求的是“不会坏”,所以建议首选塔式UPS。同时,目前高频塔式机的效率只略低于模块机,也可同时兼顾节能的需求。


3.“极致节能”场景

对于将“极致节能”要求置于首位的数据中心,可优先选择模块化UPS。因为模块化UPS的运行效率比塔式机高0.5%,且休眠的功率颗粒度更小,节能效果也更好。但需要注意的是,模块化UPS可能会较为频繁地出现设备故障。


五、塔式UPS和模块化UPS的应用情况


现阶段,我国高等级数据中心应用领域广泛,本文将以金融行业数据中心UPS系统应用情况为例,同时列举互联网数据中心(Internet Data Center,IDC)的应用情况进行分析。


1.金融行业应用塔式UPS占比超过99%

通过测算,2018年以来,拥有1000台以上机柜的金融行业数据中心塔式机的应用比例达到95%以上,占据绝对主流。若考虑近十年来金融行业1000台以上机柜数据中心的应用,塔式UPS占比则高达99%以上。2018年以来拥有1000台以上机柜金融行业数据中心UPS系统应用情况见表2。


表2 2018年以来1000台以上机柜金融行业数据中心UPS系统应用情况

2.jpg


2.IDC等应用模块化UPS占比80%以上

目前,IDC较多地应用模块机,但由于其故障率偏高,对业务连续性影响极大。据了解,模块机整机及模块的故障率是塔机的5倍以上。例如,2023年6~7月,某项目上应用的20多台模块机陆续出现故障,炸机导致单路UPS中断时间长达数周,部分机房双路掉电,且导致对客业务中断、服务中断以及用户索赔等严重后果。此类数据中心模块化UPS炸机、UPS烧毁、机房烧毁等事故,给设备安全运行带来极大隐患。根据事后评估,发生故障的项目使用的模块化UPS模块尺寸小、功率高(3U 100kVA),导致单模块功率密度大、散热性较差,热量累积导致器件短路,最后引发炸机。模块机虽具有单机成本较低、效率略高的优势,但若过于追求成本,其过高的能量密度将导致元器件安规距离过小、机内温升偏高、器件老化较快,为数据中心安全运行带来一定的隐患。


此外,在多个行业的项目中,陆续有大量模块化UPS的功率模块被召回,召回行为对于数据中心的安全稳定运行也是一个巨大考验。召回后再次上新的模块是否还会发生故障,这对数据中心运维团队及高层管理者都是一个巨大的心理考验和责任考验。


UPS作为数据中心基础设施中最重要的设备之一,其对于供电连续性的影响至关重要。架构安全、稳定可靠、在行业中积累了成熟经验的塔式UPS,或可作为用户的优先选择。


作者:中国工商银行数据中心 康德学

本文授权转载自《中国金融电脑》2024年第8期,仅代表作者本人观点