空載UPS輸入開關燒毀事故分析與探討
作者:潘彩敏
摘要:
本文針對某數據中心在2024年多次發生的、在特定運行工況下的2臺UPS并機系統空載側輸入開關燒毀事故,進行了系統的闡述與深入分析。事故復現性測試揭示了關鍵現象:當系統處于單臺UPS帶載125%負荷,而另一臺UPS空載并聯在線運行時,空載UPS的輸入側A、B兩相會涌現高達5600A的異常環流,并伴隨嚴重的諧波畸變,最終導致其前端斷路器因內部電流互感器(CT)過熱而損毀。本文通過詳盡的現場測試數據,結合系統架構與運行模式,逐步剖析了事故現象,排除了系統諧振等常見因素,并將故障根源指向了空載UPS在特定并聯控制策略下產生的內部環流。盡管UPS生產廠家承認其設備在此工況下存在控制策略缺陷,但未提供根本原因。基于此,本文最終得出結論,并為數據中心UPS系統的安全運行與測試規程提出了具體的優化建議,以避免同類事故的再次發生。
關鍵詞: UPS并機系統;輸入開關燒毀;異常環流;諧波分析;故障復現;控制策略
1、引言
不間斷電源(UPS)系統作為數據中心、工業控制及其他關鍵基礎設施的核心供電保障環節,其運行的可靠性與穩定性直接關系到后端負載的連續性與安全性。通常,通過并聯冗余配置可以提升系統的可用性。然而,復雜的并聯交互機制也可能引入非預期的運行風險。
本案例聚焦于某數據中心一套2臺600kVA UPS組成的并聯系統。在2024年6月24日進行的常規單機125%負荷能力測試中,首次發生了非預期現象:帶載UPS運行正常,而空載并聯運行的UPS其輸入斷路器在測試開始約8分鐘后出現嚴重過熱、冒煙,最終燒毀。初次故障因缺乏詳實數據,分析受阻,斷路器專家的初步判斷指向諧波過大問題。
為確保供電系統的長期安全,我們在2024年9月24日第二次發生同類事故后,立即制定了周密的測試方案,并于9月26日成功復現了故障。此次測試部署了多臺高性能電能質量分析儀,完整記錄了故障發生前后關鍵節點的電氣參數,為本次深入的、數據驅動的故障分析提供了決定性的依據。本文旨在系統性地呈現此次事故的分析全過程,以期為同行提供借鑒。
2、事故現象描述
2.1 系統架構與運行狀態
事故系統為一個典型的模塊化供電架構,包含一路市電和一路柴油發電機作為電源輸入(測試時僅市電投入)。下游低壓配電系統中,核心為兩臺并聯的600kVA高頻UPS。測試期間的具體開關狀態與電流路徑如下圖所示:
· 市電總進線開關合閘,柴發進線開關分斷。
· 兩臺UPS輸入開關均合閘。
· 兩臺UPS均啟動,運行于“在線模式”并處于并機狀態。
· UPS-1.1的輸出開關合閘,連接至720kVA假負載。
· UPS-1.2的輸出開關分斷,處于空載狀態。
· 同一母線段的其他饋線負載未投入。
此狀態可簡言之為:“一主一備”并聯模式,其中“備機”UPS-1.2空載熱備份。
2.2事故過程回顧
2024年6月24日及9月24日,在進行單臺UPS(UPS-1.1)帶729kVA(125%額定容量)假負載運行10分鐘的測試中,事故重復發生。測試進行至約8分鐘時,現場人員聞到強烈焦糊味,隨即發現空載的UPS-1.2輸入開關柜內冒煙。緊急執行分閘、卸負載、關機操作后,將斷路器拉出檢查,發現其底部(電源進線側)A、B兩相接線端子嚴重發燙,初步判斷為內部過熱。
2.3 事故復現測試(2024.9.26)
為捕獲故障本質,我們于9月26日設計了完全復現6.24工況的測試。測試系統部署了5臺電能質量分析儀(FLUKE 435、YOKOGAWA WT1800等),精確布置了以下測量點(如下圖):
· 測量點1: 市電總進線開關輸出側(系統總覽)。
· 測量點3: UPS-1.2輸入開關下游側(故障點關鍵數據)。
· 測量點4: UPS-1.2輸出開關上游側(觀察UPS輸出狀態)。
· 測量點5: UPS-1.1輸入開關下游側(帶載UPS輸入特性)。
· 測量點6: UPS-1.1輸出開關上游側(帶載UPS輸出特性)。
測試步驟嚴格遵循既定流程:下午送電,依次合閘中壓、低壓進線開關、兩臺UPS輸入開關;啟動兩臺UPS至并機在線模式;合上同一母線的其他饋線開關;最后合上UPS-1.1的輸出開關。在系統空載運行約半小時建立穩態后,于50秒內將假負載從300kVA平穩加載至720kVA。加載約8分鐘后,空載UPS-1.2的輸入開關如期開始冒煙,故障被成功復現,全過程數據被完整記錄。
3、測試數據及深度分析
3.1 加載前基準狀態分析
在UPS-1.1加載720kVA負載之前,系統處于兩臺UPS空載并聯運行狀態。對比測量點1、3、5的數據,旨在驗證測試接線的正確性與系統的初始平衡性。
數據分析要點:
· 總有功功率: 測量點1(總進線)為17.4kW,測量點3(UPS-1.2)與測量點5(UPS-1.1)之和約為17kW,兩者基本吻合,表明電能主要消耗于兩臺UPS的空載運行。
· 電流與諧波: 兩臺UPS的輸入電流(測量點3和5)幅值處于同一數量級(15-44A),電流諧波失真率(THDi)在12%-25%之間,頻譜分布特征也基本一致。這是高頻機UPS空載運行的典型特征。
· 初步結論: 加載前,兩臺UPS工作狀態對稱,系統基線正常,測試儀器數據可信,為后續異常分析提供了可靠的對比基準。
3.2 加載后異常狀態與關鍵發現
加載720kVA負載后,系統電氣參數發生劇烈變化,空載UPS-1.2的異常現象是分析的核心。
3.2.1 帶載UPS-1.1與系統總進線(測量點1 & 5)
- 測量點1和測量點5的數據高度一致:總有功功率約765kW,總電流約1130A,功率因數接近1,THDi極低(約2.5%)。
- 解讀: 這表明帶載的UPS-1.1工作完全正常,其所需能量幾乎全部由電網通過市電進線提供,整流器工作于理想狀態。系統總進線的良好電能質量排除了電網側存在嚴重問題或系統諧振的可能性。
3.2.2 空載UPS-1.2輸入側(測量點3)——故障核心
此測量點的數據揭示了事故的直接原因:
- 巨大的異常電流: A相和B相總電流高達5600A以上,而C相電流僅為57A,中性線電流為4A。這形成了極其嚴重的三相不平衡。
- 嚴重的諧波畸變: THDi高達64%-69%。諧波分析顯示,2次諧波電流尤為突出,A相達863A,B相高達1274A。3次、4次等偶次和奇次諧波電流也達到數百安培量級。
- 功率反向與畸變: A相和B相有功功率為負值(-24.8kW, -159kW),視在功率異常巨大(1521kVA, 913kVA),功率因數為負且接近于零。
- 解讀:
1) 異常環流: 巨大的A、B相電流主要并非流向UPS-1.2的整流器(因其空載,正常電流應很?。?,而是在UPS-1.2的輸入回路內部(可能通過其輸入濾波器、旁路電路或整流橋臂)形成了相間環流。這種環流在A-B相之間構成回路,因此C相和N線電流很小。
2) 能量回饋: 負的有功功率表明,在UPS-1.2的A、B相輸入側,存在能量從UPS端向電網側回送的現象。這并非正常的逆變器回饋,而是異常運行狀態下的表現。
3) 諧波源: 豐富的諧波,特別是強烈的2次諧波,通常與系統的不對稱和非線性運行有關,這進一步印證了內部電力電子器件處于異常導通或控制失穩狀態。
4、故障機理綜合分析與推斷
基于上述測試數據,我們進行層層遞進的推理分析:
4.1 排除性分析
- 系統諧振排除: 總進線(測量點1)電流諧波含量極低,且電壓總諧波失真率(THDu)未見異常升高,可排除電網側或系統級諧振引發過電流的可能。
- 測試誤差排除: 加載前后數據自洽,測量點1和5的一致性證明了測試系統的準確性。
- 斷路器本體質量問題: 雖初步懷疑,但連續三起相同工況下的相同故障,且能與異常電流數據精確對應,表明斷路器是在承受了遠超其設計能力的異常電流后失效,問題根源在于系統運行狀態而非斷路器本身。
4.2 根本原因推斷
所有證據均指向空載UPS-1.2的內部運行狀態。在并聯系統中,兩臺UPS的輸出通過并機柜強制同步。當UPS-1.1滿載時,其直流母線電壓可能因負載沖擊而略有波動。此時,處于在線模式但空載的UPS-1.2,其控制系統的任務是維持與UPS-1.1的精確同步,并穩定自身的直流母線電壓。
推測的故障鏈如下:
1) 控制策略觸發: 在單機重載、另一臺空載的極端不平衡工況下,空載UPS(UPS-1.2)的整流器控制邏輯可能進入一個非預期的“環流運行模式”。
2) 形成通路: 該控制模式可能導致UPS-1.2整流橋的某些開關器件(例如,與A、B相相關的IGBT)以異常的時序和占空比工作,并未進行有效的整流,反而在A、B相輸入電感/濾波器之間形成了一個低阻抗的環流通路。
3) 電流激增與諧波產生: 該通路被系統電壓激勵,產生巨大的工頻環流。同時,由于電力電子器件的快速開關與線路非線性,該環流被“斬切”和“調制”,產生了大量以2次諧波為主的諧波電流。
4) 過熱損壞: 此高達5600A的異常電流完全通過UPS-1.2的輸入電纜和其前端斷路器。斷路器內部的A、B相電流互感器(CT)持續承受此巨大電流,導致鐵芯飽和、渦流損耗急劇增加,最終因過熱而燒毀。斷路器拆解結果(A、B相CT嚴重燒毀,C相輕微受損)與測量數據完美吻合(見下圖)。
4.3 廠家反饋與待解問題
與UPS廠家技術專家聯合會診后,廠家承認其UPS的固件控制程序在此特定“一重一空”并聯工況下存在設計缺陷,會導致系統產生不可控的環流。然而,廠家未能清晰說明該環流產生的具體電路路徑和精確的觸發控制邏輯,這仍然是需要深入剖析的“黑箱”問題。
5. 結論
通過對多起同類型事故的復現、測試與系統性分析,本文得出以下明確結論:
1. 直接原因: 在2臺UPS并聯系統中,進行單機重載(125%)、另一臺空載在線的測試時,空載UPS會因其內部控制策略缺陷,在輸入側A、B相產生高達5600A的異常環流,并伴隨嚴重的諧波失真。
2. 損壞機制: 此異常電流長期流經空載UPS的前端斷路器,導致其內部A、B相電流互感器(CT)因極端過熱而燒毀,是開關冒煙和損壞的直接物理機制。
3. 問題根源: 故障的根本原因在于UPS設備在特定并聯冗余邏輯下的控制策略不完善,未能有效抑制或避免此種不平衡工況下的內部環流。
5.2 建議
鑒于該故障復現率極高,且UPS廠家短期內未能提供根本解決方案,為保障數據中心供電系統的安全,提出以下分級建議:
1. 立即措施(規避風險):
o 在所有已投運或新建的2臺UPS并聯系統中,嚴格禁止“一臺帶載、另一臺空載在線”的運行工況。
o 進行單機測試時,若非測試UPS不需投入,應將其輸入斷路器完全分閘,使其在電氣上徹底脫離系統,而非僅保持空載在線。
2. 中期措施(優化操作):
o 修訂UPS系統測試與運維規程,明確規定在并聯系統中,應盡量保持各臺UPS的負載率相對均衡,避免極大的負載差異。
o 考慮在UPS輸入回路增設高級保護繼電器,監測相電流不平衡度和諧波含量,在檢測到異常環流時提前告警或跳閘。
3. 長期措施(根本解決):
o 督促并配合UPS制造商,深入分析并升級其控制固件,從算法層面徹底解決此異常環流問題。應在廠內進行充分的極端工況測試以驗證解決方案。
o 在未來的UPS設備招標與技術協議中,應將“在N+1并聯系統中,單機滿載、其余空載的運行穩定性”作為一項強制性驗證要求,并要求廠家提供相關的型式試驗報告。
參考文獻
[1] IEC 62040-3: Uninterruptible power systems (UPS) - Part 3: Method of specifying the performance and test requirements.
[2] Fluke Corporation. Fluke 435 Series II Power Quality and Energy Analyzer User Manual.


