當(dāng)前,大模型帶來的“智慧涌現(xiàn)”,開啟模型參數(shù)的“軍備競賽”,讓人類又一次站在了技術(shù)革命的轉(zhuǎn)折點。從參數(shù)規(guī)模持續(xù)擴張到多模態(tài)能力融合,算力需求呈現(xiàn)出指數(shù)級增長趨勢。產(chǎn)業(yè)界普遍共識:算力已從“支撐工具”轉(zhuǎn)變?yōu)椤吧a(chǎn)要素”逐步演化為類似電力與石油的基礎(chǔ)資源,其重要性正在不斷上升。
從技術(shù)節(jié)奏來看,領(lǐng)先的人工智能超級計算機性能正以“每9個月翻一番”的速度躍升,這一趨勢直接推動數(shù)據(jù)中心向更高功率密度、更高能效比方向演進(jìn)。與此同時,大模型從訓(xùn)練向推理側(cè)遷移,推理需求的爆發(fā)進(jìn)一步拉動了對穩(wěn)定、高效算力供給體系的依賴,形成長期增長曲線。
從產(chǎn)業(yè)鏈結(jié)構(gòu)來看,AI的發(fā)展已經(jīng)形成“應(yīng)用—模型—基礎(chǔ)設(shè)施—芯片—能源”的五層架構(gòu)。對話式AI、數(shù)字生物學(xué)、自動駕駛、企業(yè)級AI智能體、科學(xué)智能、智能機器人、智能工業(yè)、AI編程等應(yīng)用持續(xù)擴展,對實時性、穩(wěn)定性以及成本控制提出了更高要求,使得傳統(tǒng)數(shù)據(jù)中心逐漸難以滿足新一代負(fù)載特征。
從模型和基礎(chǔ)設(shè)施層來看,算力正在從“計算能力”向“決策能力”轉(zhuǎn)化,是驅(qū)動底層硬件需求持續(xù)增長的終極引擎。在這一背景下,“AI工廠”概念逐漸成型。算力基礎(chǔ)設(shè)施不再是單一服務(wù)器或機房,而是涵蓋超大規(guī)模數(shù)據(jù)中心、高速互聯(lián)網(wǎng)絡(luò)、液冷散熱及供電架構(gòu)的完整基礎(chǔ)設(shè)施實體。
值得關(guān)注的是,行業(yè)巨頭的戰(zhàn)略轉(zhuǎn)型進(jìn)一步驗證了這一趨勢。例如在GTC 2026大會上,英偉達(dá)明確提出從“芯片公司”向“AI基礎(chǔ)設(shè)施和工廠公司”的轉(zhuǎn)型,標(biāo)志著產(chǎn)業(yè)重心的遷移。未來競爭不再局限于芯片性能,而是延伸至整套基礎(chǔ)設(shè)施能力,包括能效、部署密度以及系統(tǒng)穩(wěn)定性等綜合指標(biāo)。
從產(chǎn)業(yè)投資情況來看,英偉達(dá)預(yù)測顯示,到2027年,全球AI基礎(chǔ)設(shè)施市場規(guī)模將達(dá)到萬億美元級別,并仍處于持續(xù)增長通道。從芯片廠商到云服務(wù)商,再到基礎(chǔ)設(shè)施提供商,均在加大投入力度??梢灶A(yù)見的是,隨著AI推理拐點的到來,市場需求將進(jìn)一步爆發(fā)。
從千瓦到兆瓦,數(shù)據(jù)中心面臨結(jié)構(gòu)性挑戰(zhàn)
隨著算力規(guī)模的持續(xù)擴大,數(shù)據(jù)中心正快速邁入“超高功率密度”時代。從英偉達(dá)AI計算平臺的演進(jìn)路徑來看,機柜功率需求正在顯著攀升: Vera Rubin NVL72約280kW,Rubin Ultra NVL576預(yù)計將提升至600kW,而下一代Feynman架構(gòu)預(yù)計將突破1MW。
由此可見,單機柜功率正從數(shù)百千瓦級加速邁向兆瓦級。這一變化對傳統(tǒng)數(shù)據(jù)中心的供配電、散熱及整體架構(gòu)設(shè)計都提出了前所未有的挑戰(zhàn)。
首先,散熱問題成為最核心的瓶頸。傳統(tǒng)風(fēng)冷技術(shù)在高功率密度環(huán)境下已接近物理極限,難以有效帶走持續(xù)增長的熱量。同時,隨著AI芯片性能不斷提升,其熱設(shè)計功耗(TDP)也在持續(xù)攀升,尤其是在國產(chǎn)算力芯片中,系統(tǒng)熱設(shè)計問題更加嚴(yán)峻,亟需更高效的散熱方式。
其次,供配電系統(tǒng)也面臨巨大壓力。高密度算力集群對電力穩(wěn)定性與效率提出更高要求,傳統(tǒng)供電架構(gòu)難以支撐快速波動的負(fù)載變化。尤其是在AI訓(xùn)練和推理場景中,算力負(fù)載呈現(xiàn)出劇烈波動特征,對電力系統(tǒng)的響應(yīng)速度提出了更高標(biāo)準(zhǔn)。
再者,數(shù)據(jù)中心的空間利用效率問題日益凸顯。高密部署成為必然趨勢,但這也意味著設(shè)備間距縮小、熱耦合增強,進(jìn)一步加劇散熱難度。如何在有限空間內(nèi)實現(xiàn)更高算力密度,同時保證系統(tǒng)穩(wěn)定運行,成為行業(yè)普遍難題。
此外,能源成本與可持續(xù)性問題也逐漸成為制約因素。AI基礎(chǔ)設(shè)施的能源消耗巨大,穩(wěn)定、低成本、可持續(xù)的能源供給成為產(chǎn)業(yè)發(fā)展的基礎(chǔ)條件。未來數(shù)據(jù)中心不僅要“算得快”,還要“用得省”,在保障算力輸出的同時,實現(xiàn)節(jié)能降耗。
曙光數(shù)創(chuàng)高級副總裁張鵬博士
當(dāng)前AIDC的核心矛盾已經(jīng)從“算力不足”轉(zhuǎn)向“基礎(chǔ)設(shè)施承載能力不足”。只有在散熱、供電與結(jié)構(gòu)設(shè)計上實現(xiàn)系統(tǒng)級突破,算力潛力才能真正釋放。正如曙光數(shù)創(chuàng)高級副總裁張鵬博士在2026曙光數(shù)創(chuàng)戰(zhàn)略發(fā)布會上所強調(diào)的,“AIDC基礎(chǔ)設(shè)施未來發(fā)展趨勢是高密部署、液冷主導(dǎo)、以冷輔芯、以基強算?!?
液冷,AI發(fā)展的“必選項”
在高密算力驅(qū)動下,液冷技術(shù)正在從“可選方案”轉(zhuǎn)變?yōu)椤氨剡x項”。與傳統(tǒng)風(fēng)冷相比,液冷具備更高的換熱效率和更低的能耗水平,能夠有效支撐高功率密度場景下的穩(wěn)定運行。
從技術(shù)類型來看,液冷主要包括冷板式液冷與浸沒式液冷兩大路徑。液冷技術(shù)的選擇要“因地制宜”,不同冷卻功率需匹配不同散熱技術(shù)。例如在0-10kW單柜場景中,風(fēng)冷仍具備成本優(yōu)勢;在10-150kW區(qū)間,單相冷板液冷成為最優(yōu)選擇;而當(dāng)單柜功率超過200kW時,兩相浸沒式液冷優(yōu)勢開始顯現(xiàn)。
這種“因地制宜”的技術(shù)路徑選擇邏輯,反映出液冷產(chǎn)業(yè)正在走向精細(xì)化發(fā)展。不同算力場景對應(yīng)不同冷卻方案,而不是單一技術(shù)路線的全面替代。這也意味著,未來數(shù)據(jù)中心將呈現(xiàn)多技術(shù)并存的格局。
經(jīng)濟性方面,液冷的優(yōu)勢也逐漸顯現(xiàn)。盡管初期投資較高,但在高功率密度場景下,其單位算力成本更低,長期運營收益更優(yōu)。尤其是在能源成本持續(xù)上漲的背景下,液冷的節(jié)能價值愈發(fā)突出。
C8000 V3.0引領(lǐng)兆瓦級整機柜時代
在上述產(chǎn)業(yè)背景下,曙光數(shù)創(chuàng)推出的MW級相變浸沒式液冷整機柜及其基礎(chǔ)設(shè)施整體解決方案C8000 V3.0,正是面向未來高密算力場景的一次系統(tǒng)性創(chuàng)新。曙光數(shù)創(chuàng)資深技術(shù)專家黃元峰博士在發(fā)布會上介紹說,該方案以相變浸沒液冷換熱技術(shù)為核心,具備超強換熱、高效配電、極致節(jié)能、智能控制、安全可靠等系統(tǒng)級優(yōu)勢,標(biāo)志著數(shù)據(jù)中心正式邁入“兆瓦級整機柜”時代。
曙光數(shù)創(chuàng)資深技術(shù)專家黃元峰博士
從整機形態(tài)來看,C8000 V3.0采用全浸沒刀片式液冷服務(wù)器架構(gòu)設(shè)計,單機柜最高可支持40片熱插拔刀片服務(wù)器,單刀片功率最高可達(dá)20kW。這種高密度設(shè)計不僅顯著提升算力部署效率,也為未來多樣化算力芯片提供了靈活適配能力,能夠支持多種計算芯片并行運行,滿足AI訓(xùn)練與推理的復(fù)雜需求。
MW級相變浸沒式液冷整機柜及其基礎(chǔ)設(shè)施整體解決方案C8000 V3.0
在散熱能力方面,方案通過高效能相變換熱單元(CDM)實現(xiàn)突破性提升。該系統(tǒng)采用“一拖二”創(chuàng)新架構(gòu)設(shè)計,最大換熱能力達(dá)到1.72MW,使單柜散熱能力跨入兆瓦級區(qū)間。在僅2.8立方米的體積內(nèi),可支持高達(dá)1500kW的散熱能力,相比傳統(tǒng)數(shù)據(jù)中心架構(gòu),其空間利用率和能效水平均實現(xiàn)跨越式提升。
在供電系統(tǒng)方面,C8000 V3.0引入高壓直流配電單元HVDC,提供高壓直流直接入柜的配電方案,單機柜最大支持900kW供電能力。相比傳統(tǒng)交流供電方案,該架構(gòu)能夠有效減少能量轉(zhuǎn)換損耗,提高整體供電效率,同時增強對高動態(tài)負(fù)載的響應(yīng)能力,為AI算力波動提供穩(wěn)定支撐。
從系統(tǒng)設(shè)計角度來看,方案實現(xiàn)了真正意義上的“全系統(tǒng)精密設(shè)計”。不僅涵蓋機殼、刀片、散熱部件等核心結(jié)構(gòu),還打通液體、氣體、電氣與信號連接路徑,通過高可靠穿壁密封技術(shù),實現(xiàn)內(nèi)外環(huán)境的穩(wěn)定隔離。這種一體化設(shè)計,使系統(tǒng)在高密度、高功率運行條件下依然保持穩(wěn)定可靠。
在液冷技術(shù)層面,C8000 V3.0基于自主研發(fā)的電子氟化液,構(gòu)建完整的相變浸沒冷卻體系,具備業(yè)界領(lǐng)先的兩相換熱能力。結(jié)合微納復(fù)合強化沸騰結(jié)構(gòu)設(shè)計,大幅增加氣化核心數(shù)量,使冷卻系統(tǒng)能夠在較低過熱溫度下實現(xiàn)高效沸騰換熱,從而進(jìn)一步降低能耗并提升散熱效率。
值得一提的是,曙光數(shù)創(chuàng)在相變浸沒液冷換熱技術(shù)領(lǐng)域累計投入超過億元,累計檢測材料超過2000種,并建立了完善的“黑白名單”體系。這種長期技術(shù)積累,使其在冷媒安全性與穩(wěn)定性方面具備顯著優(yōu)勢。
在智能化能力方面,方案實現(xiàn)了CDM、PDM與服務(wù)器的一體化監(jiān)控體系,并配備相變換熱自動控制系統(tǒng)。通過實時監(jiān)測溫度、流量與壓力等關(guān)鍵參數(shù),實現(xiàn)對整個熱管理系統(tǒng)的動態(tài)調(diào)節(jié)。這種智能控制能力,使系統(tǒng)能夠在復(fù)雜負(fù)載變化下保持最佳運行狀態(tài)。
在可靠性與安全性方面,C8000 V3.0同樣實現(xiàn)全面提升。系統(tǒng)采用多重密封結(jié)構(gòu),整機泄露率低于1×10??Pa·m3/s,同時滿足國軍標(biāo)7級潔凈度要求。結(jié)合泄露預(yù)警機制與高可靠材料體系,有效降低冷媒損失風(fēng)險,確保長期穩(wěn)定運行。冷媒輸送泵實現(xiàn)“零泄露、零維護(hù)”,顯著降低運維成本,提升系統(tǒng)可用性。
在節(jié)能與可持續(xù)性方面,方案整合了豎直分液單元(VCDU)、液冷換熱單元(CDU)、以及閉式冷卻塔(無壓縮機)等關(guān)鍵組件,形成“端-鏈-源”完整的熱管理體系,實現(xiàn)內(nèi)外循環(huán)協(xié)同。系統(tǒng)可以在更高水溫區(qū)間運行(外循環(huán)供回水溫度范圍控制在35-60℃),從而減少制冷能耗。
C8000 V3.0不僅是一套技術(shù)解決方案,更代表了一種面向未來“AI工廠”的基礎(chǔ)設(shè)施范式。它通過“整機柜+液冷+高壓供電”的深度融合,重新定義了高密算力部署方式,使數(shù)據(jù)中心從傳統(tǒng)IT設(shè)施升級為智能生產(chǎn)平臺。
正如黃元峰所強調(diào)的,“液冷走完最后1微米,算力才能真正解放。”在MW級算力時代,只有將散熱能力深入到基礎(chǔ)設(shè)施級、系統(tǒng)級乃至芯片級,才能真正釋放AI的潛能。而C8000 V3.0,正是這一理念的工程化落地。
結(jié)束語
站在AI基礎(chǔ)設(shè)施邁向萬億級美元市場規(guī)模的關(guān)鍵節(jié)點,算力競爭正在從單點技術(shù)突破走向系統(tǒng)能力比拼。高密度、低能耗、高可靠將成為未來數(shù)據(jù)中心的核心指標(biāo),而液冷與整機柜架構(gòu)將成為關(guān)鍵支撐路徑。
隨著大模型持續(xù)演進(jìn)與推理需求爆發(fā),算力基礎(chǔ)設(shè)施將迎來新一輪重構(gòu)周期。在這一進(jìn)程中,以曙光數(shù)創(chuàng)C8000 V3.0為代表的系統(tǒng)級解決方案,正在為行業(yè)提供一條可落地、可復(fù)制的技術(shù)路徑,加速“AI工廠”從概念走向規(guī)?;瘜嵺`。


