商傳媒|記者責任編輯/綜合外電報導
全球AI運算軍備競賽持續升溫,AI晶片龍頭輝達(NVIDIA)在美國舉行的「Hot Chips 2025年會」上,發表最新一代Blackwell GB200與GB300系統,同時公開MGX模組化架構技術細節。輝達這次不僅展示在超大規模資料中心的設計思維,也凸顯其推動開放式運算計畫(Open Compute Platform, OCP)的決心。
根據科技媒體《Wccftech》報導,輝達機械工程師諾頓(John Norton)在會中以「NVIDIA GB200/300案例研究」為題,說明開發過程中的挑戰與突破。諾頓表示,過去不同客戶需要針對管理模組、網路控制器(NIC)、CPU與GPU配置進行調整,每一次小改動往往會造成系統連鎖影響,難以快速擴展。
為解決此問題,輝達提出MGX架構,即透過將伺服器切分為標準化的「積木模組」,不同部件可靈活互換,同時制定統一介面規格,讓企業只需調整單一模組即可完成系統優化。更重要的是,輝達已將MGX貢獻給OCP,開放供應鏈與客戶共享,這意味各大資料中心業者可在統一規格基礎上,設計專屬的客製化解決方案。
在實體設計上,GB200與GB300機櫃採用分層結構:頂部為交換器,下方配置電源供應,再依序排列計算模組與交換模組。單一GB200機櫃包含18個計算模組與9個交換模組,整機效能高達1.4 Exaflops,單機櫃功耗約120瓩。
其中,每個計算模組(Compute Tray)配置2顆Grace CPU與4顆Blackwell GPU,並搭載主機處理模組(HPM)。在散熱方面,輝達採用100%液冷設計,並導入OCP標準的 UQD(Universal Quick Disconnect),大幅提升維護與更換效率。
此外,系統以NVLink Spine串接,單通道傳輸速率達200Gb/s,透過低延遲銅線互聯將所有GPU模組連成一體。為支撐如此龐大功耗,輝達亦重新設計電源匯流排(Bus Bar),將承載能力從35kW提升至140kW,並將機櫃深度由1068毫米擴展至1200毫米。
諾頓特別指出,MGX架構的一大優勢在於「開放規格」:輝達不僅提供完整3D模型與設計圖,也允許客戶依需求更換 SSD(如 U.2 或 E1S)、NIC 或管理解決方案,進一步提高靈活性。
業界觀察指出,這代表輝達正把過去「封閉式系統」轉化為「標準化開放平台」,此舉不僅有助於資料中心加速導入Blackwell系列,更有望推動上下游供應鏈快速擴展。
目前,GB200與GB300已正式量產,並在多個超大規模雲端服務商的資料中心運行;輝達同時承諾將維持「年度升級」節奏,在密度、能效與散熱技術上持續突破。未來隨著導入NVLink Fusion等新一代技術,Blackwell系統有望成為支撐全球AI訓練與推論的核心基礎。
市場分析師認為,隨著AI模型規模持續擴張,資料中心業者對高密度、低延遲且具開放性的硬體架構需求將持續攀升。輝達這次展示不僅是技術演進,更在宣示其要主導 AI 資料中心標準化的戰略。