MoneyDJ新聞 2026-06-01 15:07:20 新聞中心 發佈
隨著生成式AI與Agentic AI應用快速擴展,AI訓練與推論工作負載正推動資料中心架構邁向更高運算密度與更高頻寬互連。仁寶(2324)於Computex 2026展會中,展示其基於NVIDIA HGX Rubin NVL8平台打造的高密度AI伺服器解決方案,並與NVIDIA提出的「七款全新晶片、一部出色的AI超級電腦」NVIDIA Vera Rubin架構願景相呼應,展現仁寶在新世代AI超級運算基礎設施上的工程整備能力。
NVIDIA Vera Rubin架構整合了NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6 Switch、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-X Ethernet與NVIDIA ConnectX-9 SuperNIC,形成完整的異質運算架構。透過NVLink 6交換技術,NVIDIA Vera Rubin NVL72機櫃級配置可提供最高260 TB/s的總互連頻寬,並實現每顆GPU 3.6 TB/s的全互連頻寬(all-to-all bandwidth),可有效支援Mixture-of-Experts(MoE)模型與大規模AI訓練與推論工作負載。
仁寶指出,此次推出OG231-2-L1系統,採NVIDIA HGX Rubin NVL8平台設計,於2U外型中整合8顆NVIDIA Rubin GPU,最高可提供400 petaFLOPS(NVFP4)運算效能,支援大型語言模型(LLM)訓練與推論、生成式AI及HPC應用。
該系統透過NVIDIA NVLink 6提供最高28.8 TB/s的GPU-to-GPU互連頻寬,大幅提升多GPU協同運算效率。平台支援最高2.3TB GPU記憶體容量與176TB/s記憶體頻寬,滿足記憶體密集型AI應用需求。同時,透過優化的直接液冷(Direct Liquid Cooling, DLC)設計,可穩定支援約24kW高功率密度運作,因應高密度AI工作負載與機櫃級部署需求。
在此液冷架構基礎上,仁寶進一步擴展產品組合,推出OG430-2-L1 ORv3 4OU液冷伺服器平台。該系統採用高功率密度液冷設計,可於長時間高負載AI工作情境下維持穩定運作,並支援最高8顆NVIDIA Blackwell Ultra GPUs,滿足HPC與AI從訓練到推論的多元應用需求。
此外,提供風冷(Air Cooling, AC)版本的SGX30-2 10U NVIDIA HGX B300伺服器系統,作為不同資料中心環境下的部署選項。該平台維持相同GPU規模配置,並針對AI與HPC工作負載進行優化,涵蓋從模型訓練至推論的應用場景。
仁寶表示,上述系統於展場以機櫃級整合配置形式呈現,結合運算節點、冷卻分配單元(Cooling Distribution Unit, CDU)及電力機櫃(power rack),展示高密度AI基礎設施於資料中心中的典型部署模式。在此架構下,運算、散熱與電力子系統得以協同運作,以支援高功率密度運算環境。
此一整合配置亦同步呈現NVIDIA新世代運算平台之關鍵組件,使GPU、CPU、互連技術及系統整合能於同一環境中完整展現。透過此一整體展示,清楚呈現新世代AI運算架構於實際資料中心環境中的部署方式,並強化基礎設施整合與部署規劃的可視性。
仁寶電腦基礎架構事業群副總經理張耀文表示:「隨著AI工作負載持續擴展,資料中心所面臨的挑戰已不僅是效能提升,更在於如何於有限的空間與功率條件下維持整體系統的穩定運作。隨著NVIDIA HGX Rubin NVL8平台帶來更高運算密度,散熱與部署已無法僅從單一系統層級考量,而需從整體運行環境進行規劃,使運算、電力與散熱能協同運作,並進一步推動設計視角由單機延伸至機櫃層級的系統運行。」
AI基礎設施持續朝向高密度與大規模發展,資料中心競爭力正逐漸取決於整體系統整合能力。透過此次COMPUTEX 2026展示,仁寶整合多樣化系統形態與液冷、氣冷設計,具體呈現高密度GPU系統於機櫃層級的實際運作方式,並協助客戶逐步建構可支援未來AI發展的基礎架構。