MoneyDJ新聞 2026-03-17 13:20:40 新聞中心 發佈
神達(3706)旗下子公司神雲科技參展NVIDIA GTC 2026,本次神雲科技以「Enterprise AI, Flexible by Design」為主題,展示其在NVIDIA MGX架構的AI伺服器與全方位AI一站式解決方案的最新突破。公司表示,透過與NVIDIA、AMD、存儲商DDN等產業領導者的策略合作,神雲科技持續推動加速運算與次世代資料中心的發展,為客戶提供涵蓋AI訓練、推理以及檢索增強生成(RAG)應用的端到端實力。
為解決現代AI工作負載的複雜性,神雲科技將硬體與先進軟體棧整合,實現無縫的GPU管理與高效能儲存應用。透過與Kubernetes營運管理平台商Rafay的戰略夥伴關係,神雲科技支援統一的控制面(control plane)功能,具備管理大規模容器化環境的能力。此項合作協助企業簡化Kubernetes編排,並透過Slurm控制器實現高效能運算(HPC)與AI工作負載的自動化調度。透過簡化複雜的編排流程,神雲科技與Rafay讓企業在擴展AI工作負載時,能兼顧效率與企業級的營運治理。
Rafay共同創辦人暨執行長Haseeb Budhani表示:「我們與神雲科技的合作,透過提供統一平台管理海量容器集群,簡化了現代AI的複雜性。藉由將Rafay的軟體棧與神雲於MGX架構的系統整合,我們協助企業自動化Kubernetes編排與Slurm AI任務調度,確保在嚴格的營運控制下實現高效擴展。」
這套進階的Pod管理解決方案係由神雲科技基於NVIDIA MGX參考架構所打造的次世代G系列伺服器高吞吐量4U AI Powerhouse,提供強勁動力。這款4U雙路伺服器搭載兩顆最新的AMD EPYC「Venice」處理器,並支援高達8張雙槽GPU。該系統專為大規模生成式AI訓練與推理量身打造,能提供現代AI工廠與企業級AI部署所需的極大吞吐量、低延遲與高擴展性。
針對多模態RAG(檢索增強生成)流水線對數據的密集需求,神雲科技與DDN聯手展示AI Data Storage Solution。此合作方案採用DDN Infinia,能為即時AI推理回應提供極低延遲的文檔檢索,並透過最小化數據移動來極大化GPU利用率,進而支援高吞吐量的AI工作負載。
此解決方案架構整合了神雲科技基於NVIDIA MGX架構的次世代4U AI平台,並由同樣基於NVIDIA MGX的R1917GC管理伺服器提供支援,構建出橫跨核心(Core)、邊緣(Edge)與管理層的統一AI基礎設施。R1917GC搭載NVIDIA Grace或NVIDIA Vera處理器,在嚴格的功耗限制下,利用LPDDR5X提供卓越的運算密度與記憶體頻寬。
此外,為了替AI規模的資料湖(Data Lake)架構奠定堅實基礎,此方案納入了GC68A-B8056儲存伺服器。這是一款1U單路高密度平台,具備支援DDR5-4800記憶體的24個DIMM插槽,以及12個支援熱插拔、免工具安裝的NVMe U.2硬碟槽,提供高效能的儲存密度。系統亦配備PCIe 5.0 x16 OCP v3.0 LAN子卡插槽與雙NVMe M.2開機碟插槽,確保大規模AI數據集與分析工作負載所需的極速數據攝取量與持續吞吐量。
神雲科技總經理黃承德表示:「透過與Rafay及DDN的策略合作,神雲科技提供全方位的一站式AI基礎設施,滿足AI訓練、推理與RAG應用的全生命週期需求。藉由將我們基於NVIDIA MGX架構且具備高度彈性的伺服器設計,與Rafay先進的AI基礎設施編排平台,以及DDN的智慧AI資料平台進行整合,我們正為次世代資料中心客戶提供全球先進的端對端解決方案。」