MoneyDJ新聞 2026-01-06 10:14:54 黃立安 發佈
NVIDIA執行長黃仁勳(附圖)於CES 2026演講中宣布,以天文學家Vera Rubin命名的次世代運算平台已正式進入全面量產階段,並一口氣更新設計涵蓋CPU、GPU、網路與資料處理在內的六款全新晶片,象徵NVIDIA正式邁入以極端共同設計(extreme co-design)為核心的全堆疊AI運算新世代。
黃仁勳指出,在已出貨的GB200基礎上,進一步推動GB300與全新Vera Rubin平台提前量產。他表示,GB300已進入全面量產階段,然而,若Vera Rubin要趕上今年的技術節奏,現在就必須投入生產,而如今Rubin 平台已正式進入全面量產階段。
Rubin平台以極端共同設計為核心理念,打破過往每一世代僅小幅更新一至兩顆晶片的慣例,這一代一口氣重新設計六款晶片,包括Vera CPU、Rubin GPU、NVLink 6交換器、ConnectX-9 SuperNIC、BlueField-4 DPU,以及Spectrum-6 Ethernet交換器。
黃仁勳指出,在摩爾定律放緩、電晶體成長受限的現實下,單靠製程微縮已無法支撐AI所需的效能躍進,必須在整個系統、晶片與軟體堆疊層級同步創新,才能突破效能天花板。
核心運算方面,Vera CPU在功耗受限條件下每瓦效能較前一代提升2倍,Rubin GPU則在電晶體數量僅增加1.6倍的情況下,實現浮點運算效能5倍提升;系統層級則透過NVLink 6交換器,使單一機架內資料傳輸能力達260TB/s。
在網路與能效方面,Rubin平台結合 ConnectX-9、Spectrum-6與 BlueField-4,並將AI的KV Cache工作記憶體延伸至網路fabric,以因應長上下文與高併發推論需求;在功耗倍增的情況下,系統仍可維持45°C熱水冷卻、免除冷水機,整體能源效率提升一倍,並可為全球資料中心節省約6%用電。
以10兆參數模型為例,訓練僅需Blackwell四分之一的系統規模即可完成,推論token成本最高可降低達10倍。
黃仁勳總結表示,AI已重新發明整個運算堆疊,而NVIDIA的角色不只是製造晶片,而是打造涵蓋晶片、系統、網路、模型到應用的完整AI平台,持續推動產業邁向下一個前沿。