算力為王？多家小型AI晶片商：DeepSeek掀需求熱

2025/02/07 14:26

MoneyDJ新聞 2025-02-07 14:26:55 記者郭妍希報導

中國AI新創DeepSeek號稱以極低成本訓練出效能媲美美國OpenAI「o1」的先進AI模型，震撼全球，並衝擊AI晶片龍頭輝達(Nvidia Corp.)股價跳水。然而，數家小型AI晶片商透露，DeepSeek反倒在最近掀起需求熱潮，這家中國新創業者或將成為催化AI普及的重要力量。

CNBC 6日報導，身為輝達對手的AI晶片新創商Cerebras Systems執行長Andrew Feldman表示，開發商非常想要以DeepSeek「R1」等開源模型，替換掉OpenAI昂貴且封閉的產品。他說，R1釋出後，Cerebras服務需求的激增程度，在公司史上名列前茅。

Feldman補充說，R1的出現顯示AI市場不會由單一一家公司獨霸，對開源模型來說，硬體及軟體都不存在護城河。「就如同PC與網路，不斷滑落的價格帶動了全球普及。AI市場的成長軌道也類似。」

AI晶片新創d-Matrix執行長Sid Sheth、AI晶片商Etched共同創辦人兼營運長Robert Wachen也都說，DeepSeek釋出推理模型「R1」之後，想要加快部署AI推論(inference)的全球客戶，需求紛紛大幅跳高。

Wachen直指，「企業如今決定轉而把資本支出從訓練叢集投入推論叢集。DeepSeek的R1證明，對每一家大型模型提供商來說，推論時間運算如今已成為先進技術，而思考並不便宜——我們需要愈來愈多算力來擴展這些模型，以因應數百萬名用戶的需求。」

業界專家認為，DeepSeek可將AI產業循環從模型的訓練轉入「推論」階段。晨星證券分析師Phelix Lee解釋，AI模型訓練著重於建立一項工具或演算法，而推論則可將這些工具投入實際應用。

Cerebras 2月6日才剛宣布攜手法國開源AI新創獨角獸Mistral AI推出聊天機器人「Le Chat」，其推論速度躍居全球之冠，擊敗OpenAI和DeepSeek。

根據Cerebras 6日發布的新聞稿，Cerebras支援Le Chat最新的「Flash Answers」功能，可為用戶快速提供回應。Le Chat的推論速度每秒超過1,100個符元(token)，比ChatGPT 4o、Claude Sonnet 3.5和 DeepSeek R1等熱門AI模型快10幾倍，成為全球速度最快的AI助理。根據計算，Gemini 2.0 Flash (exp)、ChatGPT 4o、Sonnet 3.5和 DeepSeek R1的推論速度分別為每秒168、115、71、58個符元。

Feldman指出，隨著競爭者與OpenAI的模型逐漸縮小差距，回應使用者的速度成為更加優先的考量。他說，「若想要更加優質的答案，就得在推論時間投入更多算力。」

(圖片來源：shutterstock)

＊編者按：本文僅供參考之用，並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦，讀者務請運用個人獨立思考能力，自行作出投資決定，如因相關建議招致損失，概與《精實財經媒體》、編者及作者無涉。

個股K線圖-

回新聞列表