算力為王?多家小型AI晶片商:DeepSeek掀需求熱

2025/02/07 14:26

MoneyDJ新聞 2025-02-07 14:26:55 記者 郭妍希 報導

中國AI新創DeepSeek號稱以極低成本訓練出效能媲美美國OpenAI「o1」的先進AI模型,震撼全球,並衝擊AI晶片龍頭輝達(Nvidia Corp.)股價跳水。然而,數家小型AI晶片商透露,DeepSeek反倒在最近掀起需求熱潮,這家中國新創業者或將成為催化AI普及的重要力量。

CNBC 6日報導,身為輝達對手的AI晶片新創商Cerebras Systems執行長Andrew Feldman表示,開發商非常想要以DeepSeek「R1」等開源模型,替換掉OpenAI昂貴且封閉的產品。他說,R1釋出後,Cerebras服務需求的激增程度,在公司史上名列前茅。

Feldman補充說,R1的出現顯示AI市場不會由單一一家公司獨霸,對開源模型來說,硬體及軟體都不存在護城河。「就如同PC與網路,不斷滑落的價格帶動了全球普及。AI市場的成長軌道也類似。」

AI晶片新創d-Matrix執行長Sid Sheth、AI晶片商Etched共同創辦人兼營運長Robert Wachen也都說,DeepSeek釋出推理模型「R1」之後,想要加快部署AI推論(inference)的全球客戶,需求紛紛大幅跳高。

Wachen直指,「企業如今決定轉而把資本支出從訓練叢集投入推論叢集。DeepSeek的R1證明,對每一家大型模型提供商來說,推論時間運算如今已成為先進技術,而思考並不便宜——我們需要愈來愈多算力來擴展這些模型,以因應數百萬名用戶的需求。」

業界專家認為,DeepSeek可將AI產業循環從模型的訓練轉入「推論」階段。晨星證券分析師Phelix Lee解釋,AI模型訓練著重於建立一項工具或演算法,而推論則可將這些工具投入實際應用。

Cerebras 2月6日才剛宣布攜手法國開源AI新創獨角獸Mistral AI推出聊天機器人「Le Chat」,其推論速度躍居全球之冠,擊敗OpenAI和DeepSeek。

根據Cerebras 6日發布的新聞稿,Cerebras支援Le Chat最新的「Flash Answers」功能,可為用戶快速提供回應。Le Chat的推論速度每秒超過1,100個符元(token),比ChatGPT 4o、Claude Sonnet 3.5和 DeepSeek R1等熱門AI模型快10幾倍,成為全球速度最快的AI助理。根據計算,Gemini 2.0 Flash (exp)、ChatGPT 4o、Sonnet 3.5和 DeepSeek R1的推論速度分別為每秒168、115、71、58個符元。

Feldman指出,隨著競爭者與OpenAI的模型逐漸縮小差距,回應使用者的速度成為更加優先的考量。他說,「若想要更加優質的答案,就得在推論時間投入更多算力。」

(圖片來源:shutterstock)

* 編者按 :本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之 申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

個股K線圖-
瀏覽其它分類
熱門推薦

loading