MoneyDJ新聞 2025-02-03 09:48:21 記者 郭妍希 報導

DeepSeek號稱能以極低成本訓練出效能媲美OpenAI聊天機器人「ChatGPT」的AI模型,對美國科技界投下震撼彈,並衝擊AI晶片龍頭輝達(Nvidia Corp.)股價跳水。然而,外媒分析,成本下降有助AI普及,反倒能提升輝達晶片需求。
MarketWatch專欄作家Jurica Dujmovic發文指出,無論是DeepSeek或其他大型語言模型(LLM)提供商,AI模型依舊需要繪圖處理器(GPU)及資料中心來運作。事實上,更有效率的模型有望促進AI普及:當成本下降,企業就可將省下來的資金再投入,進一步提升AI能力。
誠然,這代表高階GPU銷售量可能下滑,但輝達可在更為廣大的AI消費者市場提升銷量、彌補損失。DeepSeek的突破性發展,有望讓輝達專為消費者設計的GPU需求大增。
DeepSeek效能媲美OpenAI先進模型「o1」的AI模型「R1」,透過蒸餾(distillation)與量化(quantization)技術,能在消費者級的電腦執行,這暗示AI有望逐步民主化。隨著更具效率且開源的模型問世,過去曾是專有封閉市場的AI,如今有望跨入主流運算。
Dujmovic認為,輝達在這波轉換潮中極具優勢,不但能擴充現有的消費者AI業務,還能維持商用資料中心的領導地位。換言之,輝達在高效能資料中心商用晶片市場、以及個人AI消費者運算市場的地位,都有望同步提升。
何謂蒸餾?根據微軟(Microsoft)資深機器學習工程師Vishal Yadav、應用科學家Nikhil Pandey的說法,「蒸餾是一種將大型預訓練模型(即教師模型)的知識轉移到較小模型(即學生模型)的技術,能使學生模型達到與教師模型相當的效能」。「這項技術讓使用者能夠利用大型LLM的優質輸出,同時透過較小的學生模型降低推理成本。」
英國金融時報1月29日報導,OpenAI向該媒體透露,該公司發現了一些「蒸餾」證據,懷疑是來自DeepSeek。雖然蒸餾技術在業界很常見,但DeepSeek或許藉此打造了競爭模型,違反OpenAI的服務條款。
(圖片來源:shutterstock)
*編者按 :本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。