AI沒人類也能升級?Anthropic懇求放慢實驗腳步

2026/06/05 14:15

MoneyDJ新聞 2026-06-05 14:15:09 郭妍希 發佈

知名AI聊天機器人Claude開發商Anthropic剛完成新一輪融資、公司估值直逼1兆美元,並已提交秘密上市申請文件。然而,這家AI獨角獸的共同創辦人Jack Clark與內部研究院The Anthropic Institute負責人Marina Favaro卻聯名發表文章,公開懇請全球頂尖AI實驗室權衡放慢研發腳步,並詳細揭露必須「踩煞車」的核心理由。

華爾街日報、Seeking Alpha報導,Clark、Favaro 4日透過官方部落格發文警告,前沿AI系統的推進速度極其驚人,目前正逐漸邁向「遞迴式自我改進」(recursive self-improvement)。這意味著,AI系統很快就能自行升級並優化自身代碼,建立出更強大的下一代繼任者,完全不需要人類干預。

Clark 5月曾在倫敦演講時直言,「這類技術在人類歷史上從未存在過,但我相信它可能在未來兩年內發生,甚至更快。」部分AI業內人士將此視為AI引發巨大社會動盪與風險的門檻。

他當時說,「在缺乏全球協調、一致放慢腳步的情況下,我們只能面對當前的現實:各國科技巨頭深陷競爭泥淖,以驚人的速度開發強大技術。在這場角逐中,商業利益與地緣政治的對抗,掩蓋了這項新興技術對人類物種存續所帶來的深遠威脅。」

根據Anthropic 4日揭露的內部數據,AI開發的每個步驟中,人類的角色正在縮小。舉例來說,截至2026年5月,Anthropic併入其程式碼庫(Codebase)的代碼,已有超過80%是由AI模型「Claude」撰寫。

此外,目前Anthropic工程師每季交付的程式碼數量,是2021年至2025年期間的8倍,這並非因為執行長Dario Amodei逼迫員工住在辦公室或每週工作100小時,而是因為Claude理解指令與寫程式的能力大增。AI代理人現在不僅能自行編寫和編輯代碼,還能將長達數小時的工作分配給其他代理人。

文章警告,一旦人類與AI寫程式的品質達到同等水平,人類將完全停止寫程式,轉為只負責審查。然而,如果人類審查代碼的速度趕不上Claude生成的速度,人類的審查動作反而會變成阻礙AI發展的「瓶頸」(bottleneck)。

目前的技術進展下,工程師只要給予Claude一個目標,它就能在不被賦予具體方法的情況下自行找出達成路徑;在科學研究中,Claude執行實驗的能力甚至已能追平或超越人類(儘管目前仍需人類給予任務提示)。

然而,一旦AI具備完整的遞迴自我改進能力、開始自行設定目標並建造繼任者時,人類將面臨重大危機、失去對AI系統的控制力。

Favaro與Clark警告,「目前模型中存在的少數『不對齊』(misalignment,指AI表現背離人類意圖)現象,可能會在模型建造繼任者時不斷放大(compound)。這種情況會變得越來越頻繁,但越來越難被理解,直到我們徹底失去對它們的控制。」 屆時,人類甚至可能無法建立、整合與驗證所需的工具,來理解自己究竟是處於哪一條危險的趨勢線上。

Anthropic執行長Dario Amodei去(2025)年初曾預測,AI恐於兩年內追上「一整個國家的天才」(a country of geniuses)的集體智慧。

Amodei當時傳達的訊息有三大重點:維持民主國家在AI發展的領先地位、設法因應安全風險,並為AI對經濟的干擾做好準備。安全議題方面,Amodei尤其關注如何防止非國家行為者(non-state actors)濫用AI,以及如何控制先進AI系統的自主(autonomous)風險。

(圖片來源:shutterstock)

*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用 個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

個股K線圖-
熱門推薦