阿里千問推Qwen3新編程模型,顯著降低推理成本

2026/02/04 12:01

MoneyDJ新聞 2026-02-04 12:01:46 新聞中心 發佈

綜合陸媒報導,阿里巴巴千問今(4)日正式推出Qwen3-Coder-Next,為一款專為編碼代理與本地開發優化的開放權重語言模型。

該模型基於Qwen3-Next-80B-A3B-Base建構,採用混合注意力與MoE新架構,透過大規模可執行任務合成、環境互動及強化學習進行智慧體訓練,在顯著降低推理成本的同時,獲得了強大的程式設計與智慧體能力。該模型已開源至ModelScope與Hugging Face平台。

使用SWE-Agent框架時,Qwen3-Coder-Next在SWE-BenchVerified上達到70%以上準確率。在多語言設置及更具挑戰的SWE-Bench-Pro基準上保持競爭力。儘管啟動參數規模很小,該模型在多項智慧體評測上仍能匹敵或超過若干更大的開源模型。Qwen3-Coder-Next(3B啟動)的SWE-Bench-Pro表現可與啟動參數量高10到20倍的模型相當。

個股K線圖-
熱門推薦