阿里巴巴發布並開源陸首個混合推理模型Qwen3

2025/04/29 10:02

MoneyDJ新聞 2025-04-29 10:02:04 記者新聞中心報導

綜合港媒及陸媒報導，今(29)日凌晨，阿里巴巴(9988.HK)旗下阿里雲發布新一代通義千問Qwen3系列人工智慧(AI)模型，一舉登頂全球最強開源模型。公司聲稱，新版模型可匹敵谷歌(Google)和OpenAI提供的最佳模型，在某些情況下甚至優於競爭對手，為中國國內首個「混合推理模型」，將「快思考」與「慢思考」整合進同一個模型，大為節省算力消耗。

新版Qwen3包括2個MoE模型和6個Dense模型，參數量從6億個到2,350億個。與DeepSeek-R1、OpenAI o1及o3-mini、馬斯克的Grok 3和谷歌Gemini 2.5 Pro等其他頂級模型比較，旗艦模型Qwen3-235B-A22B在編碼、數學、通用能力等基準評估中，取得具競爭力的結果。

此外，小型MoE模型Qwen3-30B-A3B的啟動參數數量是QwQ-32B的10%，表現更勝一籌，甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。六個Dense模型也已開源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，均在Apache 2.0許可下開源。

Qwen3模式支持兩種思考模式，其一為思考模式，在這種模式下，模型會逐步推理，經過深思熟慮後給予最終答案。這種方法非常適合需要深入思考的複雜問題。其二是非思考模式，能提供快速、近乎即時的反應，適用於對速度要求高於深度的簡單問題。

通義千問並表示，Qwen3模型推理能力大幅提升，在數學、程式碼和邏輯推理等評測中，達到同規模業界SOTA水準。為了開發能夠同時具備思考推理和快速回應能力的混合模型，阿里雲實施了一個四階段的訓練流程，包括長思維鏈冷啟動、長思維鏈強化學習、思維模式融合、通用強化學習。

個股K線圖-

回新聞列表