阿里雲開源通義千問14B模型 擬共建大模型市場

2023/09/26 08:35

MoneyDJ新聞 2023-09-26 08:35:07 記者 新聞中心 報導

上證報報導,阿里巴巴(9988.HK)集團的數位技術和智慧骨幹業務阿里雲昨(25)日開源通義千問140億參數模型Qwen-14B及其對話模型Qwen-14B-Chat,可免費商用。

 

阿里雲副總裁、公眾與客戶溝通部總經理張啟表示,不管是閉源還是開源大模型,自研還是第三方大模型,大規模或小規模參數模型,以及通用或行業、企業專屬大模型,阿里雲全部歡迎和支援,共同建設一個最大的大模型自由市場;希望所有大模型都能跑在阿里雲上,跑得更快、更便宜、更安全。也因如此,阿里雲率先開源7B、14B模型,並將持續開源開放。

 

據了解,大規模預訓練模型參數量大、訓練成本高,開源大模型可幫助用戶簡化模型訓練和部署過程,使得使用者不必從頭訓練模型,只需下載預訓練好的模型並進行微調,就可快速建構高品質的模型或進行相應的應用開發。目前,7B(70億)參數是開源大模型中最常見的規模,此外較常見的開源模型尺寸還有13B(130億)、20B(200億)、70B(700億)等。

 

在此之前,今年8月阿里雲開源通義千問70億參數基座模型Qwen-7B,一個多月下載量突破100萬。此次最新開源的Qwen-14B是一款支援多種語言的高性能開源模型,相較同類模型使用了更多的高品質數據,整體訓練數據超過3兆Token,使得模型具備更強大的推理、認知、規劃和記憶能力;用戶可從魔搭社區直接下載模型、體驗模型,也可透過阿里雲靈積平台訪問和調用Qwen-14B和Qwen-14B-Chat。

 

(圖片來源:Shutterstock)

個股K線圖-
熱門推薦