聯發科推出首個超越GPT3.5繁中大語言模型

2024/04/09 11:40

MoneyDJ新聞 2024-04-09 11:40:36 記者 萬惠雯 報導

聯發科(2454)旗下聯發創新基地發表平台上最新繁體中文大型語言模型MediaTek Research BreeXe(簡稱MR BreeXe),聯發科創新基地負責人許大山博士指出,MR BreeXe提供優異語文理解能力和雲/地兩端的彈性,也是首個超越GPT3.5繁中大語言模型,並朝繁中GPT4邁進,為現今繁中能力最強的語言模型,加上與聯發科生成式AI服務平台「MediaTek Davinci」的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。

許大山表示,聯發科去年開始釋出此模型,其中一款模型在上個月下載量已達8037次,也獲NVIDIA Taipei-1的協助。

聯發科表示,MR BreeXe是以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練之後,不但在繁體中文測試項目超越GPT-3.5,並對台灣常見的地端應用特別進行優化,提升產業界使用生成式AI與檢索增強生成的體驗。

聯發科表示,MR BreeXe於輝達的Taipei-1 GPU超級電腦DGX GH200上進行訓練,透過MediaTek Davinci支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習甚至微調的客製化。

(圖片來源:記者拍攝)

個股K線圖-
熱門推薦