百度副總裁:文心大模型3.5版能力超越ChatGPT 3.5

2023/07/20 09:16

MoneyDJ新聞 2023-07-20 09:16:24 記者 新聞中心 報導

IT之家昨(19)日引用網易科技報導,百度(9888.HK)集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,新一代大語言模型、生成式AI(人工智慧)產品「文心一言」的新版本能力已超出ChatGPT 3.5,為百度展開相關技術工作重要的里程碑;此外,IDC最新發布《AI大模型技術能力評估報告,2023》顯示,百度文心大模型3.5拿下12項指標的7個滿分,綜合評分第一,演算法模型第一,行業覆蓋第一。

 

據悉,IDC評估報告圍繞產品技術、服務生態及行業應用三大方面,考察大模型的10多項指標,中國國內主流大模型包括百度、阿里巴巴(9988.HK)、騰訊(0700.HK)、華為、科大訊飛(002230.SZ)、360(601360.SH)、商湯(0020.HK)等14家廠商參與了本次評估。報告結果顯示,百度文心在模型能力、工具平台、生態布局及行業覆蓋上優勢明顯,並已提前進入商業化落實探索階段。

 

吳甜續指,百度自2019年開始深耕預訓練模型研發,先後發布知識增強文心系列模型;不久之前正式發布文心大模型3.5版本,進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新,新版本在各項能力上均有明顯提升;尤其是百度擁有自研的深度學習平「飛槳」有力支撐了大模型的高效訓練和推理;飛槳與文心的協同優化,讓文心大模型3.5最新版本的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。

 

在大模型生態方面,吳甜指出,百度文心已形成企業、教育、社區三位一體的生態體系,最新數據顯示,百度有超過750萬開發者基礎,20萬企業生態基礎,多層次開展大模型人才培訓、企業賦能、開發者營運;百度並設立了10億人民幣創投基金鼓勵大模型創意、繁榮大模型生態。

 

不過,吳甜直言,目前大模型產業化仍面臨著巨大的挑戰,總結起來有三方面,首先是大模型的體積確實很大,帶來的訓練難度高、成本高;第二是對算力規模要求非常大,性能要求非常高;第三在於數據規模亦很大,收集、挖掘、建設、篩選、清洗這些數據,本身也是非常大的大工程,「大模型平台是價格昂貴的大算力系統,其實完全不需要存在大量的大模型,對於應用者而言也不需要每個應用都進行大模型的開發」。

 

對於「百模大戰」的終局預測,吳甜認為,過去短短幾個月時間,大量新的大模型出現,但這是個階段現象,未來各個企業和機構會逐漸找到自己的定位,接著會走向自己細分的方向,終局只會集中在少量的幾個大模型,但依託幾個少量大模型,會有非常廣泛的應用生態出現。

 

(圖片來源:Shutterstock)

個股K線圖-
熱門推薦