百度副總裁：文心大模型3.5版能力超越ChatGPT 3.5

2023/07/20 09:16

MoneyDJ新聞 2023-07-20 09:16:24 記者新聞中心報導

IT之家昨(19)日引用網易科技報導，百度(9888.HK)集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示，新一代大語言模型、生成式AI(人工智慧)產品「文心一言」的新版本能力已超出ChatGPT 3.5，為百度展開相關技術工作重要的里程碑；此外，IDC最新發布《AI大模型技術能力評估報告，2023》顯示，百度文心大模型3.5拿下12項指標的7個滿分，綜合評分第一，演算法模型第一，行業覆蓋第一。

據悉，IDC評估報告圍繞產品技術、服務生態及行業應用三大方面，考察大模型的10多項指標，中國國內主流大模型包括百度、阿里巴巴(9988.HK)、騰訊(0700.HK)、華為、科大訊飛(002230.SZ)、360(601360.SH)、商湯(0020.HK)等14家廠商參與了本次評估。報告結果顯示，百度文心在模型能力、工具平台、生態布局及行業覆蓋上優勢明顯，並已提前進入商業化落實探索階段。

吳甜續指，百度自2019年開始深耕預訓練模型研發，先後發布知識增強文心系列模型；不久之前正式發布文心大模型3.5版本，進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新，新版本在各項能力上均有明顯提升；尤其是百度擁有自研的深度學習平「飛槳」有力支撐了大模型的高效訓練和推理；飛槳與文心的協同優化，讓文心大模型3.5最新版本的模型效果提升50%，訓練速度提升2倍，推理速度提升30倍。

在大模型生態方面，吳甜指出，百度文心已形成企業、教育、社區三位一體的生態體系，最新數據顯示，百度有超過750萬開發者基礎，20萬企業生態基礎，多層次開展大模型人才培訓、企業賦能、開發者營運；百度並設立了10億人民幣創投基金鼓勵大模型創意、繁榮大模型生態。

不過，吳甜直言，目前大模型產業化仍面臨著巨大的挑戰，總結起來有三方面，首先是大模型的體積確實很大，帶來的訓練難度高、成本高；第二是對算力規模要求非常大，性能要求非常高；第三在於數據規模亦很大，收集、挖掘、建設、篩選、清洗這些數據，本身也是非常大的大工程，「大模型平台是價格昂貴的大算力系統，其實完全不需要存在大量的大模型，對於應用者而言也不需要每個應用都進行大模型的開發」。

對於「百模大戰」的終局預測，吳甜認為，過去短短幾個月時間，大量新的大模型出現，但這是個階段現象，未來各個企業和機構會逐漸找到自己的定位，接著會走向自己細分的方向，終局只會集中在少量的幾個大模型，但依託幾個少量大模型，會有非常廣泛的應用生態出現。

(圖片來源：Shutterstock)

個股K線圖-

回新聞列表