微軟推出「VASA 1」 讓蒙娜麗莎開口秀饒舌

2024/04/19 13:36

微軟推出人工智慧模型「VASA 1」,只要上傳圖片跟聲音檔案就可以產生一段逼真的影片,還能3D旋轉、調整頭部跟視線角度,操作靈活,連達文西名畫中的《蒙娜麗莎》都能流利的唱饒舌歌。

微軟人工智慧 照片和錄音生成逼真虛擬角色

據說達文西的名畫《蒙娜麗莎》不管從哪個角度看,她的眼神都會盯著觀眾,仔細看看這張圖片,優雅的蒙娜麗莎突然扯開喉嚨,流利的唱起RAP饒舌歌,畫面震撼,還以為是網路惡搞迷因,但這是微軟新推出的人工智慧模型。

微軟AI模型VASA 1,讓蒙娜麗莎開口唱饒舌歌。圖/翻攝自microsoft.com 

根據《CNN》報導,微軟研究人員開發了新人工智慧模型「VASA 1」,只需要一張靜態的臉部肖像和某人說話的音檔,就可以自動生成逼真影片,圖片中的人會開口說話,並且具有說服力的嘴型同步自然面部表情跟頭部動作。

仍有遭濫用疑慮 VASA 1暫不開放民眾使用

「VASA 1」畫面簡潔,上傳圖片跟聲音檔案就可以產生一段逼真的影片,還能3D旋轉、調整頭部跟視線角度,操作自由度之高,令人目眩神迷,但也引發質疑,是否會助長假資訊氾濫?

《CNN》記者道芙指出,可能導致網路上的錯誤訊息和混亂,因此微軟表示,並沒有計劃公開發布VASA 1。

微軟發表聲明,坦承的確有濫用疑慮,將暫時不開放給民眾使用,但開發人工智慧技術原先就是為了促進人類福祉。

記者道芙提到,但微軟表示,這項技術最終可能會在各種領域發揮作用,例如教育或為人們提供虛擬伴侶。

人工智慧高速發展,真假難辨引發輿論。今年三月歐盟議會才通過全球首例的人工智慧法規,期待能妥善規範AI技術。

國際中心/綜合報導 責任編輯/網路中心

(本文由 台視新聞 授權轉載)
個股K線圖-
熱門推薦