微軟推出「VASA 1」讓蒙娜麗莎開口秀饒舌

2024/04/19 13:36

微軟推出人工智慧模型「VASA 1」，只要上傳圖片跟聲音檔案就可以產生一段逼真的影片，還能3D旋轉、調整頭部跟視線角度，操作靈活，連達文西名畫中的《蒙娜麗莎》都能流利的唱饒舌歌。

微軟人工智慧照片和錄音生成逼真虛擬角色

據說達文西的名畫《蒙娜麗莎》不管從哪個角度看，她的眼神都會盯著觀眾，仔細看看這張圖片，優雅的蒙娜麗莎突然扯開喉嚨，流利的唱起RAP饒舌歌，畫面震撼，還以為是網路惡搞迷因，但這是微軟新推出的人工智慧模型。

根據《CNN》報導，微軟研究人員開發了新人工智慧模型「VASA 1」，只需要一張靜態的臉部肖像和某人說話的音檔，就可以自動生成逼真影片，圖片中的人會開口說話，並且具有說服力的嘴型同步自然面部表情跟頭部動作。

「VASA 1」畫面簡潔，上傳圖片跟聲音檔案就可以產生一段逼真的影片，還能3D旋轉、調整頭部跟視線角度，操作自由度之高，令人目眩神迷，但也引發質疑，是否會助長假資訊氾濫？

《CNN》記者道芙指出，可能導致網路上的錯誤訊息和混亂，因此微軟表示，並沒有計劃公開發布VASA 1。

微軟發表聲明，坦承的確有濫用疑慮，將暫時不開放給民眾使用，但開發人工智慧技術原先就是為了促進人類福祉。

記者道芙提到，但微軟表示，這項技術最終可能會在各種領域發揮作用，例如教育或為人們提供虛擬伴侶。

人工智慧高速發展，真假難辨引發輿論。今年三月歐盟議會才通過全球首例的人工智慧法規，期待能妥善規範AI技術。

國際中心／綜合報導　責任編輯／網路中心

（本文由台視新聞授權轉載）

個股K線圖-