科學家想用老鼠判別 Deepfake 製作的影片,但這事沒那麼容易

2019/08/15 11:21


 ;

自從 Deepfake 技術面世以來,就一直朝著不可控的方向發展。

 ;

 ;

從開始被用在小電影給女明星換臉,到美國總統川普、Facebook CEO 祖克柏等公眾人物相繼成為 Deepfake 技術的受害者,再到「一鍵脫衣」的 App「DeepNude」,Deepfake 技術帶來的負面影響愈加明顯。

更令人擔心的是,Deepfake 技術還在不斷進化。史丹佛等幾所學校之前發布的一項研究甚至能篡改影片的語句,只要輸入任意文本,就能讓影片中的演講者說出對應的話,比如將電視台主持人報導的「蘋果股價收盤於 191.45 美元」的數字改為「182.25 美元」。

儘管這兩個詞的發音和口型完全不同,但幾乎看不出修改痕跡。研究者經過調查發現,59.6% 的受試者認為被修改過的影片是真的,這項技術成功騙過了大部分人的眼睛。

Deepfake 技術讓網路世界變得更加真假難辨,與此同時不少科學家和機構也開始研發鑑別 Deepfake 的技術,開始了一場貓捉老鼠的遊戲。

據《華爾街日報》報導,本週在拉斯維加斯舉辦的黑帽網路安全大會上,來自俄勒岡大學的研究人員提出,老鼠等小動物未來或有助於鑑別偽造的影片和音頻。

研究人員發現,老鼠在辨識自然語音元素方面很有天分,能聽出聲音中的不規則性,比如透過訓練能區分 P、B、T 等不同音素,以及不同母音發聲的區別,進而辨識複雜的聲音,並檢測音頻的真實性。

科學家將條件反射來訓練小老鼠,讓老鼠在聽到真實和合成影片的時候分別跑向不同位置,如果辨識正確就給予獎勵,在測試過程中老鼠辨識假音頻的準確率達到 75%。

雖然當研究人員在添加一些新的聲音和母音的等變量後,老鼠辨識的準確率有所下降,但在經過一段時間的訓練後,還是能夠區分新的語音模式。

該研究計畫成員之一、俄勒岡大學研究生 Jonathan Saunders 認為,該技術還可以進一步優化,形成通用版本的 Deepfake 檢測演算法,但這需要更深入了解大腦是如何分析和處理聲音的。

儘管老鼠在聽覺研究領域有著很大潛力,但這也不意味著社交平台和影像網站將來透過飼養大量的老鼠就能夠鑑別 Deepfake 假影片。研究人員希望透過弄明白老鼠是如何辨識假音頻,進而更好地訓練機器來對抗 Deepfake 。

除了之外,目前很多研究團隊都採用生成式對抗網路(GAN)來鑑別 Deepfake ,以 AI 對抗 AI。

前不久,加州大學柏克萊分校和南加州大學的研究團隊就開發了一套 ;AI 鑑別系統,先透過生成式對抗網絡,提取川普、希拉蕊和歐巴馬等人的臉部、頭部運動特徵,合成假影片。

隨後再用機器學習分析真假影片的差異,進而得到每個人的「軟性生物特徵」(soft biometric signature),辨識出細微的動作特徵,這種檢測工具辨識 Deepfake 影片的準確率達到 95%,研究人員希望能在未來半年內提升至 99%。

去年美國國防部研究機構 ;DAPRA ;也研發出一個專門打假 Deepfake 的 AI 工具,抓住了 AI 生成的人臉缺乏眨眼功能的缺陷,透過檢測眼睛狀態判斷影片的真假,準確率高達 99%。

▲ 在原始影片(上圖)中,在 6 秒內檢測到眨眼動作。而 Deepfake 生成的假影片(下圖)則沒有眨眼。 (Source:紐約州立大學奧爾巴尼分校

遺憾的是,這套工具無法大規模地應用,研究人員正在試圖開發出一款可擴展的平台化工具,能對網路上大量的影片進行鑑別。

不過這種利用 AI 對抗 AI 的鑑別方式也存在問題,因為生成式對抗網路的原理就是讓兩套神經網路在相互博弈中學習,隨著鑑別技術的提升,假影片的品質也會進一步提高,兩者永遠處在不斷的對抗當中,誰也無法徹底打敗誰。

同時相比起 Deepfake 技術的研發,鑑別技術的科研力量顯得有點勢單力薄。據 ; ;DeepTrace 平台統計,2018年,全球涉及 GAN 生成圖像和影片的論文多達 902 篇,而研究如何辨識合成圖像和影片的論文只有 25 篇。

加州大學柏克萊分校的電腦科學家 Hany Farid 也指出,目前研究合成影片和鑑別的人數是 100:1, Farid 認為依靠技術現有的鑑別技術難以阻止 Deepfake 影片在社交平台上傳播:

解決方法不能只靠技術,還需要媒體專業的報導,以及更好的數位公民、公司和政策。

(本文由 ;愛范兒 ;授權轉載;首圖來源:pixabay)本文由科技新報授權轉載

個股K線圖-
熱門推薦