《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 從“深度偽造”到“深度合成”:AI為啥需要一次“正名”,?

從“深度偽造”到“深度合成”:AI為啥需要一次“正名”,?

2020-06-08
來源:與非網(wǎng)

在世人對 AI 的“邪惡性”進(jìn)行攻詰的浪潮中,,AI 造假,,可能已經(jīng)是現(xiàn)在排首位的理由了。

 

自從 2017 年 Deepfake(深度偽造)橫空出世以后,,人們驚呼原來 AI 在造假方面簡直天賦異稟,。此后“AI 生成內(nèi)容”技術(shù),特別是 GAN 算法的突飛猛進(jìn)更加印證了這一事實(shí),。不僅僅是 AI 換臉,,還有 AI 自動生成文本、語音,、圖像、視頻等等一切數(shù)字內(nèi)容,。

 

除了 AI 換臉帶來的色情視頻泛濫之外,,人們更進(jìn)一步擔(dān)心 AI 生成內(nèi)容技術(shù)在隱私侵犯、威脅信息安全,、操縱政治選舉等方面帶來全新挑戰(zhàn),。

 

人們往往會假設(shè),如果任由 AI 生成的內(nèi)容在互聯(lián)網(wǎng)中蔓延,,將會更進(jìn)一步?jīng)_毀互聯(lián)網(wǎng)世界的真實(shí)性邊界,。

 

forward (20).jpg



(被 AI 造假的扎克伯格“諷刺”自己的 Facebook 平臺)

 

Deepfake 之后,真相何在,?

 

如果哪些是真,,哪些是假,,普通人都難以分辨的時(shí)候,那么組成社會基石的真相和信任將就此坍塌,,但我們似乎還沒有做好活在“無信任社會”的準(zhǔn)備吧,。

 

德國哲學(xué)家康德在《實(shí)踐理性批判》中論證“人為什么不能說謊”的法則,揭示了“無信任社會”的悖論和荒謬,。假如“人人可以說謊”是一條社會的通行法則,,那么,每個(gè)人都不會再信任另一個(gè)人說的話,,這樣說話人的謊言也就不會得逞,。說謊而無人相信,就陷入了自相矛盾的境地,,反之“人人不能說謊”,,才應(yīng)該是正常社會的通行法則。

 

這就是說,,只有在默認(rèn)“人人應(yīng)該誠實(shí)”的信任社會里,,說謊者才可以通過成功騙到他人獲利,也會因?yàn)橹e言被戳穿而信譽(yù)破產(chǎn),。而在“無信任社會”中,,信息的真假判斷都難以進(jìn)行,那只能默認(rèn)一切都為“假”,,才會不至于上當(dāng)受騙,。但是相應(yīng)的代價(jià)是信任全無,合作難以達(dá)成,,交流也不再可能,,最終將會是社會的分崩離析。

 

當(dāng)然這只是理論上面最極端的演繹?,F(xiàn)實(shí)世界永遠(yuǎn)會在理論世界之下形成巨大的灰色空間,,人性的基石仍將亙古不變,技術(shù)的演進(jìn)也會一往無前,,而人性的弱點(diǎn)就會在這兩者的撕扯的張力中一直暴露無遺,。每一代的新人類除了持續(xù)的學(xué)習(xí)、進(jìn)化,,以適應(yīng)技術(shù)加速帶來的全新挑戰(zhàn),,似乎也沒有什么更好的辦法。

 

回到“Deepfake”為代表的“AI 生成內(nèi)容”技術(shù)來說,,它既不會成為將我們的社會拖向“無信任”的深淵,,也不會讓我們的人性變得更好或更壞一點(diǎn)。在一個(gè)即將到來的“虛實(shí)相容,、真假不分”的后真相世界當(dāng)中,,只會讓適應(yīng)這一變化的我們變得更加復(fù)雜和反脆弱,。

 

所以。這一略帶“貶義”的 Deepfake(深度偽造)的技術(shù)名詞,,需要被我們重新塑造為一個(gè)技術(shù)中性詞匯——Deep Synthesis(深度合成),。

 

為“深度合成”正名:AI 的技術(shù)中性

 

 

科技的每一次突破,都可能帶來意想不到的“副產(chǎn)品”,。

 

就如同愛因斯坦發(fā)現(xiàn)了質(zhì)能方程式之后,,即使再不情愿,他也無法阻止原子彈的出現(xiàn)和使用,。就在 Deepfake 這個(gè)“妖孽”在美國新聞網(wǎng)站 Reddit 被放出來之后,,AI 的領(lǐng)軍人物 Yann LeCun 也在 Twitter 上深深反省:

 

“說真的,,要是當(dāng)初知道卷積神經(jīng)網(wǎng)絡(luò)(CNN)會催生 Deepfake,,我們還要不要發(fā)表它?”

 

forward (19).jpg


 

隨即 LeCun 自己就回答了這個(gè)問題,。LeCun 表示,,即使不是我們首先公開發(fā)表,CNN 也會由其他人或機(jī)構(gòu)發(fā)明出來,。而在 2002 年當(dāng)時(shí)被公布出來以后,,人們也不知道如何來利用它。換句話說,,CNN 的價(jià)值要在技術(shù)人員的不斷探索下才能挖掘出來,。

 

現(xiàn)在 CNN 正在被開發(fā)出各種各樣的應(yīng)用,既對世界有很多正向的積極影響,,比如醫(yī)療診斷,、自動駕駛、內(nèi)容過濾以及安全監(jiān)控等等,,也可能引起一些負(fù)面的效果,,比如侵犯隱私、造假詐騙,、偏見歧視等等,,好壞參半,可以各打五十大板,。

 

簡單來說,就是 AI 無罪,,問題還是出在使用 AI 技術(shù)的人類身上,。

 

以 Deepfake 技術(shù)所引發(fā)的 AI 換臉的色情視頻泛濫來說,AI 技術(shù)被應(yīng)用于色情產(chǎn)業(yè)幾乎是一件“必然如此”的過程,。一方面,,現(xiàn)代色情產(chǎn)業(yè)一直都是最新科學(xué)技術(shù)應(yīng)用的急先鋒,,另一方面,AI 在圖像內(nèi)容生成技術(shù)的發(fā)展正好迎來了突破臨界點(diǎn),。最后一步就只剩下這個(gè)叫“Deepfakes”的用戶最后的“靈機(jī)一動”了,。

 

實(shí)際上,Deepfake 為“AI 內(nèi)容生成”技術(shù)的普及起到了推波助瀾的作用,,但同時(shí)也帶來難以抹去的污名化影響,。而鑒于“AI 內(nèi)容生成”技術(shù)的發(fā)展早已超出 AI 換臉的范疇,技術(shù)商業(yè)領(lǐng)域正在試圖用“深度合成”來為這一技術(shù)正名,。

 

首先,,Deepfake(深度偽造)一詞明顯以偏概全,其僅僅是“AI 換臉”技術(shù)的早期代表,,不足以包含所有的“AI 生成內(nèi)容”的技術(shù),。用 Deep Synthesis(深度合成)可以更好地泛指所有 AI 生成算法和涵蓋自動生成圖像、視頻,、語音,、文本、音樂等內(nèi)容的合成技術(shù),。

 

其次,,Deepfake 尚未得到技術(shù)社區(qū)的廣泛認(rèn)可,只是被媒體大眾叫順嘴了而已,。況且 Deepfake 自帶的“腹黑”體質(zhì),,對于 AI 技術(shù)的應(yīng)用推廣會帶來直接的負(fù)面影響。

 

“深度合成”這個(gè)更為中性的技術(shù)名稱,,將會代替 Deepfake 來行使 AI 內(nèi)容發(fā)展的應(yīng)盡之責(zé),。那么,“深度合成”該如何撐起這重任呢,?

 

“深度合成”的底氣:技術(shù)加速和商業(yè)落地

 

 

“深度合成”技術(shù),,其實(shí)就是借助可以自主學(xué)習(xí)的深度學(xué)習(xí)算法模型來實(shí)現(xiàn)的,其主要使用的的兩個(gè)技術(shù)就是“自動編碼器”人工神經(jīng)網(wǎng)絡(luò)和 “生成對抗網(wǎng)絡(luò)”(GAN)的人工神經(jīng)網(wǎng)絡(luò)組成,。前者用于訓(xùn)練數(shù)據(jù)的合成,,后者由生成器和鑒別器組成,一個(gè)用來進(jìn)行新數(shù)據(jù)的生成和一個(gè)用來對其進(jìn)行鑒別,,經(jīng)過二者無數(shù)次的對抗,,最終生成出“以假亂真”的合成數(shù)據(jù),其中就包括 Deepfake 所創(chuàng)造出來的換臉視頻,。

 

forward (18).jpg



(GAN 相關(guān)論文的發(fā)表情況)

 

從 2014 年,,GAN 提出一直到今天,已經(jīng)經(jīng)歷了從 CGAN,、BigGAN ,、StyleGAN 等多個(gè)版本更新,,其中每年的相關(guān)研究論文也在加速增長,可見學(xué)界對于 GAN 算法的重視和發(fā)展前景的看好,。

 

forward (17).jpg


(BigGAN 生成的包含各種類別的高清晰圖片)

 

與此相應(yīng)的,,就是圖像生成質(zhì)量的突飛猛進(jìn),其中不僅可以實(shí)現(xiàn)人臉的合成,,也能更一步實(shí)現(xiàn)圖像疊加融合,,或者直接生成全新的高清圖片,以致于人眼根本難以分辨真假,。

 

比如,,去年 MIT 和 IBM 沃森聯(lián)合實(shí)驗(yàn)室發(fā)布的一個(gè)基于 GAN 的 AI 藝術(shù)畫師,就可以學(xué)習(xí)文藝復(fù)興時(shí)期的畫家的繪畫風(fēng)格,,直接將現(xiàn)代人類的照片變成文藝復(fù)興時(shí)期的畫作,。

 

forward (16).jpg

 

其中的技術(shù)優(yōu)勢在于,GAN 神經(jīng)網(wǎng)絡(luò)會根據(jù)自己學(xué)到的技巧為畫面重新構(gòu)圖,,也就是它是畫出新的圖片,,而不是利用風(fēng)格遷移的方式,改變原圖的色彩,。

 

其實(shí),,深度合成技術(shù)已經(jīng)可以走得更遠(yuǎn)。除了單一的圖像,、音頻合成之外,,多維度的內(nèi)容合成已經(jīng)是一個(gè)趨勢,這樣可以將語音識別,、人臉識別,、唇形搜索等結(jié)合起來,進(jìn)行人臉語音的合成,,從而可以讓一個(gè)人自然流利地說出自己從未說過的話,。

 

forward (15).jpg

 

此外,人臉合成之外,,全身合成,、3D 合成虛擬人技術(shù)也成為當(dāng)前的應(yīng)用熱點(diǎn)。剛剛過去的兩會期間,,搜狗聯(lián)合新華社推出上崗的全球首個(gè) 3D 版 AI 合成主播,,就已經(jīng)可以在文本實(shí)時(shí)驅(qū)動面部表情和唇形,肢體動作,、超寫實(shí)細(xì)節(jié)呈現(xiàn)上面做到比擬真人的動態(tài)效果,。

 

在“深度合成”技術(shù)的商業(yè)化方面,已經(jīng)有眾多行業(yè)和企業(yè)看到其應(yīng)用場景和廣闊市場。目前,,“深度合成”已經(jīng)在影視娛樂、社交通訊等多個(gè)行業(yè)的場景中開始發(fā)揮作用,。

 

比如,,在影視劇制作中,最直接的幫助就是提升音視頻制作的效率,,拓展創(chuàng)作想象空間,;一些特殊情況下,還可以通過合成技術(shù)為影視劇的失聲的演員進(jìn)行聲音合成,,為已過世的演員進(jìn)行“數(shù)字復(fù)活”,;甚至直接創(chuàng)造虛擬數(shù)字人來進(jìn)行影視劇集的制作。

 

在娛樂應(yīng)用體驗(yàn)上面,,最基本的臉部特效應(yīng)用,、換臉視頻、動圖,,都已經(jīng)多次在我們的生活中出現(xiàn),;虛擬偶像、虛擬主播,、虛擬客服也隨著深度合成技術(shù)的成熟而變得越逼真和可信,。

 

在社交通訊上面,與其擔(dān)心深度合成技術(shù)會暴露個(gè)人隱私,,不如可以讓深度合成技術(shù)幫我們在社交網(wǎng)絡(luò)中建立自己的“數(shù)字分身”,,就如同《頭號玩家》里面每個(gè)人創(chuàng)建的虛擬形象一樣,成為自己在網(wǎng)絡(luò)世界的通行證,。

 

此外,,像電商營銷、教育藝術(shù),、醫(yī)療科研等領(lǐng)域,,深度合成技術(shù)帶來的仿真數(shù)據(jù)和虛擬化內(nèi)容都可以為這些產(chǎn)業(yè)帶來新的應(yīng)用場景或者直接推動該領(lǐng)域的技術(shù)進(jìn)步。

 

顯然,,深度合成技術(shù)的這些正向價(jià)值正在為其換來更有底氣的話語權(quán)和發(fā)展前景,。但是這個(gè)一出現(xiàn)就飽受人類質(zhì)疑和恐懼的 AI 技術(shù),仍然值得我們認(rèn)真對待其應(yīng)用邊界和規(guī)則,。

 

“深度合成”的治理:如何鎖住“虛假內(nèi)容”的惡龍

 

 

正如一切獲得都必須付出代價(jià)一般,,我們?nèi)绻胍硎苌疃群铣杉夹g(shù)帶來我們的一切生活便利和精神享受,,同時(shí)就必須承受其帶來的將數(shù)字世界全面虛擬化的代價(jià),。

 

深度合成技術(shù)所帶來的“虛假內(nèi)容”的社會風(fēng)險(xiǎn)將長期存在。首先,深度合成的開源技術(shù)和軟件,,讓普通人們偽造、操縱音視頻的門檻大幅降低,;其次,,這些虛假音視頻內(nèi)容足以以假亂真地騙過大多數(shù)“不明真相”的群眾,;最后,,這些帶有明顯色情、危言聳聽或侵犯隱私的信息又足以吸引人,,只要從源頭傳出,就會進(jìn)行源源不斷的擴(kuò)散,。

 

除了少數(shù)能夠辨別真?zhèn)蔚膶I(yè)人士,大多數(shù)人都難以分辨和抵制這些假信息的誘惑,。深度合成的技術(shù)濫用風(fēng)險(xiǎn),需要得到來自法律,、技術(shù)、行業(yè),、民眾等多方面的制約。

 

第一,,法律層面。對 AI 深度合成內(nèi)容的用途,、標(biāo)記,、使用范圍以及濫用技術(shù)的處罰,,都應(yīng)該進(jìn)行深入研究,,并出臺相應(yīng)的規(guī)定,,為深度合成的合法使用提供依據(jù),。

 

第二,技術(shù)層面,。與深度合成技術(shù)同步進(jìn)化的內(nèi)容鑒別技術(shù)和溯源追蹤技術(shù)也應(yīng)該得到重視。針對合成內(nèi)容的有效鑒別與標(biāo)記,,才能從源頭來識別合成內(nèi)容,,以防止負(fù)面的虛假內(nèi)容的擴(kuò)散,。

 

第三,行業(yè)層面,。深度合成技術(shù)離不開行業(yè)自律,合成內(nèi)容技術(shù)提供者和平臺要承諾在合成內(nèi)容之上必須做出標(biāo)記,,或者提供有效的檢測和標(biāo)注工具,來保證合成內(nèi)容被清晰識別出來,。

 

最后,民眾層面,。相比較于權(quán)威機(jī)構(gòu)或者主流精英人群對合成內(nèi)容泛濫的擔(dān)憂,廣大民眾反而可能是這波“虛擬化”浪潮最主要的支持者,,甚至是虛假信息的推波助瀾者。

 

在我們即將全面迎來數(shù)字化世界的今天,,培養(yǎng)合格“數(shù)字素養(yǎng)”應(yīng)該要成為一件從小就抓起的公民必修課。但這門課教什么,、怎么上,,仍然需要在深度合成技術(shù)發(fā)展的路上慢慢探索,。

 

正如沒有任何一個(gè)技術(shù)是我們在做好準(zhǔn)備之后才出現(xiàn),AI 技術(shù)也是如此,。

 

從一開始,我們就把 AI 技術(shù)出發(fā)點(diǎn)定義為,,盡可能地學(xué)習(xí)和模仿人類的能力,以致于最終能夠代替人類行駛那些繁重,、重復(fù)甚至極高難度的任務(wù),。

 

而深度合成技術(shù)不正是這一目標(biāo)的實(shí)現(xiàn)過程,。我們既然選擇喚醒 AI 這條巨龍,,就不能再“葉公好龍”地?fù)?dān)心 AI 越來越像人類這件事情。

 

最后,,反過來看我們?nèi)祟愡@個(gè)物種,一方面我們有極致的智慧去探索世界的因果規(guī)律,,始終去探索那個(gè)“真相”;一方面我們又抱著極大熱情來發(fā)明各種工具,,來承擔(dān)人類的各種工作。

 

這兩種能力也直接促成了我們今天的工業(yè)世界,,以及未來要進(jìn)入的數(shù)字虛擬世界。

 

樂觀來說,,我們不僅不用太過擔(dān)心“后真相時(shí)代”的來臨,甚至于,,我們還會很快適應(yīng)這個(gè)徹底“虛擬化”的美麗新世界。

 

對于絕大多數(shù)人來說,,追求真相,遠(yuǎn)遠(yuǎn)沒有追求舒適更具吸引力,。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected]