完全由AI產生的色情！Deepfake產生不存在的人來創作，非法色情資料集再度「重生」 | T客邦

本網頁中的內容已依網站內容分級規定處理

需年滿18歲才可瀏覽，若您尚未年滿18歲，請點選離開。

我已年滿18歲進入瀏覽

我未滿18歲，離開

完全由AI產生的色情！Deepfake產生不存在的人來創作，非法色情資料集再度「重生」

ADVERTISEMENT

因「換臉」功能大熱門钅後，與情色相關的Deepfake應用程式在網路被禁用。但是，用來訓練這些色情演算法的非法裸體資料集，還在全球的色情社群流傳，而且可能會永遠流傳下去……

四年前，剛剛18歲的Jane作為受害者之一，在威逼利誘下，被迫參與拍攝了一個色情圖集。她和其他21名女性的裸照和色情影片在之後在一個名叫「少女色情」（Girls Do Porn）的成人網站被公開。

拍攝方是一家捷克的色情製作公司Czech Casting，在被告發後，該公司被警方指控販運人口及強姦罪，被判決向其視頻中出現的22名女性支付近1300萬美元，創始人目前仍是FBI頭號通緝犯，這些照片也成為了非法色情素材被禁用。

▲ FBI通緝犯Michaels Pratt

雖然這個公司已經被關停，但Jane沒有想到的是，她的噩夢遠沒有結束。這些被迫拍下的裸照正作為色情資料集，成為了最近一種新型技術deepfake porn的訓練「養分」，在網路上繼續流傳存在。

一名博士生的「技術創新」專案：「我只是覺得這很酷」

一鍵脫衣、直接換臉，關於deepfake你肯定不陌生。

就像「不存在的人（thispersondoesnotexist.com）」這類專案一樣，deepfake這一機器使用機器學習演算法和數千張人臉圖片來產生不存在的人的真實感圖像，該資料集用於產生真實和不真實的裸女圖像，只不過最終產生的圖片看起來不像任何人。

某個人上傳資料集到網際網路上，可以將其插入「deepfake色情片」訓練集中，其他人則可以使用該資料集來創建「完全由AI產生的色情」。

不同於DeepNude利用社群網路中的私人照片，這次 Deepfake造假利用的是現有的成人色情作品。創建者認為在原有色情作品上，利用Deepfake 產生不存在的人臉進行二次創作可以避免法律上的懲罰和道德上的譴責。

但是，這也間接促成了相關裸照資料集被多次再度開始使用，並且使用人並不介意這些照片是否是合法的。

在為Czech Casting拍攝色情照片的第四年，Jane在一個論壇上發現了自己的老照片資料集。這個論壇由一名博士生開設，以炫耀他最新的個人AI專案：演算法產生的色情作品。

這個博士生給自己的演算法產生器取了個名字——「GeneratedPorn」，並命名為r / GeneratedPorn subreddit來發布有關該技術的訊息（下稱「 GP」）。

在公開訊息中，這個專案的創始人表示，他開啟這個專案只是因為想要提高自己的機器學習技能。與許多deepfake製作的色情產品不同，在專案最初，GP製作的圖像並不希望「以假亂真」，也不想騙過任何人讓觀眾覺得這是真實色情。因為GP產出的作品看起來幾乎不是人類，更不用說像特定的人了。

但是就像很多早期的deepfaker們一樣，作品的真實性也在迅速提高。GP在過去幾週內發布了幾項實驗，這些實驗以越來越精確的描繪裸露的人體，甚至是一些略帶動畫的圖像顯示，這也證明了，「完全由AI產生的色情」並不是不可能的。

「在我看來，這一切都是為了學習「很酷的技術」，但是後來我最終轉向色情作品，因為我認為這是一個很酷的概念，尤其是在看完相關影像之後。」

為了製作影片，GP使用了來自網路的資料集對演算法進行了訓練，其中就包括了主要由Czech Casting提取的圖像組成的資料集。這些資料集是託管的，可以從相關文件共享站點免費下載，是由使用者嘗試使用Deepfake和其他形式的演算法產生的圖像進行編譯的。GP在其中一個文件共享網站上找到了Czech Casting資料集。GP創作者表示如果他不這樣做，他會寫一個網路抓取工具來收集來自Czech Casting的圖像。

▲ Czech Casting資料集的經過審查的樣本

AI打造的匿名色情，這真的沒有傷害任何人嗎？

要創建透過演算法產生的完整的裸露身體的影片，需要許多真實、裸露的人的圖像和影像，因此，Czech Casting圖片資料集幾乎是為該演算法任務量身定製的資源。

GP說：「人們之所以選擇這樣的數據源，主要是因為使用了生成對抗模型（GAN），試圖為要嘗試產生的對象類別學習圖像的一般結構。」

「如果圖像在結構上相似，則模型可以瞭解有關物品類別的更精細/顆粒細節的訊息，例如臉上的酒窩或雀斑。這可以帶來更高的品質結果。」GP向Motherboard發送了他正在使用的資料集的樣本，其中還包括Girls Do Porn影片的圖像。GP的其他資料集還包括從網路上抓取的其他裸體圖像，包括其他色情網站，社群媒體以及使用者發布自拍照的子目錄，例如r / roastme，人們在其中發布圖像的子目錄等。

那麼，將這些非法資料集作為訓練數據使用是合法行為嗎？

匿名使用這些資料集的人說，由於他們在技術上產生的最終演算法產生的圖像不是真實的人，因此不會傷害任何人。

更有甚者認為，自己的創作是朝著未來邁出的關鍵一步。在未來，色情將根本不需要人類的色情表演者。

在r / MachineLearning subreddit上的一篇文章中解釋了他的演算法產生的色情作品是如何工作的，GP在解釋中途停頓了一下，以解決「潛在的道德問題」。他寫道：「我不知道該怎麼做，開啟這個專案的初衷是我想創造一個很酷的東西……我打算製作一個只供『粉絲』參與的社群，並提供個性化的『AI產生的裸照』來與人們交流。」「但是有一些我認識的人對此想法不太贊成，並說這是對一些人的傷害。因此，我決定不走這條路，以避開道德上問題。」

他在那篇文章中還指出，訓練資料集的道德話題是他關注的。他寫道：「是我們正在訓練的圖像涉及了道德倫理問題，還是圖像中的人員受到了某種形式的利用？」

但這些考慮並沒有阻止GP在社群媒體平台上公開發布該專案，大多數內容透過Twitter，Facebook，Reddit，OnlyFans等平台以及XVideos和Pornhub之類的站點在Internet上傳播了出去。

McAllister Olivarius律師事務所的律師HonzaČervenka專門從事「復仇色情」和相關技術方面的工作，並且一直在追蹤該捷克最大的色情公司Netlook所擁有的Czech Casting案。他在接受vice採訪中表示，這種圖像是有害的，因為它們是通過演算法運行並「匿名化」的。他說：「這是一門瘋狂的科學，它使Czech Casting施暴者的受害者再次受害。」

「簡直不公平，彷彿我的自由被剝奪了，」Jane說，他們（GP）為Czech Casting這類非法圖片拍攝方提供了一個新的使用場景。

目前 Reddit、XHamster 等多個網站已經將該軟體封殺，並強調Reddit 網站政策禁止非自願色情內容的分享和傳播，包括Deepfake作品。

資料來源：

文授權轉載自大數據文摘

謹慎發言，尊重彼此。按此展開留言規則