AI來搶編劇飯碗了?這個AI用GPT-2寫的劇本,預計2021年1月首播

AI來搶編劇飯碗了?這個AI用GPT-2寫的劇本,預計2021年1月首播

查爾斯大學、Švanda劇院和布拉格表演藝術學院的研究人員目前正在進行一個有趣的研究專案,將人工智慧和機器人技術與戲劇相融合。他們專案的主要目標是利用人工智慧創造一個創新的戲劇表演,預計將於2021年1月首演。

「我們研究背後的主要想法來自Tomáš Studeník,他是一位創新者,他注意到戲劇劇本R.U.R.的100週年紀念日即將到來,」進行這項研究的研究人員之一魯道夫·羅沙(Rudolf Rosa)說。

「這對機器人技術來說是一個關鍵的時刻,因為機器人的概念,包括『機器人』這個詞本身,是由卡雷爾·恰佩克(Karel Čapek)和他的兄弟約瑟夫(Josef)發明的,他寫了這個劇本。湯瑪士認為應該好好慶祝一下,於是就產生了把故事翻轉過來的想法:100年前,一個人寫了一部關於機器人的戲劇,如果今天,機器人寫了一部關於人類的戲劇呢?」

在開始研究他們的專案之前,研究人員回顧了以前的文獻,探索人工智慧技術在詩歌、音樂、繪畫或其他藝術形式的創作中的潛力。雖然現在有大量的論文關注機器生成的藝術,在一些論文中,運算技術被用於製作戲劇劇本的對話或故事創意,但是自動產生整個戲劇表演是一項非常複雜的任務,以前很少有人嘗試。

AI來搶編劇飯碗了?這個AI用GPT-2寫的劇本,預計2021年1月首播

羅沙和他的同事們決定將他們的劇本分成幾個小部分。他們的計畫是使用一種被稱為「分層產生」的方法,就是把大量文本的生成分割成可控的小部分。雖然其他研究團隊在過去使用這種方法來產生對話、劇本或其他文本,但很少有人嘗試使用這種方法來製作整個劇本。

「由於週年紀念日的臨近,我們的主要目標很明確,也很堅定:在2021年1月之前,我們需要有一部已準備好首演的戲劇。」羅沙解釋道。「由於將由專業劇團演出,我們需要在9月份準備好劇本,這樣就有足夠的時間戲劇化、彩排等。因此,儘管我們正在開發一個通用的戲劇劇本產生工具,但目前我們真正需要產生的只是一個劇本。」

到目前為止,研究人員用的是GPT-2的語言模型進行訓練。這是一個由OpenAI聯盟開發的開源模型,並在大量的在線英語文本上進行了訓練。他們測試的第一批結果被簡述在arXiv上預先發表的一篇論文中。

 

Rudolf Rosa

GPT-2是一個生成式語言模型,這意味著當經過充分訓練後,它可以使用相似的語言完成未完成的文本,並涵蓋相關主題。例如,如果給它輸入一篇新聞文章的第一段,該模型就會嘗試生成關於同一主題的另外幾段,將現有文本作為靈感來源,但也會產生關於新概念的句子。

「當我們向GPT-2輸入一個場景設置和幾句戲劇劇本時,它就會以同樣的風格生成進一步的台詞,並專注於輸入劇本塊的主題,」羅沙解釋道。「這樣一來,我們不需要訓練任何東西(目前),因為我們對生成器做了一點限制,讓它專注在自己的任務上,不偏離到其他地方。因此,我們可以利用在巨量文本上訓練了很長時間的巨大的GPT-2模型,我們自己沒有能力在我們的硬體上進行訓練,因為現在只有最大的技術公司才能訓練這樣的模型。」

雖然研究人員使用預先訓練的GPT-2模型進行的實驗取得了可喜的結果。但是事實上,他們沒有對該模型進行改編,也沒有對戲劇劇本進行專門訓練,這使得控制其操作和性能變得更加困難。

該專案工作團隊「我們也明確地與『人機迴圈』(Human-in-the-loop)概念合作,」羅沙說。「基本上,所有電腦生成的『藝術』都會以某種方式被人類觸碰和修飾,但這往往不是很透明。在我們的工作中,我們試圖非常明確機器做什麼,人類做什麼,讓他們的合作成為系統設計的一個組成部分,而不是一種事後的修補。」

目前,羅沙和他的同事們通過回顧以前的作品,試圖找出製作戲劇劇本最有效的方法來啟動他們的專案。雖然他們已經決定了要使用什麼方法,但他們才剛剛開始將其運用到戲劇劇本的創作中。

羅沙說:「我們的專案仍處於起步階段,但我們對採用預訓練的GPT-2模型的基本方法的效果感到驚訝。」

「我們只給它輸入劇本中的幾句台詞,它就能接收到它的體裁、結構、主題和人物名稱,利用這些訊息生成就能或多或少的生成一些合理的台詞。這是在沒有任何改編或微調的情況下實現的:我們只是使用了網路上可以下載的模型,這說明GPT-2模型確實相當強大。"AI來搶編劇飯碗了?這個AI用GPT-2寫的劇本,預計2021年1月首播

AI來搶編劇飯碗了?這個AI用GPT-2寫的劇本,預計2021年1月首播

產生的腳本樣本。前6行是來自原始的R.U.R.腳本,並作為產生器的輸入,其餘的由預先訓練的GPT-2模型生成。

目前,羅沙和他的同事們還在嘗試所謂的『平面文本產生』,即由機器學習模型為劇本單獨生成台詞,一次一行。不過,他們很快就想開始使用分層生成方法來創建劇本的簡要摘要,並將其擴展為詳細的大綱,最後將這個大綱翻譯成對話。理想情況下,他們計畫使用的模型將生成一個既連貫又有效的劇本,既遵循一條共同的線索,又能創造出背後有明確含義的文本。

「我們還需要確保產生的劇本是連貫的,不會重複或自相矛盾,不會過於頻繁地引入新的隨機角色,以及一些小而有趣的事情,比如防止角色離開現場但繼續說話的情況。」羅沙說。「我們的第一部戲應該會在2021年1月首演。我們會看看它的進展情況以及接受度如何,然後希望我們的觀察能推動我們進一步的研究和發展。」

A robot writing a script. Credit: Rosa et al

在現階段的研究中,羅沙和他的同事仍然認為,機器人參加他們的戲劇需要大量的人類監管。但在未來,他們希望製作出一個完全可以由機器人來表演的劇本,而不需要任何人類表演者或人類指導。

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則