川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

川普並不是AI學習的第一位美國總統,此前就有不少學者利用AI從各個角度分析了林肯的《蓋茲堡演說》。面對「正統」的歷任美國總統們,AI還能算是遊刃有餘,但川普是普通人嗎?因此要學習「川言川語」,難度可不是一般的大。

最近,美國前國家安全顧問約翰‧博爾頓出版了他的新書「事發之室:白宮回憶錄」(The Room Where It Happened),在書中,博爾頓寫道,川普很容易受威權式領導人影響,經常被他自己的顧問鄙視。

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

面對這項「指責」,川普坐不住了,在接受《華爾街日報》採訪時,川普直接說,「博爾頓是個騙子」,「白宮每個人都討厭他」。

川普的這一說法尚為得到博爾頓發言人的回應。

川普這類迷惑言論對全世界民眾來說也是見怪不怪了,不過,不知道你有沒有想過,如果用AI辨識這些川普的「川言川語」,會是什麼情形?

別急,我們先回到三年前,當時川普正在針對第二次世界大戰發表演講,那時川普式英語才面世不久,及其狂野的遣詞造句、隨意切換的時態和主語、扭曲的語法、前後衝突的連詞、滿天飛的介詞,從句套從句、括號套括號,還多少讓人有些不適應。

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

可能美國觀眾聽了也暈了一片。

不過也正是在那個時候,Bill Frischling就開始讓他的AI機器人「Margaret」去轉錄川普講話中一段127字的內容,當川普第四次提到「獲勝」時,Margaret崩潰了。Frischling回憶說:「它仍然試圖像處理普通英語那樣為這段話添加標點符號,而不是處理『川普式英語』。」

科羅拉多大學人工智慧與機器人技術實驗室的負責人Frischling是一個自學成才的程式設計師,疫情期間他在維吉尼亞州的家中工作。

鑑於此,Margaret不得不重新設定川普模式,從頭開始學習「川言川語」,於是Frischling聘請了一位有自動標點博士學位的電腦專家來教Margaret「忘記」正常語法,轉而學習分析川普的講話。

川普生氣了嗎?

首先需要糾正一個說法,川普並不是AI學習的第一位美國總統,此前就有不少學者利用AI從各個角度分析了林肯的《蓋茲堡演說》,雖然整個演說只有272個單詞,但相關研究書籍可以說能塞滿整個圖書館。

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

面對「正統」的歷任美國總統們,AI還能算是遊刃有餘,但是川普是普通人嗎?因此要學習「川言川語」,難度可不是一般的大。

例如,在4月23日,川普在白宮舉行了新冠病毒的簡報會,那天川普建議醫生應考慮向患者注射家用消毒劑以殺死病毒。會議開始後第52分鐘,《華盛頓郵報》記者Philip Rucker正在質問川普,他是否承認曾不負責任地大肆宣傳未經證實的關於熱和陽光可以治癒冠狀病毒的消息。

川普回擊道:「我是總統,而你才是在製造假新聞!」

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

讓我們再往前看看,2018年中期選舉後的一場新聞發佈會上,川普與CNN記者Jim Acosta發生了一場令人難忘的對峙,當天共和黨損失慘重。

對話初期,川普針對Acosta就移民問題向他施壓時怒吼道,「夠了」!隨後他下台。

這兩場發佈會上,川普都真的生氣了嗎?

AI「Margret」的答案是,在新冠簡報會上,川普真的生氣了,在2018年的新聞發佈會上,川普也真的生氣了,但是當他下台後,他的情緒發生了「明顯的變化」,他在享受這場衝突。

要學習「川言川語」,到底難在哪?

某種程度上,在Margaret眼中,川普是完全可以預測的。

幾乎所有情況下,川普在脫稿時說話更快,大約每分鐘220字,作為對比美國人均速度為每分鐘110-150字;同時,大多數人在要說假話時語速會放慢,吞吞吐吐或者感覺很不自在,但是川普相反,他會開始加快語速,而且會用一些「虛詞」過渡,比如「首先」,「人們在說」等,然後逐步放緩到正常語速。

Frischling把這種速度變化稱為川普的「推銷員模式」。

當對著提詞器讀稿時,川普的語速會減慢到每分鐘111字,對於這類準備好的演講,川普說話聽起來很單調麻木,在重點處隨意發揮,好像是第一次見到稿子一樣。川普之前說過,對於競選總統的人來說,讀稿是非法的。

Frischling總結道:「你可以把這個過程想像成是開車,一般人是正常行駛,川普則是超速行駛。」不過,他認為,這個結果並不能說明川普話語中的真假成分,在這方面,他會單獨請人在查核事實後,再對數據進行交叉檢查。

除了語言上的不同,肢體上呢?在這我們就可以解答一下上面的答案了。

川普真正生氣時,他的話也會隨之變得簡潔,揮舞著的手臂也會靜止下來,「當他停止做手勢時,那就意味著該小心了。無論要發生什麼事,請保持警惕。」

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

根據Margret用曲線描繪的川普壓力水準變化情況,在新冠簡報會上,他和《華盛頓郵報》記者對峙時,曲線突然飆升。不過根據以往的經驗,川普在面對「假新聞」這類攻擊時,他的內心其實是毫無波動的,「聲音、語速、說話方式…..一切都和說『天氣怎麼樣』時一樣」,Frischling說。

而在選舉後的新聞發佈會上,當川普在台上的時候,曲線也處於十分高的水準,但當他戲劇性地走下講台並交叉雙臂時,壓力曲線下降到了平均值,這正是他在享受這場衝突的象徵。

學習了1100萬字的內容後,Margret比川普還瞭解自己

迄今為止,Margaret已經學習了超過1100萬字的川普講話、推文、書籍、集會、影片、廣播和電視剪輯,這些資料可以追溯到1976年,川普第一次在紐約時報發表公開信的時候。

如今Margaret比許多美國人更能理解川普的講話模式,甚至更理解川普,他的用詞,他的下意識的表達,他的傾向和習慣。說Margret是這個世界上最瞭解川普的人也不為過。

而且她還有著極強的耐心和學習能力,她不會因為川普的演講而歡呼、嘲諷或轉台,她只是在那裡靜靜地分析川普的每一句話和他說話的方式,再用演算法從一個存有四十多年語言資料的資料庫中收集訊息,試圖解讀他「不穩定的內心」。

Margaret的一項重要發現就是,川普之所以可以快速地說出一些明顯很荒謬的假話,是因為他根本不在乎。

Frischling解釋道:「大多數人在不說實話時,不會感覺更自在,反而會感覺不太舒服。但川普正相反。」Margaret可以評估出川普的壓力水準,他是否冷靜,是真的生氣,還是只是在表演,甚至還可以模擬川普的公開講話。

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

為了得出這些結論,Margret會追蹤川普說話的停頓、手勢、語速,他使用的形容詞類型,他是否在使用他的常用詞彙,以及他的語氣等等。

「他說的每個字都使Margaret變得更聰明,並讓她能夠聽出更微妙的區別。」Frischling說。

MIT學生:建立川普模型?太簡單!

川普被分析也不是最近才出來的。

早在2016年,一位麻省理工學院的研究生Bradley Hayes就創造了一個發推特的機器人@DeepDrumpf,這個機器人能用混亂的語言來模仿川普在社群媒體中的發言,比如「我們必須製造美國。他們做不到。因為我要為這個國家付出代價」。

川普演講逼瘋AI?從頭學習了1100萬字後,AI能讀懂「川言川語」嗎

由於在一條推文中,該帳號提到將釋放暴力恐怖分子來威脅前總統歐巴馬,Hayes不得不屏蔽一條推文。不過他表示,如果有更多的時間、更好的數據,這個機器人將會變得更強大。

Hayes在接受採訪時坦言道,川普的語言比其他人更簡單,因此在建立模型上,川普的模型是最容易建立起來的。如果能與某一天之內所有人與川普談話過的人進行交流,那麼你很有可能會建立一個更加準確的模型,更好地預測他將要談論的內容和他的立場。

Hayes表示,他們只讓AI學習了幾個小時的川普演講內容,然後隨機選擇字母作為句子的開頭,逐個字母進行構建。比如,如果AI首先選擇了字母「M」,它可能會在其後馬上跟上字母「A」,然後「K」,直到整個單詞和句子能夠闡明川普最喜歡的口號,「再次使美國變得偉大」(Make America Great Again)。

一個川普,竟然要AI與其他多領域專家共同聯手

AI技術顯然提升了研究的手段和標準。

Margret是新聞工作者、學者和政治家的首選資源,亞馬遜的數百萬個語音啟動的Alexa設備,也會利用Margaret獲取川普的日程安排和最新推文。在新冠病毒危機中,為期數週的每晚簡報為分析提供了最典型的素材,他肆無忌憚地宣稱自己取得了成功,並完全無視對政府錯誤應對的質疑。

至此,為了研究川普非正統的講話風格,AI與語言學家、認知專家、理論心理學家和政治學家建立了合作關係。

電腦科學家認為,人工智慧可以檢測對人類大腦而言過於複雜的大量數據,從中發現模式。情報專家懷疑,外國間諜服務正在將AI分析與人格特徵和傳統的基於個人的研究方法相結合,以分析川普和其他世界領導人。

「一開始,川普把所有人都搞暈了」,前中央情報局幹員John Sipher說道,他幾十年來一直被部署在俄羅斯和其他國家,「現在大家才開始理解他在想什麼」。

麻省理工學院可部署機器學習中心的教授Aleksander Madry警告說,這項技術並非萬無一失,而且透過機器學習發現的模式「通常不是我們想像的那樣。」

一些程式設計師曾使用機器人偽造川普演講,而這些「假貨」擁有可能攪亂美國政治的能力。這種應用是一個危險的訊號。

Bradley Hayes表示,幾乎每個擁有大型數據集的人都可以使用AI機器人得出有意義的結論——或者歪曲這些結論。

如果說川普的語言通常可以預測,那麼他的決定有時似乎完全是隨機的。

Frischling為他的私人客戶研究過一些國會議員,他認為他們在決定轉變政策之前會有一些預兆,比如會就某些話題發表更多的公開評論,或者改變說話方式。但這些關係在川普身上幾乎沒有看到。

Frischling表示,「對於一項政策提議,他可以先是說『我認為這太糟糕了』,然後又在10小時之內簽署一條行政命令批准這項政策。」Margaret仍在努力理解這一點。

或許可以說,川普的種種迷惑行為也正「歪打正著」地保護著美國。

資料來源:

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則