川普演講逼瘋AI？從頭學習了1100萬字後，AI能讀懂「川言川語」嗎

川普並不是AI學習的第一位美國總統，此前就有不少學者利用AI從各個角度分析了林肯的《蓋茲堡演說》。面對「正統」的歷任美國總統們，AI還能算是遊刃有餘，但川普是普通人嗎？因此要學習「川言川語」，難度可不是一般的大。

最近，美國前國家安全顧問約翰‧博爾頓出版了他的新書「事發之室：白宮回憶錄」（The Room Where It Happened），在書中，博爾頓寫道，川普很容易受威權式領導人影響，經常被他自己的顧問鄙視。

面對這項「指責」，川普坐不住了，在接受《華爾街日報》採訪時，川普直接說，「博爾頓是個騙子」，「白宮每個人都討厭他」。

川普的這一說法尚為得到博爾頓發言人的回應。

川普這類迷惑言論對全世界民眾來說也是見怪不怪了，不過，不知道你有沒有想過，如果用AI辨識這些川普的「川言川語」，會是什麼情形？

別急，我們先回到三年前，當時川普正在針對第二次世界大戰發表演講，那時川普式英語才面世不久，及其狂野的遣詞造句、隨意切換的時態和主語、扭曲的語法、前後衝突的連詞、滿天飛的介詞，從句套從句、括號套括號，還多少讓人有些不適應。

可能美國觀眾聽了也暈了一片。

不過也正是在那個時候，Bill Frischling就開始讓他的AI機器人「Margaret」去轉錄川普講話中一段127字的內容，當川普第四次提到「獲勝」時，Margaret崩潰了。Frischling回憶說：「它仍然試圖像處理普通英語那樣為這段話添加標點符號，而不是處理『川普式英語』。」

科羅拉多大學人工智慧與機器人技術實驗室的負責人Frischling是一個自學成才的程式設計師，疫情期間他在維吉尼亞州的家中工作。

鑑於此，Margaret不得不重新設定川普模式，從頭開始學習「川言川語」，於是Frischling聘請了一位有自動標點博士學位的電腦專家來教Margaret「忘記」正常語法，轉而學習分析川普的講話。

川普生氣了嗎？

首先需要糾正一個說法，川普並不是AI學習的第一位美國總統，此前就有不少學者利用AI從各個角度分析了林肯的《蓋茲堡演說》，雖然整個演說只有272個單詞，但相關研究書籍可以說能塞滿整個圖書館。

面對「正統」的歷任美國總統們，AI還能算是遊刃有餘，但是川普是普通人嗎？因此要學習「川言川語」，難度可不是一般的大。

例如，在4月23日，川普在白宮舉行了新冠病毒的簡報會，那天川普建議醫生應考慮向患者注射家用消毒劑以殺死病毒。會議開始後第52分鐘，《華盛頓郵報》記者Philip Rucker正在質問川普，他是否承認曾不負責任地大肆宣傳未經證實的關於熱和陽光可以治癒冠狀病毒的消息。

川普回擊道：「我是總統，而你才是在製造假新聞！」

讓我們再往前看看，2018年中期選舉後的一場新聞發佈會上，川普與CNN記者Jim Acosta發生了一場令人難忘的對峙，當天共和黨損失慘重。

對話初期，川普針對Acosta就移民問題向他施壓時怒吼道，「夠了」！隨後他下台。

這兩場發佈會上，川普都真的生氣了嗎？

AI「Margret」的答案是，在新冠簡報會上，川普真的生氣了，在2018年的新聞發佈會上，川普也真的生氣了，但是當他下台後，他的情緒發生了「明顯的變化」，他在享受這場衝突。

要學習「川言川語」，到底難在哪？

某種程度上，在Margaret眼中，川普是完全可以預測的。

幾乎所有情況下，川普在脫稿時說話更快，大約每分鐘220字，作為對比美國人均速度為每分鐘110-150字；同時，大多數人在要說假話時語速會放慢，吞吞吐吐或者感覺很不自在，但是川普相反，他會開始加快語速，而且會用一些「虛詞」過渡，比如「首先」，「人們在說」等，然後逐步放緩到正常語速。

Frischling把這種速度變化稱為川普的「推銷員模式」。

當對著提詞器讀稿時，川普的語速會減慢到每分鐘111字，對於這類準備好的演講，川普說話聽起來很單調麻木，在重點處隨意發揮，好像是第一次見到稿子一樣。川普之前說過，對於競選總統的人來說，讀稿是非法的。

Frischling總結道：「你可以把這個過程想像成是開車，一般人是正常行駛，川普則是超速行駛。」不過，他認為，這個結果並不能說明川普話語中的真假成分，在這方面，他會單獨請人在查核事實後，再對數據進行交叉檢查。

除了語言上的不同，肢體上呢？在這我們就可以解答一下上面的答案了。

川普真正生氣時，他的話也會隨之變得簡潔，揮舞著的手臂也會靜止下來，「當他停止做手勢時，那就意味著該小心了。無論要發生什麼事，請保持警惕。」

根據Margret用曲線描繪的川普壓力水準變化情況，在新冠簡報會上，他和《華盛頓郵報》記者對峙時，曲線突然飆升。不過根據以往的經驗，川普在面對「假新聞」這類攻擊時，他的內心其實是毫無波動的，「聲音、語速、說話方式…..一切都和說『天氣怎麼樣』時一樣」，Frischling說。

而在選舉後的新聞發佈會上，當川普在台上的時候，曲線也處於十分高的水準，但當他戲劇性地走下講台並交叉雙臂時，壓力曲線下降到了平均值，這正是他在享受這場衝突的象徵。

學習了1100萬字的內容後，Margret比川普還瞭解自己

迄今為止，Margaret已經學習了超過1100萬字的川普講話、推文、書籍、集會、影片、廣播和電視剪輯，這些資料可以追溯到1976年，川普第一次在紐約時報發表公開信的時候。

如今Margaret比許多美國人更能理解川普的講話模式，甚至更理解川普，他的用詞，他的下意識的表達，他的傾向和習慣。說Margret是這個世界上最瞭解川普的人也不為過。

而且她還有著極強的耐心和學習能力，她不會因為川普的演講而歡呼、嘲諷或轉台，她只是在那裡靜靜地分析川普的每一句話和他說話的方式，再用演算法從一個存有四十多年語言資料的資料庫中收集訊息，試圖解讀他「不穩定的內心」。

Margaret的一項重要發現就是，川普之所以可以快速地說出一些明顯很荒謬的假話，是因為他根本不在乎。

Frischling解釋道：「大多數人在不說實話時，不會感覺更自在，反而會感覺不太舒服。但川普正相反。」Margaret可以評估出川普的壓力水準，他是否冷靜，是真的生氣，還是只是在表演，甚至還可以模擬川普的公開講話。

為了得出這些結論，Margret會追蹤川普說話的停頓、手勢、語速，他使用的形容詞類型，他是否在使用他的常用詞彙，以及他的語氣等等。

「他說的每個字都使Margaret變得更聰明，並讓她能夠聽出更微妙的區別。」Frischling說。

MIT學生：建立川普模型？太簡單！

川普被分析也不是最近才出來的。

早在2016年，一位麻省理工學院的研究生Bradley Hayes就創造了一個發推特的機器人@DeepDrumpf，這個機器人能用混亂的語言來模仿川普在社群媒體中的發言，比如「我們必須製造美國。他們做不到。因為我要為這個國家付出代價」。

由於在一條推文中，該帳號提到將釋放暴力恐怖分子來威脅前總統歐巴馬，Hayes不得不屏蔽一條推文。不過他表示，如果有更多的時間、更好的數據，這個機器人將會變得更強大。

Hayes在接受採訪時坦言道，川普的語言比其他人更簡單，因此在建立模型上，川普的模型是最容易建立起來的。如果能與某一天之內所有人與川普談話過的人進行交流，那麼你很有可能會建立一個更加準確的模型，更好地預測他將要談論的內容和他的立場。

Hayes表示，他們只讓AI學習了幾個小時的川普演講內容，然後隨機選擇字母作為句子的開頭，逐個字母進行構建。比如，如果AI首先選擇了字母「M」，它可能會在其後馬上跟上字母「A」，然後「K」，直到整個單詞和句子能夠闡明川普最喜歡的口號，「再次使美國變得偉大」（Make America Great Again）。