「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

在去年的報告中,Waymo 和特斯拉的排名分別為第七位和第十二位。對Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都還要低。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

Navigant Research 最近公佈的報告再次將兩家公司推向競爭激烈的位置。一個是在排名中墊底的特斯拉,另一個則是拔得頭籌的Waymo。至於評判標準,是根據每家公司在「願景」、「商業化策略」、「合作方」、「量產計劃」、「技術」以及「產品持久力」這幾個方面的綜合表現打分排名。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

在去年的報告中,Waymo 和特斯拉的排名分別為第七位和第十二位。對Waymo 而言,去年開始的大規模商業化試運營應該是其領先的重要原因。但特斯拉墊底就有點說不過去了,排名竟然比蘋果都還要低。在一些業內人士看來,這份報告在成文的視角和方法論上略有偏差,缺失了對「政府關係」和「資料」這兩個重要標準的考量。

和政府搞好關係的重要性自不必說。一旦硬體實現商品化,軟體就成了關鍵。實際上不能說是軟體,而是「資料」。資料是驅動自動駕駛技術發展的「燃料」,或者如前英特爾首席執行長Brian Krzanich 提出的觀點,「資料是新的石油資源」。世界上最先進的人工智慧也需要資料支持——它依靠浩如煙海的資料將訊息轉化為下一步的行動。 

顯然,如果只考慮「科技」和「資料收集」這兩個維度,排在榜首的應該是Waymo 和特斯拉。至於誰最終會在這場「曠日持久戰」中勝出,我們暫且不討論。今天想和大家聊聊關於特斯拉和Waymo 在技術層面的一兩點差異性。 

「貌合」「神離」的兩套方案

二月底,Waymo 首席科學家Drago Anguelov 在MIT 首次開講,他分享的內容主題為「解決自動駕駛中的長尾問題」(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對Waymo 自動駕駛研發目前能夠了解到的最深度、最詳細的內容了。

▲Waymo 首席科學家Drago Anguelov 在MIT 開講自動駕駛課程

近些年,使用大量標註過的資料對深度學習網路進行監督訓練,使得物體感知和行為預測能力有了大幅提升,這些技術在Waymo 自動駕駛開發過程中得到了大規模應用。我們也從Drago Anguelov 口中第一次知道了Waymo 在使用「模仿學習(imitation learning)」。

模仿學習屬於機器學習的一種,它的神經網路能夠透過「觀察」人類的行為將某些特定的動作和場景進行匹配。如果使用不同類型的「人類行為」作為資料源來訓練,最終神經網路就能夠根據感知的結果輸出相對應的決策動作。例如,「如果你看到停車標誌,馬上停車」、「如果前方有輛停著的車擋路了,繞開它」等等。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

隨著商業化試運營的推進,Google能夠採集資料的場景更多了,模仿學習演算法也就有了更頻繁的用處。但Drago Anguelov 也指出,人類駕駛行為存在著很多不確定性,一些罕見的場景(所謂的「長尾」問題),Waymo 的資料集中並沒有足夠的案例來訓練演算法應對。出現這種情況就只能依靠開發人員手動編寫演算法。Drago 認為這種「折衷」的做法遲早是會被機器學習代替的。

根據Waymo 官方披露的資料,Waymo 目前已經累積了約1500 萬英里的行駛里程。按照平均每3000 萬英里才會出現一起事故的概率來計算的話,Waymo 可能到現在都沒有得到一個特定的「長尾」案例。假設行駛每100 萬英里會發生一起事故,waymo 也不過積累了15 個資料而已。按照普通機器學習神經網路需要的資料量(每個圖像分類需要至少1000 個樣本)的標準來看,Waymo 似乎還差得有些遠。

儘管Drago Anguelov 表示希望透過蒐集盡可能多的人類駕駛行為(包括「長尾」案例)來進行模仿學習,但「資料量的缺失」是個很大的問題。

而為了彌補這方面的缺陷,Waymo 已經構建出了一套擬真模型,模擬出盡可能多的場景來進行測試。因為有時會得出截然相反的結果,所以要加強系統的強健性(Robustness),做出足夠多的擬真模型,確保系統的準確性。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?不過擬真模型的建立依然需要真實世界資料的支援,解決「長尾」問題也需要對人類駕駛行為進行大量地模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級「資料」的支持。

對比之下,似乎「後段班」的特斯拉在「資料」問題上還真是不發愁。

特斯拉目前預計有超過40 萬輛搭載了Autopilot 系統的車子在道路上行駛,單日行駛里程超過了1300 萬英里。如果未來這個車隊的規模增加至超過100 萬輛,那麼每月產生的有效行駛里程將到達10 億英里的量級。對一家已經有成熟產品落地的汽車公司來說,這種真實世界產生的「資料」根本不是問題。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

至於特斯拉在自動駕駛研發上的獨特性,根據 The Information曾經透露的訊息,特斯拉同樣在利用「里程累積」上的優勢進行模仿學習。原文(https://0x9.me/yRgBO)是這麼說的:

據熟悉特斯拉這套系統的人爆料稱,特斯拉的車子在行駛過程中會將攝影鏡頭及其他感應器的資料搜集起來,Autopilot 是否運行並沒有關係。之後工程師可以將這些資料中人類的駕駛行為與不同的場景進行匹配,之後遇到類似的場景機器就可以模仿人類去執行。比如怎樣轉彎或躲避障礙物。當然這種被叫做「行為複製」的方法也有侷限性,但特斯拉的工程師認為只要有足夠的資料支撐,神經網路就能夠給出正確的決策結果,例如在絕大多數場景中如何轉向、煞車以及加速。在特斯拉看來,未來不再需要人類手動編寫程式來控制無人車應對特定場景。

不過按照個人的理解,特斯拉軟體工程師提到的「行為複製」和Waymo 的「模仿學習」是同樣的意思,等同於大家都在講的「端到端學習」的方案,即使用一個巨大的神經網路,輸入感應器資料後得到關於轉向、加速和煞車的整體執行策略。

假設特斯拉採用的是端到端學習方案,那它肯定是不需要對圖像進行標記的。唯一需要「標記」的是人類駕駛的行為,比如轉向角是多少、加減速的力度等。將整個感應器資料輸入到一個巨大的神經網路後,系統會學習如何將感應器資料與人類駕駛員的行為進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發考慮,它採用的就不大可能是和Waymo 一樣的「端到端學習」的策略。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?針對自動駕駛感知的演算法差異,Mobileye 創始人Amnon Shashua 曾經對「端到端學習(End-to-End Learning)」和「語義抽象(Semantic Abstraction)」這兩個概念做過詳細的講解。

▲Mobileye 創始人Amnon Shashua 對自動駕駛感知的內容進行了講解

而根據 The Information 報導的內容來推斷,特斯拉可能是在開發一套用於路徑規劃或執行控制的神經網路。而用來訓練這套神經網路的資料並非來自感應器,而是由感知神經網路輸出的metadata。這樣人類駕駛的直接行為—轉向、加速和煞車可以對metadata進行「標記」,類似端到端學習中,駕駛行為與感應器資料的匹配。

這種將感知層和執行層神經網路分開的做法能夠規避Shashua 教授上面提到的端到端學習可能產生的一系列問題:如「不常見場景」出現的機率會大幅下降;對先前知識( Prior Knowledge)的要求提高,深度神經網路在解決一些簡單問題上可能會「慘敗」。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

假設特斯拉用於訓練的資料來自特斯拉車主,透過人工的方式將一些「壞的」行為去掉,這樣可以避開人工編碼演算法的局限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監督學習來進一步最佳化。可以把路徑規劃或執行控制的神經網路放在運行Autopilot 或其他駕駛輔助功能的車子上,一旦出現系統脫離、失效、碰撞等情況,工程師就可以透過bug 報告來定位原因。這些「錯誤」之後還可以用來訓練新的神經網路。

如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規劃和執行控制方面的問題。考慮到目前搭載硬體2.0 版本的特斯拉車型每個月可以獲得近10 億英里的行駛里程,獲得的資料量之大是Waymo 無法企及的。之後硬體3.0 版本上線後,搭載了AI 晶片的這套系統會更有利於特斯拉演算法的迭代。 

一場馬拉松式的長跑

儘管Waymo深受「資料」的困擾,但光憑對這個維度的考量自然是沒辦法斷言什麼的。只不過Waymo要解決自動駕駛中的「長尾」問題,自然需要更多的資料支持。Waymo近日宣布將在亞利桑那州的梅薩市開設新的技術服務中心,進一步擴大無人車出行服務的規模。顯然Waymo是奔著蒐集更多「資料」的目的來的。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

也有人認為,Waymo可以效仿特斯拉開發一套類似Autopilot的駕駛輔助系統,僅使用成本低廉可量產的感應器。一旦在市場鋪開後,蒐集真實場景的駕駛資料也就不是什麼難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領域的合作夥伴。

上周有消息稱,「Waymo正在尋求外部投資人」。意料之中的計劃。如果有汽車公司成為Waymo的股東,要獲得巨的駕駛資料自然容易得多。而且Waymo作為自動駕駛解決方案的供應商,始終只有借助OEM的平台才能最終獲得商業化成功。不管是手中的全能自動駕駛技術亦或是正在進行的移動出行業務,Waymo對很多汽車公司而言,都是有十足吸引力的合作夥伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。

對特斯拉而言,之前因為Model 3陷入「量產地獄」,Autopilot的研發進程似乎出現了停滯,硬體3.0也遲遲沒有發布。儘管在「資料」容量上有先天優勢,但率先量產以及頻發的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。

「後段班」的特斯拉和「優等生」的Waymo 在自動駕駛有什麼不同?

不過我個人倒是蠻欣賞之前馬斯克說過的一段話。

他說,「我不認為哪家企業能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何汽車公司都不是我們的競爭對手」。

希望這種「目中無人」的狂妄自大,可以給特斯拉帶來點好運氣。

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則