特斯拉在自動駕駛技術上堅決押注「純視覺」路線，一旦成功則天下無敵

8 月 20 日上午，特斯拉 AI 日如期召開，正如其名字預示的那樣，活動圍繞著 AI 人工智慧展開。與以往不同的是，這次活動特斯拉沒有邀請媒體，也沒有邀請投資人，只邀請了相關領域的工程師們，因此拋開商業化的問題之後，這次活動更像是一場針對技術方面的前瞻性彙報與演示。

AI 日上，特斯拉人工智慧和自動駕駛視覺總監 Andrej Karpathy 詳細介紹了特斯拉的「神經網路」，特斯拉眾位高級主管也著重闡述了特斯拉在自動標記等技術上的進展，之前就備受關注的超級電腦 Dojo 也正式亮相了。

仔細觀察不難發現，特斯拉 AI 日上介紹的所有技術似乎都隱隱傳達著一個訊號：即便越來越多的車廠採用光學雷達技術實現自動駕駛，馬斯克依舊要特立獨行，勢將「純視覺路線」進行到底。

擁有超強算力的「道場」Dojo

五天前，特斯拉官方曾發布一張海報預熱 AI 日活動。

海報上展示了一個大規模晶片模組的結構，包括晶片核心、銅板、散熱器、金屬外殼等組成元素，人們紛紛猜測這是否與特斯拉 AI 日上將公布的新產品有關。事實證明確實如此。

▲ 特斯拉AI日宣傳海報

這其實是一個集合了 25 塊 D1 晶片的訓練模組，而自研 AI 訓練晶片 D1 可以說是 AI 日上最重要的技術突破之一。

D1 晶片由特斯拉自主研發，7 奈米製造工藝，單片 FP32 達到算力 22.6TOPs，BF16 算力 362TOPs，這幾乎是目前市面上最強的晶片。

而且 D1 晶片可以進行無縫融合，25 個 D1 晶片構成一個訓練模組，更多的訓練模組相互組合則構成了擁有更強大算力的超級電腦 Dojo。

Dojo 的名字不是第一次出現了，早在今年 6 月的 CVPR 2021 工坊活動上，Andrej Karpathy 就介紹過這台超級電腦，當時的 Dojo 搭載的還是NVIDIA的晶片，總算力為 1.8 EFLOPS，被認為可以躋身全球第五強超級電腦。

這次搭載了 D1 的 Dojo 亮相後，電腦博弈專家、晶片專家稱讚這是「很精彩的設計」，甚至表示「如果 Elon 原意，或許這是 nVidia 最大的競爭者，實際上晶片巨頭們的坐次可能需要重新排位。」

馬斯克一直認為「解決自動駕駛的唯一方法是解決現實世界中的 AI 問題，無論是硬體還是軟體，除非一家公司具有很強的 AI 能力以及超強算力，否則很難解決自動駕駛難題。」

因此特斯拉這次推出擁有強大算力的超級電腦 Dojo，其實也是出於解決自動駕駛問題的考量。與其他超級電腦不同的是，這個被命名為「道場」的超級電腦，其所有力量只用來做一件事兒：訓練 Autopilot 在內的整個自動駕駛系統。

純視覺路線

「道場」已經建好，受訓的特斯拉 AI 神經網路更是關鍵。

特斯拉的神經網路主要用來處理物體辨識和道路規劃等功能所需的資料，這些是支援特斯拉 Autopilot/FSD 得到基礎。

AI 日上，特斯拉 Autopilot 工程主管 Milan Kovac 向觀眾展示了特斯拉的 AI 神經網路究竟是怎樣應用的。

▲ 特斯拉汽車的視覺元件

在特斯拉的汽車中，每輛車裝有 8 個攝影鏡頭，每個攝影鏡頭獲取原始輸入後能創建不同的解析度，用於不同的功能和目的，最終這些資訊會被輸入到複雜的神經網路中，產生對自動駕駛有用的附加資訊。

然而問題在於，即便擁有 8 個攝影鏡頭，其背後神經網路的向量空間依舊不夠。於是，特斯拉研發了自動標注技術，即便行駛過程中視野被遮擋，根據資料的標注，車輛也能更安全、準確的導航。

Andrej Karpathy 還稱，現在特斯拉的自動駕駛場景類比系統可以在行駛過程中即時繪製路況，結合多個車輛經過同一地點的繪製，得到一個完整的地圖。

而這恰恰是特斯拉和 Waymo 等競爭對手最大的不同：基於類似人腦的視覺感知系統、自動化標注能力，以及模擬等功能，特斯拉在 Autopilot/FSD 上試圖擺脫光學雷達，試圖將「純視覺」路線走得更加徹底。

這確實是馬斯克一貫的堅持。

2019 年，馬斯克一句「把光學雷達裝在車上真的很蠢」，直接將自動駕駛技術路線一分為二，激起千層浪。

以特斯拉為代表的僅以鏡頭與各種感測器作為硬體，背後重演算法的路線，與 Waymo 為代表的注重光學雷達的技術路線，站在了對立面。

關於二者誰能走到最後，到今天也沒有出現一個決定性的結論。

光學雷達，顧名思義是以雷射作為訊號源，由雷射器發射出的脈衝雷射打到周圍物體上引起散射，一部分光波會反射到光學雷達的接收器上，根據雷射測距原理計算，就得到從光學雷達到目標點的距離。雷射不斷掃描目標物，就可以得到全部資料，成像處理後，可得到精確的3D立體圖像。

而在馬斯克看來，「純視覺感知才是通往真實世界 AI 的道路」，既然人類是透過視覺收集資訊輔以大腦處理資訊的方式進行駕駛，那自動駕駛也應當能透過視覺感知輔以演算法處理的方式實現安全駕駛。

當外部環境越來越複雜，自動汽車上安裝的感測器也越來越多，如果雷達與攝影鏡頭傳來的資訊互相矛盾，自動駕駛系統反而會更加難以抉擇。

馬斯克拒絕「拉扯」，他選擇直接將攝影鏡頭的作用發揮到極致。

將「第一原理」貫徹到底？

熟悉馬斯克的人都知道他一直奉行「第一原理」，即回歸事物最基本的條件，將其拆分成各要素進行結構分析，從而找到實現目標的最佳路徑的方法。

目前「感知、判斷駕駛環境」無疑是自動駕駛領域的核心困難，馬斯克依舊回歸到「感知」的基礎，不遺餘力地將 AI 進化到能與人類視覺感知媲美的地步。

馬斯克認為，毫米波雷達不擅長描述物體的缺陷是幾乎不可能彌補的，而攝影鏡頭不擅長探測距離的缺陷卻是可以彌補的。為了「一步到位」，馬斯克絲毫不考慮將光學雷達安裝在特斯拉上。

事實上，特斯拉的「純視覺路線」，需要更加深度地學習巨量的資料，深度訓練神經網路，這一點對於其他的自動汽車公司而言，絕不是敢輕易嘗試的。馬斯克能堅持下去，和其起步早、能積攢的資料多不無關係。

據高盛估計，目前特斯拉車隊的數量在全球超過 150 萬輛，這為特斯拉提供了大量、多樣化和真實世界的資料庫。這意味著，即便資料獲取效率相同，跑在路上的特斯拉數量是對手的數十倍，資料量也就是競爭對手的數十倍。

再加上今年特斯拉一季度銷量在全球範圍內飆升到了 18 萬輛以上，有著超過 200% 的漲幅，整體而言特斯拉的盈利處於上升狀態，研發資金方面也無需憂愁。充足的資金，讓特斯拉敢於為純視覺自動駕駛路線「砸錢開路」。

特斯拉想在技術路線上保持自己的獨特優勢是可以理解的，據相關人士分析，如果特斯拉能在「純視覺」上開闢出一條道路來，形成獨特的自動駕駛技術閉環，無疑會讓特斯拉距離「電動車界的蘋果」更近一步。

當然，這個決策背後的商業風險也是不容忽視的。

因為另一邊，隨著隨著技術發展，光學雷達不斷完善優化，價格也在逐漸下降。

光學雷達領導公司 Velodyne 本周宣佈，其最受歡迎的光學雷達系統 VLP-16 的價格相比 2016 年降低了一半。光學雷達價格下降受惠於產能、研發成本平攤；輔助自動駕駛推廣等因素。

▲ 越來越多車廠選擇光學雷達

如今，已經有越來越多的車廠選擇了光學雷達，這意味著未來「光學雷達」的技術路線或許將比「純視覺」路線擁有更多的規模效應以及成本優勢。

而如果未來視覺+光學雷達一派，在自動駕駛能力上做到和特斯拉相差不多，則意味作為「破風者」的特斯拉，為純視覺路線自動駕駛探索砸下的成本會和收益不成正比。這對於需要長期投入的特斯拉來說，將是不小的壓力。

但對於馬斯克而言，他不在乎。他似乎就是要在第一原理的的思想下，以愚公移山的勁頭，在自動駕駛領域跟「純視覺路線」一路硬幹到底。