作為馬斯克口中的「傻子王」,Waymo終于發(fā)話了。
在馬斯克大肆抨擊激光雷達十多天后,Waymo高管在Google I\/O 開發(fā)者大會上對其進行了公開駁斥。
「你可以想象只用攝像頭進行自動駕駛,但你需要最好的攝像系統(tǒng)才能真正做到這一點?!筗aymo首席科學家Drago Anguelov表示:「因此,這是一個非常大的賭注,你有可能實現(xiàn)它。但這非常非常冒險,而且沒有必要?!?/span>
1
「傻子論」:不用激光雷達的理由
半個月前,馬斯克在特斯拉舉辦的「Autonomy Day」上,對激光雷達傳感器大肆抨擊:「傻子才用激光雷達,任何依賴激光雷達的人注定要完蛋。注定是這樣?。す饫走_)是昂貴的、不必要的傳感器。這就像有一大堆昂貴的附屬品。比如,一個闌尾是壞的,但現(xiàn)在你有了一大堆闌尾,你會發(fā)現(xiàn)這太荒謬了。」
如果你對激光雷達不太了解,我們先來對它做個介紹。
激光雷達是一種會發(fā)射激光的雷達,它把不可見的光脈沖發(fā)送到世界上,并計算出它們返回的時間。這使得它在低分辨率下呈現(xiàn)出黑色和紅色的圖像,但與每個像素間的距離精確。一些激光雷達還能告訴你目標彈開的速度有多快。這樣,它就有了超人的視覺,盡管分辨率低,目前的高成本和更有限的范圍意味著它不是在每個方面都優(yōu)秀。
激光雷達將3D成像技術(shù)引入自動駕駛汽車計算機,是目前大多數(shù)其他自動駕駛系統(tǒng)的關(guān)鍵元件。目前,Waymo、Uber、福特、通用Cruise等公司將激光雷達與攝像頭結(jié)合使用,讓自動駕駛汽車了解道路和道路上的情況。
價格昂貴是馬斯克抨擊激光雷達的一個主要原因。
但目前,每個主要的機器人車開發(fā)商和大多數(shù)創(chuàng)業(yè)公司都使用激光雷達與攝像頭和雷達相結(jié)合的解決方案。他們傾向于增加更多的雷達和一個或多個激光雷達,有些還添加了不同類型的激光雷達,甚至夜視攝像頭。
之所以這么做,是因為在他們看來,現(xiàn)在并不是降低成本的時候。現(xiàn)在是最大限度保證安全的時候,并且要盡快實現(xiàn)它,以及首先進入市場??煽啃允顷P(guān)鍵。
從技術(shù)上看,在激光雷達+攝像頭或者攝像頭的選擇上,前者是更快、更安全的路徑。更多的信息,特別是更可靠的信息是更好的選擇。
如果想僅僅使用攝像頭,則必須在一定程度上理解一幅圖像,接近人類用眼睛和大腦所做的事情。
沒有激光雷達超人的測距能力,人類通過智能計算出與遙遠物體的距離。我們知道人和車有多大,所以一輛車或一個人如果看起來越小,我們就知道它離我們越遠。當我們移動時,我們通過這個物體相對于另一個物體移動的方式來推測距離。
當物體離我們很近時,我們也能從兩只「立體」眼睛和通過眼睛聚焦光線的方式得知距離。這些都是有用的,但事實證明,人們只用一只能看到遠處的眼睛就可以很好地駕駛——真正的關(guān)鍵在于正確理解場景。
激光雷達無需任何理解就能知道萬物之間的固有距離。它在這方面近乎完美。對很多事情來說,「賭上你的生命」是可靠的——而且必須如此。人們可以也確實將「理解」添加到激光雷達的方案中,但這并不總是必要的,因此,你可以更寬容地理解錯誤。
激光雷達可以在白天或晚上工作,而攝像頭必須處理不斷變化的外部光線。
Waymo(激光雷達傳感器的先驅(qū))首席技術(shù)官Dmitri Dolgov承認早期版本的激光雷達「非常昂貴」。但他同時認為,這種高成本與大多數(shù)新技術(shù)首次開發(fā)時沒有什么不同。
「從根本上來說,激光雷達并不昂貴?!笵olgov說,「我們已經(jīng)大幅降低了從第一代到現(xiàn)在的激光雷達產(chǎn)品的價格??梢韵胂螅S著規(guī)模的擴大,我們將節(jié)省多少成本?!?/span>
今年3月,Waymo宣布,將開始向不與該公司自動拼車服務(wù)競爭的客戶銷售激光雷達,包括機器人、農(nóng)業(yè)、安全等行業(yè)的公司。這個額外的渠道可能會幫助Waymo通過擴大生產(chǎn)來提高規(guī)模經(jīng)濟,最終進一步降低其為自己的汽車生產(chǎn)零部件的價格。
2
純視覺真的什么都能扛?
特斯拉在眾多主流汽車制造商中獨樹一幟,只使用了攝像頭+雷達的解決方案。馬斯克表示,特斯拉的自動駕駛技術(shù)將完全依賴內(nèi)置攝像頭。
特斯拉選擇攝像頭方案的原因很簡單,目前根本沒有量產(chǎn)并能真正商業(yè)化推開的激光雷達。
特斯拉現(xiàn)在在銷售汽車,即使他們想裝激光雷達,也裝不上。但是,他們未來的計劃也是無激光雷達的。
特斯拉決定只用8個攝像頭(前面3個、每側(cè)2個、后面1個)加上前面一個雷達和一些用于近距離工作的超聲波傳感器來解決駕駛問題。
但現(xiàn)在,計算機視覺還不是那么好。
在過去幾年里,計算機視覺技術(shù)取得了一系列驚人的突破,每個人都在使用它們。但是,這項技術(shù)并沒有可靠到能「堵上你的性命」的地步,至少現(xiàn)在還不可靠。問題是,這種情況是否會發(fā)生,以及何時會發(fā)生。
大多數(shù)人說「什么時候」而不是「如果」,特斯拉和其他人說,既然人類只用眼睛就能開車,那么,顯然這是可以做到的。但我們旅行時只用腿,這并不是說汽車應(yīng)該用腿而不是輪子。鳥兒扇動翅膀,但這并不能證明飛機也應(yīng)該這樣做。有時,機器的方法是贏家。我們還不知道答案。
早期的激光雷達非常非常昂貴,但正如很容易預測的那樣,任何電子技術(shù)都不會永遠昂貴下去。數(shù)十家公司正在建造新的激光雷達,其成本不會對出租車的成本造成任何負擔,也不會對私家車的成本帶來太大影響。
如果成本不是問題所在(特別是因為現(xiàn)在還不是廉價的時候),那么大多數(shù)開發(fā)人員都已經(jīng)表明,更可靠的信息是一個顯而易見的選擇。
「一旦解決了視覺問題,(激光雷達)就一文不值了。」
馬斯克提出了如下觀點。他知道自動駕駛的問題很難解決,盡管他經(jīng)常錯誤地宣稱特斯拉很快就能解決這個問題。太難了,你需要非常非常好的計算機視覺來解決它。
大多數(shù)人都同意他的觀點——他們認為激光雷達不能獨自完成這項工作(盡管谷歌的第一代汽車基本上只用激光雷達和雷達就可以開得很好)。確實需要很好的計算機視覺來完成這項工作。
但如果按照馬斯克所說的,計算機視覺就必須非常好,好到它可以為你做激光雷達能做的一切。就像人類的視覺皮層一樣,它必須在各種光線下工作。它必須能夠可靠地計算出所有東西的距離。如果它能做到這一切,那么你就不需要激光雷達了。如果你開發(fā)使用激光雷達,你就浪費了大量時間和金錢在一些你最終并不需要的東西上。
因為攝像頭的分辨率更高,它們能看到彩色的東西、更遠的東西——你的攝像頭能做到這一點,甚至做的更好。
也許有一天他是對的。但沒有人知道那一天是什么時候。我們知道不是今天,我們可以猜測可能是在2030年之前。但我們今天想制造汽車。我們知道,便宜的激光雷達很快就會出現(xiàn)。
特斯拉正在豪賭。他們押注,視覺上的突破將很快實現(xiàn)。他們希望自己成為實現(xiàn)這一目標的人,通過使用他們定制的神經(jīng)網(wǎng)絡(luò)硬件和從不斷增長的特斯拉汽車車隊中收集到的海量數(shù)據(jù)。其他公司則押注于一個更安全的賭注,他們認為,實現(xiàn)突破還有很長的路要走,而便宜的激光雷達更有可能出現(xiàn)。
即使在視覺能力達到良好的那一天,許多人仍然可能會選擇保留非常低成本的激光雷達,據(jù)預測,激光雷達將在那個時候出現(xiàn)。它們所提供的優(yōu)勢永遠不會為零,而且,完全「賭上你的生命」的可靠性基本上不需要任何妥協(xié)。
即使你可以用一只眼睛通過一個單色濾鏡開車,你也不能這么做。你可以為了節(jié)省一大筆錢而放棄安全,但不能為了節(jié)省一點錢而放棄安全。
一個致命案例佐證了目前計算機視覺能力的缺陷。
上周,特斯拉因一起致命事故被起訴。在這起事故中,特斯拉的算法顯然誤解了車道標志,并將車駛?cè)肓说缆泛统隹谠训乐g的假「車道」。它直接撞上了防撞護欄,致使駕駛者當場死亡。
按照特斯拉目前的技術(shù)水平,它有時會錯過車道標志。由于它的雷達和視覺算法都未能識別出這道屏障,所以它撞上了防護欄。
同樣,這種情況有時會發(fā)生在今天的技術(shù)上。雷達可以看到它,但作為靜止物體,雷達系統(tǒng)無法準確地分辨它們的位置,因此,當雷達從路徑附近的靜止物體反彈回來時,你不能每次都剎車。
更重要的是,計算機視覺系統(tǒng)無法識別障礙。有一種可能的假設(shè)是,它們只是沒有受過檢測這些障礙的訓練,尤其是檢測受損的;十多天前,一個普通的人類司機打破了這道屏障。
神經(jīng)網(wǎng)絡(luò)只能識別它們接受過訓練的東西,或者類似的東西。特斯拉的網(wǎng)絡(luò)訓練有素,能夠識別道路上每輛車的后部以及某些類型的物體,但在2018年,它們可能沒有接受過這方面的訓練。
它們繼續(xù)開車,更糟的是,它們加速了,因為它們現(xiàn)在認為有了一條完全開放的新車道,這是自適應(yīng)巡航控制在這種情況下經(jīng)常做的。
激光雷達系統(tǒng)幾乎肯定能探測到這個障礙。
如果是在安裝了激光雷達系統(tǒng)的情況下啟用Autopilot,激光雷達系統(tǒng)就會檢測到那輛橫穿馬路、撞死Joshua Brow(特斯拉駕駛者)的貨車。
激光雷達系統(tǒng)不需要知道它們前面的物體是什么,也不需要知道它在哪里,它到底有多大。適當?shù)募す饫走_\/軟件系統(tǒng)確實能更好地了解障礙是什么,它們與視覺相結(jié)合,將達到視覺無法單獨達到的水平。
總之,解決視覺問題,讓它告訴你激光雷達告訴你的一切,是一個非常艱巨的任務(wù)。不久前,很難找到任何一個人說這是迫在眉睫的。如今,也有這樣的人,包括馬斯克,但大多數(shù)人仍然認為這很難。
但特斯拉希望,他們能從特斯拉車隊的汽車中收集大量數(shù)據(jù),這將是找到解決方案的秘密因素。如果是這樣,使用 Autopilot 駕駛,表明特斯拉仍然還有很長的路要走。特斯拉的 Autopilot 提供了一個屏幕來顯示其感知系統(tǒng)的輸出,任何使用它的人都知道它仍然相當不穩(wěn)定。
訣竅是,你不需要解決視覺問題就能得到一個輔助駕駛儀Autopilot,你甚至不需要那么接近。
從99%的精準視力(可以成為一名不錯的司機助手)到99.99999%的精準視力,是一個漫長的旅程,你可以用自己的生命打賭。
Sterling Anderson曾是特斯拉Autopilot的負責人,現(xiàn)在是Aurora的首席產(chǎn)品官,喜歡稱他的老東家的方法為,試圖通過建造一個更高的梯子到達月球。(馬斯克確實對登月略知一二。)
3
馬斯克如果押錯了呢?
特斯拉的賭注可能會取得好結(jié)果。
想要持有自動駕駛股票投資組合的投資者可能希望同時擁有Waymo(如果可能的話)和特斯拉。這是普通多元化投資者的正確策略。
盡管賭注很大,但還是有一些安全網(wǎng)的。如果特斯拉無法用他們最新的硬件很快解決全自動駕駛問題,他們?nèi)匀挥谐錾碾妱悠嚇I(yè)務(wù)。
他們在電力傳動系統(tǒng)和高科技汽車設(shè)計方面擁有明確的領(lǐng)導地位。他們的自動駕駛產(chǎn)品(autopilot products)將繼續(xù)增加新的和出色的功能,即使它們不能在車內(nèi)沒有人的情況下沿著海岸開車,或者在你睡覺時把你的車開到另一個城鎮(zhèn)。
有一些早期功能可以更容易地解決,而且可能不需要激光雷達,例如:
停車場代客泊車
在處理電子郵件時應(yīng)對交通堵塞
深夜低速行駛,最終,白天作業(yè),將汽車送往充電站
無人監(jiān)督的高速公路駕駛,先是在稀疏的高速公路上駕駛,然后在更擁擠的高速公路上駕駛
在預先批準的有限范圍內(nèi)低速運作
更好的ADAS(高級駕駛輔助系統(tǒng)),讓你開車時越來越難撞車
它們并不像機器人出租車(robotaxi)那樣令人興奮或者有利可圖。但它們?nèi)匀环浅S杏茫厮估赡苁堑谝粋€實現(xiàn)上述一些功能的汽車制造商。(一些汽車制造商已經(jīng)實施了無人監(jiān)管的交通擁堵操作。)
如果特斯拉決定它需要激光雷達,在吞下一些驕傲后,它將需要對它們的汽車進行一些重新設(shè)計。
雖然前向激光雷達可能很難添加到后視鏡的攝像頭陣列中,但目前特斯拉還沒有明確的地方可以安裝低阻力激光雷達。它必須比現(xiàn)在的型號小。前向激光雷達是最安全的關(guān)鍵。
4
馬斯克如果賭對,其他公司也不吃虧
人們在研究這個問題時常犯的一個錯誤是,忘記了其他公司并沒有把全部精力投入到激光雷達中。
有和特斯拉一樣熱衷于神經(jīng)網(wǎng)絡(luò)和視覺的,他們只是想把神經(jīng)網(wǎng)絡(luò)和視覺與激光雷達結(jié)合起來,而且他們有資金在這兩方面進行研究。
一個特別重要的競爭對手是谷歌的兄弟公司W(wǎng)aymo。
幾乎所有人都同意,在神經(jīng)網(wǎng)絡(luò)方面,谷歌是全球領(lǐng)導者。那些向世界傳授深度神經(jīng)網(wǎng)絡(luò)新方法的先驅(qū),如杰夫·辛頓本人,為谷歌工作。在圍棋比賽中擊敗人類冠軍的神經(jīng)網(wǎng)絡(luò)來自谷歌。Waymo有使用谷歌神經(jīng)網(wǎng)絡(luò)的權(quán)限,使用TPU神經(jīng)網(wǎng)絡(luò)處理器的權(quán)限。
Dolgov在Medium上的一篇文章中寫道:
谷歌的人工智能研究人員也幫助 Waymo在通往真正的自動駕駛汽車的道路上起步。
當深度學習開始起步時,Waymo的自動駕駛工程師與谷歌大腦團隊并肩工作,將深度網(wǎng)絡(luò)應(yīng)用于Waymo的行人檢測系統(tǒng)。即使在早期,結(jié)果也是顯著的ーー在幾個月的時間里,能夠?qū)⑿腥藱z測的錯誤率降低100倍,使Waymo的系統(tǒng)更安全、也更有能力在道路上行駛。
「我們使用TensorFlow生態(tài)系統(tǒng)和谷歌的數(shù)據(jù)中心(包括TPU)訓練神經(jīng)網(wǎng)絡(luò);TPU可以更有效地訓練我們的網(wǎng)絡(luò),效率提升高達15倍。」
「憑借我們多年的經(jīng)驗,與Google AI的合作,以及強大的基礎(chǔ)設(shè)施,我們比以往任何時候都更接近一個交通更安全、更容易、更便捷的未來?!笵olgov在文章最后總結(jié)道。
雖然馬斯克宣稱特斯拉的神經(jīng)網(wǎng)絡(luò)芯片是「世界上最好的」,但事實并非如此——谷歌的TPU更好,除了Waymo,其他人買不到它。
不過,沒關(guān)系,因為在神經(jīng)網(wǎng)絡(luò)方面,硅谷有很多初創(chuàng)公司都在開發(fā)他們自己版本的「世界上最好的芯片」,你會在2019-2020年看到很多這樣的公司。與此同時,英偉達的GPU可以做到這一點,性能超過特斯拉的芯片,但它們的功耗更高。
如果激光雷達明顯是多余的,Waymo和其他幾家公司將準備轉(zhuǎn)移。
他們沒有特斯拉的車隊,但是有辦法得到這些資源,盡管有時成本更高,而特斯拉聰明地讓客戶為收集數(shù)據(jù)和為特斯拉做測試的機會付費。 (Uber和Lyft還有更多的司機可能會為他們做同樣的事情。)
如果正如馬斯克預測的那樣,激光雷達敗了,特斯拉將擁有優(yōu)勢,但并非是不可逾越的優(yōu)勢。
他還必須確保自己下的其他賭注也能兌現(xiàn)——比如沒有詳細地圖的駕駛——以及使用機器學習來做出戰(zhàn)術(shù)駕駛決策,比如在十字路口使用哪條車道。他也(溫和地)反對模擬測試:他們使用模擬測試,但不像Waymo和其他一些玩家那樣廣泛使用。
特斯拉可能仍需要在其軟件成熟時調(diào)整其傳感器??拷嚨牡胤?,攝像頭看不到,如果遇到惡劣天氣,汽車側(cè)面和后部也沒有雨刷。即使在那些地方,激光雷達的愛好者也不會避開神經(jīng)網(wǎng)絡(luò)。他們使用神經(jīng)網(wǎng)絡(luò)理解激光雷達數(shù)據(jù),就像他們用它來理解攝像頭數(shù)據(jù)一樣。 (它們也可用于雷達數(shù)據(jù)。)由于激光雷達的分辨率較低,這些神經(jīng)網(wǎng)絡(luò)更加簡單和快速。
馬斯克表示,特斯拉「明年」將有100萬輛自動駕駛出租車上路,雖然特斯拉的叫車計劃缺乏許多重要細節(jié)。
至于Waymo何時將其自動拼車服務(wù)Waymo One推向進行初始測試的鳳凰城地區(qū)以外的市場,Waymo高管對具體時間守口如瓶。
「我們有一個路線圖和將業(yè)務(wù)擴展到鳳凰城以外的地區(qū)的計劃。」Dolgov說,「但一如既往,我們的部署將以安全為前提。」
參考來源:Mashable、福布斯、Wired
轉(zhuǎn)載請注明出處。