或許,特斯拉以后會學會“躲警車”?
【太平洋汽車網 行業頻道】最近幾天,國內發生了“駕駛蔚來ES8啟用駕駛輔助功能(NOP領航狀態)下發生車禍身亡”的事件。幾乎同時,美國政府監管機構國家公路交通安全管理局(NHTSA)宣布,將對特斯拉Autopilot 自動輔助駕駛展開安全調查,涉及11起事故,76.5萬輛車。中美兩起事件幾乎同時出現,將“高階輔助駕駛”安全性推上了風口浪尖。在這樣的輿情背景下,特斯拉在當地時間8月19日(北京時間8月20日)如期舉辦了自動駕駛相關的“AI DAY”活動。
特斯拉在活動上并沒有提及NHTSA的調查,不過很“調皮”的玩了個梗。在談及特斯拉算法會標記前車的各種特征,并根據前車類似控制車距時,畫面顯示的是一排呼嘯而過的警車,主持人補充說,他們可能在執行某種任務吧。而在NHTSA針對特斯拉調查的11起事故,7起是與警車相撞、2起與消防車相撞、1起撞的是巡邏車。按這個意思理解,大概是特斯拉以后看到警車會躲得遠遠的?
當然,這點細節不是重點,敢在風口浪尖上如期舉辦“AI DAY”,當然還是因為他們發布的東西真的很牛X。發布會上最閃耀的當然是能在全球排第五的“Dojo”超級計算機(排在他前面的都是不同國家所有的超算),和其別具一格的芯片設計。而發布會上最有趣的是最后的彩蛋環節,一個人形機器人緩步走上了舞臺。
這個名叫Tesla Bot的機器人目標是“可以100%模擬人類的性能,在未來為人類社會釋放更多的勞動力”。好家伙,如果不是現場那位突然開始瘋狂跳舞,我還以為特斯拉真的已經把這玩意做出來了呢。現場跳舞這位當然還是真正的人類舞者,馬斯克丟出這么一個瘋狂的“PPT計劃”,無非是告訴全世界,特斯拉的超算算力可以強(xian)到可以讓我們的工程師鼓搗人形機器人了。同時也向全世界人工智能領域的人才發出邀請,如果你們來特斯拉上班,不用困在枯燥的自動駕駛標記這些瑣碎的小事上,這里有最好的設備讓你有機會實現最瘋狂的想法。
沒錯,本次特斯拉“AI DAY”不像一年前頂著疫情邀請大批車主車迷到場的“電池日”,而是面向全世界人工智能領域人才的一場凡爾賽發布會,目標當然是吸引人才的加入,這一點也得到了馬斯克的確認。
那這次“AI DAY”和消費者有啥關系嗎?沒有,但也并非全無關系。特斯拉首先解讀了目前已經在北美地區推送的FSD工作原理,可以很好的解答FSD如何在不依賴高精度地圖、激光雷達等,依賴純視覺便可以實現城市環境下的自動輔助駕駛能力。
從去年開始,特斯拉Autopilot/FSD已經升級采用視頻流數據分析算法,通過對收集到的數據加入時間戳,特斯拉可以形成一定時間的“記憶”能力,并繪制出周邊更大范圍內的地圖信息。例如剛剛走過的路或剛剛看到又被擋住的車等,都會保留在特斯拉繪制的地圖上,并根據這些數據,對視覺范圍之外的信息進行預測。
特斯拉能夠記得視野中的卡車擋住了一臺車,也會對被擋住的車的行進路線進行預測避免碰撞。而對建筑等遮擋的視野之外的道路走向等,也會實時進行不間斷的預測,這些預測會在越接近時變得越發準確,借此可以輔助車輛對后續的路徑進行規劃。
有人可能會好奇,這樣的地圖繪制是否屬于高精度地圖?是否涉嫌違法測繪地圖?
首先這不是高精度地圖,地圖測繪會涉及當地的經緯度等信息,而高精度地圖包含的信息更加豐富。高精度地圖需要提前完成測繪等數據搜集工作,并對數據進行加工生產,并下發至車輛。通過存儲的高精度地圖可以減少車輛對道路信息實時感知、預測的需求,將更多的算力釋放到對路面目標的感知上,與通過攝像頭進行的實時地圖繪制并不相同。
至于法規方面,不同國家和地區對地圖測繪的規定也不盡相同。地圖測繪除了道路信息,還會涉及到經緯度,甚至精確的大地坐標等可能關系到國家安全的敏感信息。在我國,地圖測繪需要相關資質,且地圖數據不得通過網絡發送。有資質的圖商需要將測繪的數據用硬盤等線下方式送至國家測繪局進行不可逆的加密處理。不過這些測繪并非通過攝像頭可以完成,特斯拉對周遭地圖的繪制,預計能夠繞開絕大多數國家和地區對地圖測繪的限制。因此該功能也能幫助特斯拉在無需高精度地圖數據的情況下,在世界各地開啟自動駕駛相關功能。
不過,前不久我們發布了《關于加強智能網聯汽車生產企業及產品準入管理的意見》,要求:未經審批,不得通過在線等軟件升級方式新增或更新汽車自動駕駛功能。因此,特斯拉FSD想要在國內向用戶推送,也需要經過相關部門的審批,這或許會影響FSD在國內的推送節奏。
除了對道路等的預測,FSD還會對目標物體的行進軌跡進行實時預測。在發布會上公開的視頻資料中,我們可以清晰的看到包括人、車輛等不同類型、不同速度的目標前有一些長短不一的線,這些就是特斯拉對該目標接下來的運動軌跡的預測,這些線條也會根據目標狀態的不斷變化實時發生變化。這些對于人類而言無非是本能的反應,但人工智能能夠做到這種程度的預測卻已經是當下國際最先進的水平之一了。
完成了對目標和道路的感知和預測,就需要對車輛接下來行進的路線進行規劃。特斯拉在發布會上提到了三個典型場景,第一個是旁邊車道有車情況下的變道。基于視頻流數據分析可以對旁邊車道車輛接下來的位置進行預測,而非基于當下兩車的相對位置做出決策,經過前期對數據的反復推演和多種方案的對比,神經網絡可以學習到最優的變道時機,并在后續的實際場景中靈活應用。
第二個是兩邊停滿車的擁擠窄到遇到對向來車的場景,可以看到特斯拉先是停車避讓,在觀察到對向來車停車避讓時迅速做出反應,快速通過。這樣的場景在不同時期,不同國家和地區,根據駕駛員的不同習慣會有多種不同的結果,因此這類場景也需要在不同市場、不斷的采集大量數據對神經網絡進行訓練。
第三個場景被稱為“停車場困局”,相較外部道路有道路線等約束,停車場存在的可能路徑會變得更多。可以看到公開的視頻中特斯拉幾乎畫出了全部的可以通行的位置,通過神經網絡在其中找出最優的行進路線。
其實這樣的路徑規劃內核從視覺感知誕生之初就一直延續,上世紀六七十年代誕生的人類最早的視覺感知自動駕駛車輛——Stanford Cart,在1977年便實現了立體視覺感知,并在隨后兩年完成了在散落椅子等干擾物的空間中自行規劃路徑通過的壯舉。
只是隨著半導體技術和人工智能技術的發展,如今的芯片算力與當年已不可同日而語,人工智能也從專家模式轉變為基于卷積神經網絡的深度學習算法。因此當年在規劃的路徑上一個個稀疏的點,如今已經變成了一個接一個的密集的點。就在近些年輔助駕駛剛剛興起時,還有車輛在過彎時會走出不斷“撞線”的折線,那便是稀疏的路徑點和未能很好優化的算法導致的。
其實在上述幾點之前,自動駕駛最先需要完成的是對目標物體的識別。想要讓人工智能系統認識形形色色的人、車,還有路標、車道線等等事物,需要的不是特別強大的高科技,而是海量的標注員通過人海戰術對龐大的數據進行標注,將標注完成的數據“喂”給神經網絡進行學習。不管是當下的自動駕駛還是高精度地圖的繪制等,這都是不可或缺的一步。
不過這種笨辦法顯然不是長久之計,在系統認識足夠多的事物之后,可以讓機器自動對海量的數據進行標注,將機器標注的數據“喂”給神經網絡進行深度學習,這也就是“無監督學習算法”(Unsupervised Learning,無需人工對訓練數據集進行標注,系統可以自行根據樣本間的統計規律對樣本集進行分析)。
當然,無監督訓練幾乎所有的人工智能公司都在應用。但是,無監督訓練是在完成了海量數據標注和更多的數據搜集之后才能發揮出其威力。率先在量產高級自動輔助駕駛領域發力的特斯拉不論在標注還是數據搜集方面都有著絕對的優勢地位。目前,特斯拉已經積累了100萬個10秒左右的視頻,并給60億個物體貼上了深度、速度和加速度的標簽,這些數據目前已經達到了驚人的1.5PB,且每天都還在增加。在“AI DAY”上提到,特斯拉已經完成了橫跨美國絕大多數道路的數據采集,這些道路數據和場景都可以通過無監督學習幫助特斯拉自動輔助駕駛算法進行訓練升級。
而如此海量的數據和對應的需求的驚人算力,就需要本次“AI DAY”上亮相的主角——“Dojo”超級計算機來完成了。
“Dojo”與自動駕駛汽車本身需要的芯片并不相關,特斯拉車型上目前搭載的是其自研的FSD芯片,FSD芯片能夠完成車輛所需的感知、決策、規劃等所需的算力。而“Dojo”是為最終推送給用戶的算法的研發、訓練服務的超級計算機。
當然,Dojo最早要等到明年才能投入使用,當下特斯拉數據中心使用的是由5760個Nvida A100 80GB的GPU,組成了720個節點,總算力達到1.8EFLOPS(EFLOPS:每秒千萬億次浮點運算),有10PB的存儲空間,讀寫速度為1.6TBps的超級計算機。但在數據量、訓練強度不斷增加的情況下,這臺超級計算機已經越來越不能滿足特斯拉的需求。而且需要海量的物理結構進行連接以實現通訊的超級計算機不僅耗費大量成本,且由于連接結構的帶寬限制成為“木桶短板”,導致整體效率較低,并且還有分散的龐大散熱問題。
在這樣的背景下,特斯拉再次發揮其市場上沒有就自己造的精神,自研了“Dojo”,順便打破了不知道多少世界紀錄,特斯拉“被迫”的成為了人工智能巨頭。好吧,又被馬斯克裝到了。
“Dojo”超級計算機本身與消費者有著遙遠的距離,不過我們抱著欣賞凡爾賽產品的心情來了解一下“Dojo”的技術細節吧:
據悉,“Dojo”單個芯片算力為 362 TFLOPS,25 個芯片為一組,組成一個訓練模塊。算力可以達到 9 PFLOPS,接口帶寬為 36 TB/s。這次特斯拉推出的機柜模型由 120 個訓練模塊組成,內置 3000 個 D1 芯片,超過 100 萬個訓練節點,算力將達到 1.1 EFLOPS,是特斯拉現有超級計算機的一萬倍。并且Dojo 支持無限連接,理論上性能無上限。根據公開的數據,Dojo的演算力已經達到全球第五,僅次于第一的日本『富岳』、第二的美國Summit、第三的美國Sier,以及第四的中國『神威太湖』。
除了驚人的數據,“Dojo”有趣的地方在于采用了非常規的封裝形式,第一層和第五層銅質結構是水冷散熱模塊;第二層結構由5*5陣列共25個芯片組成;第三層為25個陣列核心的BGA封裝基板;第四層和第七層只是物理承載結構附帶一些導熱屬性;第六層是功率模塊,以及上面豎著穿過散熱與芯片進行高速通信的黑色長條狀互聯模塊。而第二層5*5陣列的共25個芯片,采用InFo-SoW技術,有一整塊300mm的晶圓制成。InFo-SoW不像傳統模式將晶圓切割成多個芯片,而是所有的芯片都來自于同一個晶圓,不但不進行切割,反而是直接講整個晶圓做成一個超大芯片,實現system on wafer的設計。也正是這樣獨特的封裝形式,讓Dojo解決了此前海量的物理結構成本高、通訊效率低、發熱大等問題。
“Dojo”的技術就聊這些,其實這里有一個問題。特斯拉自動駕駛算法的訓練需要將來自全球超100萬輛(截至目前)特斯拉車輛采集的真實數據匯聚于其在北美的數據中心,然后通過Dojo進行深度神經網絡訓練,以此幫助特斯拉的Autopilot不斷進化,最終實現以純視覺為基礎的完全自動駕駛(FSD)。
但是,特斯拉在國內關于數據安全的爭議一直不斷,涉及國家安全的關鍵區域禁止特斯拉進入的事件長期在網上發酵。對此,特斯拉曾表示,“數據隱私安全,關乎著每一個消費者。特斯拉將嚴格遵守數據安全法,保護消費者數據相關權益”。同時表示,特斯拉已在中國建立數據中心,以實現數據存儲本地化,并將陸續增加更多本地數據中心。
在自動駕駛算法的訓練中,尤其是針對本土市場駕駛員習慣的做出反應的算法訓練需要用到Dojo或其他算力強大的超級計算機對數據進行處理并展開訓練。也就是特斯拉不僅需要將數據存儲在中國本土,還需要在中國建立有處理、訓練能力的數據中心,未來特斯拉是否會將Dojo或其他超級計算機部署在中國本土,有待持續關注。
“Dojo”超級計算機的用途是訓練其自動駕駛神經網絡,那具體有哪些工作?首先當然是通過“無監督學習算法”對新產生的海量數據進行自動標注,隨著特斯拉新車銷量持續快速增長,這類數據的增長也會以相應的速度飛速上升。
其次是針對特殊場景的針對性訓練,例如“AI DAY”上提到一起前方卡車卷起的風雪遮擋前方車輛的極端案例。這樣的場景在現實中并不多見,但發生時會異常危險,因此,特斯拉會利用現有的超級計算機或未來的Dojo模擬更多的類似場景多神經網絡進行訓練。
于是便有了包括前方車輛掉落粉塵等數十種不同的類似虛擬場景,而經過這種針對性訓練之后,算法在類似場景中對目標物體位置的判斷不再飄忽,而能夠穩定的進行預測。
插一句題外話,這張圖是特斯拉數據中心為神經網絡訓練模擬的虛擬場景,不論是場景還原還是畫面流暢度,甚至難以與真實場景進行區分。這實在讓游戲玩家羨慕,腦補在這樣的配置下玩GTA或者其他什么虛擬現實游戲,體驗絕對拉滿。在“AI DAY”上,特斯拉表示他們不止能虛擬麋鹿等罕見動物出沒的場景,甚至虛擬一頭獨角獸出場也不在話下。
如何找出類似的特殊場景?絕大部分會是特斯拉在Autopilot駕駛時,駕駛員突然介入,改為人工駕駛,Dojo就會分析這個視頻案例,試圖找出駕駛員中斷Autopilot的原因。又或者司機在高速路上突然剎車、堵車時有人插隊、雷達與攝像頭判斷結果不一致、車輛發生事故/險些發生事故等等,將這些具體的案例,交給Dojo來分析處理。
更多的數據通過Dojo的處理,反饋給神經學習系統,實現自動駕駛算法的迭代,而算法的迭代,讓Autopilot更加好用,持續反饋更多的數據給Dojo分析,從而實現一個正循環。不過除了官方測試車輛,針對普通用戶進行的數據搜集及可能涉及到的隱私、安全等問題是另一個層面值得討論的方向。
在“AI DAY”最后的問答環節,有人問特斯拉是否會開源其算法。馬斯克表示這是一項耗資巨大的項目,特斯拉需要想辦法攤平其成本,但目前為止還沒有好的攤平成本的方式。面對巨額的成本,特斯拉不可能免費開源其算法等,但歡迎有意向的企業談判購買。
特斯拉擁有了Dojo,那研發自動駕駛的車企是不是已經內卷到需要都搭建自己的超級計算機?其實并不是,利用虛擬場景對神經網絡訓練是業內常規的做法。而國內包括百度阿波羅、華為等都搭建了相應的云平臺,中小企業可以利用這些大企業搭建的云計算能力進行數據標注、無監督學習、神經網絡訓練等,而且沒有特斯拉那樣龐大銷量支撐的的數據搜集能力,多品牌合力共享的數據可以更好的完善潛在的場景。
自研Dojo殺入全球超級計算機排行榜前列,特斯拉再次用驚人的行動力震驚了世界。而這樣凡爾賽式的秀肌肉,確實也是特斯拉招攬全球一流人工智能人才最好的方式。最后丟出的Tesla Bot機器人引起了熱議,不過Tesla Bot機器人更像是告訴全世界,特斯拉人工智能潛力的凡爾賽表演。即便Tesla Bot機器人還是真人“假裝”的“PPT”,但仿佛是對還陷在“人海”戰術進行圖像標注,用人堆砌人工智能的企業的嘲弄。Tesla Bot機器人是否能真的量產?目前給出結論還為時尚早,不過以馬斯克一向激進,Tesla Bot機器人能夠解放人類生產力的大膽創意還是讓人期待。
>>點擊查看今日優惠<<