新勢力又要摸著馬斯克過河了
作者|趙晉杰 來源|字母榜(ID:wujicaijing)
在摸著馬斯克過河之前,何小鵬先摸了一把前同事。
“特斯拉的研發(fā)進度領先國內(nèi)智能駕駛1.5-2年。”7月初,前小鵬自動駕駛研發(fā)副總裁谷俊麗的一番言論,引發(fā)外界爭議。
自此之后,車企大佬幾乎再無人敢直接點評特斯拉與中國車企在智能駕駛方面的具體差距。近期,輪到何小鵬點評時,他也只是輕輕贊揚了一番,表示過去自己一直覺得谷歌母公司旗下的Waymo,是神一般的存在,但6月份去舊金山體驗完特斯拉FSD V12版本后,感到“非常非常驚訝,跟以前完全不是一個版本了。”
讓何小鵬驚訝的秘密武器,便來自特斯拉于今年初正式上線的,端到端自動駕駛技術新版本FSD V12。
特斯拉 FSD V12,最大的改變是用了 “端到端” 架構,即一端輸入攝像頭等傳感器獲得的數(shù)據(jù),另一端直接輸出車該怎么開。
在此之前,自動駕駛采用的是模塊化方案,即把感知、預測、規(guī)劃等劃分為各自獨立的模塊,完全依賴工程師編寫大量代碼去制定行駛規(guī)則,從而告訴車遇到什么樣的狀況時,該采用哪些規(guī)則指令。
如果將模塊化方案視作iPhone中的Siri,那么端到端的出現(xiàn),無疑就是ChatGPT時刻的降臨。
喊出全球唯二、中國唯一實現(xiàn)端到端大模型量產(chǎn)落地車企的何小鵬,在談及特斯拉FSD有望年底進入中國的話題時,給出的答案是不擔心后者的競爭。
同樣不想落后特斯拉一步的華為,在4月份發(fā)布乾崑ADS 3.0架構時,也開始強調(diào)“端到端”技術。7月份的理想智能駕駛夏季發(fā)布會上,官方也發(fā)布了基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術架構。近期蔚來也官宣其智能駕駛技術架構 NADArch2.0,正式引入世界模型的端到端架構。
理想、蔚來所謂的“世界模型”概念,也多少帶些特斯拉的影子。
2021年特斯拉AI Day上,通過仿真模擬,借助Dojo超算能力,馬斯克給特斯拉規(guī)劃了一條通往完全自動駕駛的可行性路徑,即借助虛擬仿真技術,來測試邊緣情況和其他行駛過程中可能遇到的意外問題,“用自動駕駛來重現(xiàn)自動駕駛場景。”馬斯克說道。
十年前,“蔚小理”創(chuàng)立之初,紛紛摸著特斯拉打開了消費者對電動汽車的認知。十年后,面對AI大模型帶來的新一輪技術變革,新勢力們又一次跟緊了特斯拉的步伐。
且這次的競爭,可能比十年前更激烈。
2014年,是智能汽車史上一個關鍵節(jié)點。從這年開始,汽車范式變革席卷全球,汽車工業(yè)進入跨界創(chuàng)新時代:傳統(tǒng)的機械與制造模式,被新興的新能源與電子電氣技術一步步趕超。
一個軟件驅動汽車的新時代來臨,汽車工業(yè)就此開始轉向基于ICT和互聯(lián)網(wǎng)技術的經(jīng)濟范式。原本適用于消費電子行業(yè)的邊際成本效應,開始在汽車領域發(fā)揮作用。
盡管前期智能化研發(fā)投入成本高昂,但一旦成功之后,其復制擴張的邊際成本將變得無限低。“大家只能玩了命比研發(fā)、比技術,這就是為什么消費電子行業(yè),如手機等,都是贏家通吃。”雷軍在近期接受李翔專訪時說。
如今,贏家通吃的前景和壓力,一同涌到了新勢力面前。
一
質疑特斯拉、理解特斯拉,到成為特斯拉的一幕,正在車圈輪番上演。
2013研發(fā)輔助自動駕駛功能Autopilot時,特斯拉也是老老實實采用了前輩谷歌開辟的路徑,即用激光雷達、攝像頭等傳感器收集數(shù)據(jù),人工標注之后,再讓工程師編寫行駛規(guī)則代碼,從而決定車該怎么開。
轉變在2021年到來。為了節(jié)省成本和更快速普及自動駕駛功能,馬斯克決定放棄激光雷達和高精地圖,改用純視覺方案。
2021年5月份,特斯拉正式?jīng)Q定去掉量產(chǎn)車上此前標配的毫米波雷達,僅保留全車八個攝像頭,來為特斯拉FSD采集外部環(huán)境數(shù)據(jù)。
2021年7月31日,特斯拉開始推送FSD全新版本FSD Beta V9.1,這是首個使用“特斯拉純視覺”方案的輔助駕駛套件。
自此之后,自動駕駛領域被分成了兩大流派——純視覺派和激光雷達派,前者以特斯拉為首,后者以小鵬、蔚來等為首。
讓馬斯克敢于做出放棄激光雷達決定的一大原因,在于特斯拉更新了以Transformer為基礎的BEV(Bird's Eye View,鳥瞰視野)感知模型,其不需要依賴高精地圖,便可實現(xiàn)輔助自動駕駛功能。
在BEV+Transformer架構之外,特斯拉隨后又加入了占用網(wǎng)絡技術(OCC),使得純視覺方案的導航精準度進一步提升。
在特斯拉改用純視覺方案一年后,2022年下半年,蔚小理、華為、比亞迪等,都開始摸著特斯拉過河,轉向研發(fā)不依賴高精地圖的BEV+Transformer方案。
比亞迪智能駕駛業(yè)務負責人韓冰,甚至在去年中的一場活動上說道:“BEV是比亞迪在高階智能駕駛上彎道超車的機會。”
也正是由于排除了高精地圖的牽絆,2023年,中國車企展開了比拼NOA(領航輔助駕駛)開城速度的新競賽。
余承東就曾感慨過,華為在上海投入一兩年,都沒采集完城區(qū)高精地圖,“上海一條小路都要折騰很久。”
除了提速NOA開城速度之外,特斯拉所引領的純視覺方案,還讓新勢力們看到了將高階智駕技術,下放到平價車型上的可能性。
3月份發(fā)布的小米SU7,其Pro/Max版本采用激光雷達方案,標準版則走了純視覺方案;小鵬8月份上市的M03,也會配備不同智駕方案,這將是小鵬首次在量產(chǎn)車上應用純視覺路線;蔚來9月份上市的第二品牌樂道L60,同樣出于成本考量,取消了激光雷達,換用純視覺方案。
為了搶占更多車企合作訂單,華為也在今年正式發(fā)布了視覺智駕方案——HUAWEI ADS基礎版,號稱可實現(xiàn)全國高速城快路段的智能輔助駕駛,以及智能泊車功能,目前已經(jīng)相繼應用在智界S7和深藍S07上。
隨著AI大模型在2022年爆火,被特斯拉引燃的端到端智駕新路線,則成為繼“BEV+Transformer+OCC占用網(wǎng)絡”智駕方案之后,車企競逐的新目標。
二
想要實現(xiàn)端到端,車企的視覺神經(jīng)網(wǎng)絡就需要采集更大量、更多樣化和更真實的數(shù)據(jù)樣本,同時用更低時延的算力對數(shù)據(jù)加以解析利用。
這直接催生了三年前特斯拉超算系統(tǒng)Dojo的誕生。
2021年特斯拉AI Day上,馬斯克宣稱Dojo效率已經(jīng)超過了英偉達GPU和谷歌TPU。為了實現(xiàn)地表最強目標,特斯拉自主研發(fā)了首款AI訓練芯片D1。7nm制程的D1,運算處理能力可以達到362 TFLOPS(相當于每秒362萬億次的浮點運算)。
D1之前,馬斯克就憑借FSD推理芯片誕生,讓特斯拉坐上了全世界第一個自研智能駕駛芯片的車企的寶座。
在2019年特斯拉量產(chǎn)FSD芯片后,蔚小理相繼于2020年組建起自己的芯片團隊。
在智能汽車領域,為了實現(xiàn)更好的性能優(yōu)化,從芯片、算法到操作系統(tǒng),一體化自研已經(jīng)成為越來越多車企攻克的方向。在頭部新能源車企身上,表現(xiàn)尤為明顯。何小鵬也曾公開發(fā)表觀點,認為“像蘋果這樣的軟硬件一體可控模式,在智能汽車企業(yè)里面會出現(xiàn)越來越多”。
隨著特斯拉在軟硬一體道路上越走越遠,新勢力們也開始加足馬力追趕。
進入2024年7月份,蔚小理四年造芯路,終于有了成果:蔚來在NIO IN 2024上對外宣布,全球首顆5nm智能駕駛芯片——神璣 NX9031流片成功。該芯片有望于2025年一季度首搭蔚來旗艦轎車ET9。
同時,據(jù)36氪汽車爆料,小鵬汽車自研的智駕芯片也已經(jīng)送去流片,“預計8月回片。”
理想汽車的智駕芯片也將于年內(nèi)完成流片。
更好地控制成本,成為誘導新勢力們下場造芯的主要原因之一。
“如果理想自己做推理芯片,可以做到像特斯拉一樣的成本,因為算法掌握在自己的手里,也包括后面整個的訓練平臺、訓練芯片自己做。” 李想曾如此講到,甚至還評估過特斯拉做AI訓練芯片D1的具體縮減成本,“大概能做到英偉達A100六分之一的成本。”
值得一提的是,在英偉達芯片斷供危機之下,新勢力們的芯片自研,還開始承擔起保衛(wèi)供應鏈安全的戰(zhàn)略價值。
且隨著芯片不斷迭代,其對車企帶來的成本優(yōu)化空間還會進一步擴大。二季度財報會上,馬斯克表示,下一代特斯拉AI芯片,也就是HW5,從推理能力的角度來看,“它可以與英偉達GB 200相媲美。”
三
但無論推進端到端,還是自研芯片,對于尚處在虧損階段的大多數(shù)新勢力而言,都將是一筆承壓的投資。
智能駕駛等高算力芯片,研發(fā)周期長、資金投入大,且不確定性高。有數(shù)據(jù)統(tǒng)計,一顆高算力芯片的研發(fā)和量產(chǎn),至少需要花費十幾億元。
為車企供應智駕芯片的地平線創(chuàng)始人兼CEO余凱更是直言,車企應該慎重考慮自研智能駕駛芯片問題。“自研和他山之石本身是戰(zhàn)略選擇,如果車廠的年銷量預期不到100萬輛,資金的整個效率其實是算不過賬的。”
這考驗著車企的規(guī)模效應。只有賣出更多的車,才能平攤這些研發(fā)支出,并發(fā)揮出自研芯片的成本優(yōu)勢。
環(huán)顧全球新能源車企,2023年,僅有比亞迪和特斯拉兩家,達成了年銷百萬輛的目標。
更不容忽視的是,規(guī)模效應還將幫助車企在端到端競爭中獲取更多數(shù)據(jù)支持。
端到端模型上限很高,有望直指自動駕駛的L5級別,但它的下限很低,在一些基礎狀況下,甚至比不上模塊化方案,如采用端到端路線的特斯拉FSD V12版本上線后,被不少人測試出車輛撞到馬路牙、損壞輪轂的低級錯誤。
避開上述低級錯誤的主要方法,就是投喂給端到端模型更多的資源,包括算力、算法和數(shù)據(jù)等。
去年財報會上,馬斯克便談到數(shù)據(jù)對自動駕駛模型的重要性:“用100萬個視頻片段訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow;到了1000萬個,就變得難以置信了。”
但并不是所有的行車數(shù)據(jù)都可以用來訓練端到端模型。這方面,汽車跟ChatGPT等大模型一樣,考驗的是廠商處理數(shù)據(jù)的細節(jié)。
“在以數(shù)據(jù)為中心(data-centric)的AI新時代,模型能不能出彩實際上主要是靠數(shù)據(jù)。”大模型從業(yè)者李振曾向字母榜(ID:wujicaijing)解釋,數(shù)據(jù)里面潛藏的諸多魔鬼細節(jié),甚至決定著大模型產(chǎn)品的成敗。
谷歌就是前車之鑒。不管從算力還是算法,谷歌并不比OpenAI差,甚至還要強,但恰恰是借助基于人類反饋的強化數(shù)據(jù)訓練工作,OpenAI最終趕在谷歌前面做出了ChatGPT。
“特斯拉為什么能夠遙遙領先?是因為它有銷量作為基礎。”在谷俊麗看來,要在商業(yè)模式上追趕特斯拉,必須形成產(chǎn)品的規(guī)?;?。
而特斯拉留給新勢力們追趕的窗口正在收緊。根據(jù)馬斯克預測,隨著FSD V12.5版本,或者12.6版本的推出,最快今年年底,中國、歐洲等國家和地區(qū),就可以獲得落地批準。
規(guī)模效應之外,憑借自我造血能力,馬斯克還給這場端到端競賽,劃定了一個入場門檻。在4月份訪華當天,馬斯克發(fā)文稱,“特斯拉今年將斥資約100億美元用于AI的訓練和推理,后者主要用于汽車。任何公司,如果沒有達到這樣的支出水平,并且不能高效地完成這項工作,就無法參與競爭。”
用十年熬過規(guī)模量產(chǎn)挑戰(zhàn)之后,一場新的淘汰賽再次擺在了新勢力面前。
參考資料:
《關于造車,雷軍近年唯一深度專訪》雷軍
《放棄雷達,國內(nèi)車企倒戈純視覺路線》中國汽車報
《蔚來、小鵬等自研智駕芯片將流片,上車進入倒計時》36氪
《理想自研芯片進展:在新加坡設立辦公室,團隊規(guī)模已超 160 人》晚點Auto
《特斯拉從此無禁區(qū),但FSD 入華還沒時間表》盒飯財經(jīng)
編者按:本文轉載自微信公眾號:字母榜(ID:wujicaijing),作者:趙晉杰
前瞻經(jīng)濟學人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。