2022年11月8日-10日,由中國汽車工業協會主辦的第12屆中國汽車論壇在上海嘉定舉辦。作為黨的“二十大”召開后的汽車行業首場盛會,本屆論壇以“聚力行穩 蓄勢新程”為主題,共設置“1場閉門峰會+1個大會論壇+16個主題論壇”,以汽車產業的高質量發展為主線,與行業精英一起貫徹新精神,研判新形勢,共商新舉措。其中,在11月9日下午舉辦的“主題論壇1:第四屆全球汽車技術發展領袖峰會”上,百度智能駕駛事業群組技術委員會主席王亮發表精彩演講。以下內容為現場演講實錄:
各位專家,各位行業同仁,大家下午好!我叫王亮,來自百度。
很榮幸受到組委會的邀請,參加2022年中國汽車論壇,有機會與各位行業技術領袖一起進行一場關于技術創新的面對面交流,機會非常難得。我今天分享的主題是智能汽車時代的自動駕駛技術共生。
“共生”一詞大家可能會有些陌生,百度這個詞條,字典給出的定義是:“不同生物生活在一起,相依生存,對彼此都有利的一種生存方式”。
今天,與各位做分享的汽車行業專家相比,我是來自科技公司、互聯網公司,大家的技術背景、經歷各異,我個人是算法背景的工程師出身。我們同處汽車智能化的大賽道下,如何貢獻自己的技術強項,與大家互利,為用戶創造更大價值,是今天我想與大家重點探討的問題。
大會上很多分享都提到汽車行業正在經歷百年一遇的變革,電動化、智能化正在以超出我們預估的速度到來。我們認為,本輪變革分為三個階段:電動化、智能化、智能電動車(Smart EV),每個階段都遵循創新擴散理論。理論認為人類社會中5%的人是創新者,什么新鮮的科技都想嘗試一下,10%的人是早期用戶,愿意嘗鮮,同時關注一定的實用性。最后是早期大眾,十分觀眾實用性,大量的創新沒有辦法從早期用戶跨越到早期大眾,稱之為“鴻溝”。
階段一:電動化。憑借國家政策的支持,比如特斯拉Model 3、比亞迪和新勢力成功車型的引領作用,三電技術的巨大進步,2019年開始有“跨溝”的跡象,2021年完成了“跨溝”。
階段二:智能化。緊隨其后是汽車的智能化,通過內部分析認為2023、2024年終端將有50%左右的使用者在充分嘗試了高階智能駕駛,這里的“高階”指的是定義為具備在復雜城市道路下進行領航輔助駕駛能力的自動駕駛優秀供給會出現,并通過幾年的迭代最終在2025年實現智能化自動駕駛功能的跨溝。
跨溝意味著什么呢?現在大家買車的時候,頭部的考慮因素包括車的顏值、車內空間、車的屏幕大小、屏幕多少等,但很少有用戶把自動駕駛囊括在最頂層的選車考慮因素中。
到了2025年,用戶去一家4S店買智能汽車的時候會問這輛車有沒有城市道路領航輔助駕駛功能,如果說沒有大家會覺得很奇怪。想象一下今天去買手機,如果發現手機只有一個后視攝像頭,大概率你會覺得這肯定不是最新一代的領先智能機。
進入第三階段,智能電動車開始綜合競爭的時候,功能電動車競爭力將加速衰退,用戶對智能化的訴求將會接近完全自動駕駛。雖然從用戶的視角不一定是完全的L4、L5,但是在主動干預的頻次大幅降低以后,也讓用戶每天的使用有非常高的獲得感,覺得車非常智能,認可自動駕駛能力和價值。
從第二階段開始,電動化逐漸被行業所消化,高級別的智能駕駛開始成為贏得智能化競爭中真正的game changer。
最近我看了一段馬斯克采訪的視頻,他很誠懇地說造車是很難的,大部分造車公司都倒閉了,特斯拉也曾多次在倒閉的邊緣。今天我也想感嘆做自動駕駛這樣的大規模復雜軟件系統也是非常困難的,大浪淘沙,許多明星級的初創公司,人才儲備、啟動資本都非常充足的情況下,也在自動駕駛激烈的競爭中陸續倒下了。
自動駕駛的研發門檻非常高,需要AI人才的儲備,更重要的是需要長期且堅定的投入。前不久剛剛有人采訪時問我,百度為什么堅持自動駕駛做了這么久?這么難的一件事情短期都還看不到賺錢的機會。
我說,百度的使命是用科技讓復雜的世界更簡單,出行和交通絕對是一件復雜的事情。很多年輕人在北上廣深大城市打拼,每天要花2-3個小時的時間駕車擁堵在路上,同時每年有那么多人因為交通事故遭受財產甚至是生命的損失。利用科技是最直接、最本質的優化這個問題的手段,這就是百度使命指引下應該做的事情,我們責無旁貸。在百度有一句話叫“看準了就奔赴”,自動駕駛這件事我們一奔跑起來就是十年。
下面,我跟大家簡單回顧一下這十年的研發歷程,從2013年小團隊啟動自動駕駛研發計算,目前經歷了五個階段:
第一個階段:固定路線的演示(單路)。當時只用一輛車,選一條路,本質上還是做一個demo,但這在2015年已經是當時國內最先進的自動駕駛表現。
第二個階段:固定路線的演示(多路)。車輛數量和車輛品牌增多之后,進行固定路線的測試,這張圖是2016年在烏鎮互聯網大會上,我們用十幾二十輛車,在一條3公里的固定路線接待了300多名的群眾和當地的媒體記者。這個過程我親歷其中,和團隊在烏鎮待了一個多月。
第三個階段:區域大路網測試。這個階段把測試路線擴大到大的路網中,在區域里設置很多站點,點到點之間都能互達進行大路網規模的測試,車的數量也從幾十輛擴大到上百輛。
第四個階段:小規模試運營。技術成熟到一定階段,我們真正讓廣大用戶能從手機APP上打到百度的無人車并體驗點到點自動駕駛,雖然絕大部分時間安全員在過程中不觸碰方向盤和剎車油門,大家最好奇的一點還是既然叫了無人車,為什么車里還要坐個安全員?
第五個階段:商業化試運營。在這個階段百度實現了兩個突破:
一是泛化層面的突破,在12個城市面向公眾完成全開放運營,雖不能說徹底解決了規模化問題,這么多城市的落地還是一個很積極的信號。規模上百度在Robotaxi領域全球領先,無人駕駛服務累積運營訂單數突破100萬,也是全球第一。
二是在安全性層面的突破,實現了真正的無人化,也就是driverless,在部分運營區域把安全員徹底去掉了。在此之前積累的L4自動駕駛測試里程超過3600萬公里。今年8月,在武漢、重慶兩地首先實現了中國的全無人商業化運營。對工程師來說可能沒什么感覺,只是研發進展中的一小步,但這個里程碑是中國自動駕駛歷史上的一大步。
L4的堅持和堅實可靠的技術積累,給了我們進入汽車智能化賽道的信心和底氣。有一個團隊正在依托L4技術降維研發L2+領航輔助駕駛產品,這款百度智駕的旗艦產品包括“三域融通”(高速、泊車、城市路段)的智駕功能。
配置上我們不堆料,是務實的領先。上午華為的王軍先生的演講也提到,堆料換不來好的用戶體驗。硬件選型上比較理性,有雙Orin-x 500T AI算力的計算芯片和百度自研的ACU硬件。傳感器方面,搭配半固態激光雷達,每秒產生300萬點以上的點云,來保障前向安全,前FOV(field of view)能做到180度無遮擋。最后,部分攝像頭是采用8百萬像素的攝像頭,視距可以達到400米。
軟件層面,有兩個技術優勢能賦予產品足夠的差異化競爭力。首先我們的安全基因是從L4繼承來的,L4的技術證明已經能在中國部分區域實現全無人,3600萬公里的道路測試,每一公里都是由持考核資質的測試人員驗證完成,對系統的能力有充分專業的驗證。
第二點,百度屬于非常稀缺的的在汽車智能化供應商中同時做自動駕駛和地圖兩項業務并且都做得非常專業的。導航有國民級的百度地圖,能幫我們在領航輔助駕駛時選擇最優的路線。此外自動駕駛使用的高精地圖,百度在行業內的市場占有率是第一名。每條道路都提前經過專業化的測繪丈量,在中國保證做到“最熟路”。
目前產品百分之百核心功能研發已經完成,進入在北上廣深多地泛化測試階段。大家可能會好奇,復雜城市道路什么概念?北京有一條網紅路叫后廠村路,路況非常復雜,擁堵嚴重,網友開玩笑地說這條路的擁堵直接影響了中國互聯網發展的速度,這條路就是我們每天測試的必經之路之一。我們的產品會在2023年隨著第一個客戶車型的量產推向市場和用戶見面。
剛才講了百度軟硬件層面的進展和布局,今天是技術論壇,作為工程師想分享一下自己在做自動駕駛過程中沉淀的對技術層面的“數據思維”。
思維是動詞,是thinking,是根據不同階段持續變化的。我畫了三個柱狀圖,每個柱狀條的長度不同,長度大家可以抽象地認為反映不同方向上的壓強力度、投入的資源、研發精力、產生相關技術回報,這些都是跟長度正相關的。
階段一:Rule-centric。
大家可以看到,最早的階段在Rules ba
se規則層面的占比是最高的,機器學習的占比很小,數據會更少。還是是我剛才舉的例子,2016年做烏鎮演示時,團隊提前到位忙活了一個月,把一條路適配出來。當時我負責感知方向,全盤的感知幾乎都可以用規則方法來解決,有激光雷達寫傳統的算法可以應對很多情況,哪不行的話就加規則打補丁。
唯一解不了的就是紅綠燈識別,所以當時車上唯一基于機器學習方法做的就是紅綠燈識別,當時有一個機器學習模型在車上,數據也是針對當時的演示路線進行了紅綠燈數據的采集標注,量非常小。烏鎮這種方法做demo沒有問題,只要投入足夠的精力和時間也可以work,但是絕對沒有辦法規模泛化。除此之外能力也非常有限,因為人依靠觀察和經驗假設編寫的code完全無法超越通過大量數據學習得來的能力。
階段二:Model-centric。
對規則方法進行了壓縮,也不是完全沒有rule,有些經典算法的留存還是合理的,但要把大量的任務以機器學習的辦法來取代,這不是自然發生的過程。舉個例子,同樣的問題用激光雷達來實現道路路面,我當時自己寫了自認為還不錯的算法快速上車了,假設地面是平的,把它分成若干個柵格做平面擬合,效果還是不錯的,用了一兩年的時間,沒有出大問題,唯一問題是在坡路的時候平面假設被破壞,會有一些誤檢,導致剎車。
后來推動大家用機器學習的方法去做,去標注道路路面的點云數據,用deep learning取代規則。最后,因為道路檢測遇到的問題幾乎就沒有再出現。這樣的問題還有非常多,大家可以感覺到第一階段從紅綠燈一個任務開始,到今天到多任務,像地面檢測、障礙物分類識別、靜止車輛判斷,90%的任務開始用機器學習的方法來解決,這樣才能更有效地消化數據。過程中大家對數據的需求也大幅提升,大量標注需求開始上來了。
階段三:Data-centric。
如果不給工程師做限制,技術愛好者還是非常愿意關注最流行的前沿技術,樂衷在論文里面挑選最新的網絡結構去實現、調優。過程中投入產出不是非常合理高效,重視模型迭代同時,大家往往忽視了數據能帶來的技術增值。網絡模型調了很多版,但數據的質量和數量可能都沒增加,這是我們比較苦惱的。所以第三個階段是從Model centric到Data-centric的大轉變。
大家的思想要轉成以數據為驅動,網絡結構基本穩固以后不要太高頻的改動,更多地關注數據。當前模型在道路上應對不了的情景,要把數據高純度地提純挖回來,加入到訓練數據里。這時候團隊的注意力從模型轉移到對數據的研究。
這么做的收益我也可以舉個例子,剛才提到去烏鎮的時候花了一個多月,幾十號人在那兒吃住,一個多月為了把一條路調通;后期多地城市落地,要有數個工程師到本地調試支持;隨著learning化的占比提升,對數據的關注提升,數據挖掘體系的完善。現在再去落地一個城市,工程師是根本無感的,把車運過去,把地圖生產出來,沒有自動駕駛背景的運維人員就可以把車調通,到了新城市很快車可以順利跑起來。這點是我們比較驕傲的,是數據驅動帶來的核心價值體現。
講接下來這頁之前,先說一下智能生物和非智能生物的區別,比如說植物是非智能生物,和動物的區別是什么?我認為有兩點:一是智能生物可以自己移動,可以行動,可以避障,這個能力植物是沒有的。二是適應環境的能力,智能生物在見過、經歷過之后,認知上能夠成長,這兩點能力是我們對以后第三階段智能電動汽車的要求。
我們認為,軟/硬件是智能汽車的軀體,提供的是“自移動”的能力。那什么是靈魂?數據是靈魂,數據是系統成長演進的燃料。軀體會趨于標準化,由好的AI背景團隊、專業的智駕供應商來提供所謂“交鑰匙”(turn-key solution)方案”。因為這里面有大量前期投入、巨大的代碼量,背后有上千人團隊多年的累積,不是每個廠商都能從頭開始做就能在短時間復制出來的,做也不經濟,但這部分軟件的實現也會隨著時間逐漸趨于標準化(各家的實現趨同,差異化減少)。
數據驅動的差異化是由智駕供應商向車企提供數據增值供應鏈和配套的服務來達成的。這里對比一下可以看到,軀體是非常復雜的軟硬一體系統,軟件復雜的架構,海量的代碼,極高的性能要求,算法有大量的專家經驗,復雜的AI模型,硬件要高可靠性,要有冗余,最后高難度的大規模復雜系統集成,都需要極高的專業度和大團隊長期的積累。
但是想實現右邊這頁“數據掌控靈魂”其實是很輕的,利用SaaS云服務工作臺可以做到,MLOps是要遵循機器學習工程文化和流程機制,把一套研發流程機制嵌入到平臺里,在訓練出AI模型質量和穩定性都能得到保障。
數據挖掘,要把數據trigger點預埋,精準想挖什么就挖什么,車云交互可以讓車企動態管理,你對什么數據感興趣,你就把它打開,數據會在遇到困難case的時候傳回來
模型訓練、評測,流水線模型生產和測試的一體化,對我們使用的模型非常清楚,對模型的弱點也非常清楚,對需要的數據非常清晰之后,這件事情是完全可以做到的。評測包括了模型的評測,硬件性能的評測,甚至還有仿真端到端的評測,保證每次發版都信心滿滿。最后云原生:彈性計算、服務安全可靠。當然,這一切都是在數據合法合規前提下完成的。
說到技術,放了一張自動駕駛“數據閉環”,也就是把數據轉化為駕駛能力的技術棧架構,圖看起來比較復雜,點也特別多,確實是慢工出細活的工作。經過數年迭代,目前已經把這里面幾乎所有細的子模塊全都實現完成。從最初的傳感器數據輸入,到動態數據上傳、結構化數據管理存儲、高價值數據挖掘、數據標注變成有效模型可用的數據資產,到機器學習的模型迭代、評測,最后整個模型持續集成、持續部署到車端這一閉環鏈路都實現了,L4在這套模型迭代獲得了泛化上的成功,也證明了這套技術方案的有效性。
大家看架構可能覺得太技術了,這是內部自動駕駛工程師每天使用的一套工具鏈,我們希望把這套能力賦能給合作伙伴,賦能給客戶,這時候需要好的產品化、好的用戶體驗才能做到讓車企可以基于數據做差異化的創新。
基于“駕云一體”的理念,百度結合在AI、云計算、自動駕駛的深厚積累,已經著手為客戶量身打造了一款創新的SaaS產品,內部簡單叫Apollo智駕云,一同助力車企在量產車規模級別上通過對數據從挖掘、標注、訓練、仿真的全生命周期管理,實現數據驅動的智駕能力進化,進而讓終端消費者獲得更好的智駕體驗。
一是車云實時通訊和大規模車隊云端管理,車企通過智駕云能在量產車的模型上對補充模型AI能力所需要的數據片段,進行精準、高效、動態、低成本的挖掘,實現高純度、高價值數據資產的快速積累。不是泛泛的數據量的回收,而是有的放矢,針對當下模型缺陷的挖掘和回收。
二是結合業界領先的MLOps理念,以AutoML、云原生、AI為技術主干,將復雜多樣的模型訓練步驟進行標準化封裝,車企可通過智駕云高度自動化地針對自己車型的AI模型訓練迭代AI模型,整個過程更標準,產出模型更穩定,可實現模型周級別迭代,高憂問題甚至支持數天內完成。
三是產品以SaaS的形式提供服務,即開即用,為用戶帶來互聯網產品級的體驗和一站式完成數據管理、模型迭代等發版操作,減少跨平臺低效操作,提高組織運轉效率。
“工欲善其事,必先利其器”車端精準的數據挖掘、云端高效的數據流轉,SaaS平臺優秀極簡的用戶體驗,是百度智駕云為車企客戶精心準備的“三把利器”,搭載了MP智駕軟硬件的客戶,內部研發團隊可以通過智駕云快速獲取數據驅動智駕成長能力,在量產大數據時代下占領先機,掌握對體驗差異化的把控。
很多車企覺得我們不缺數據,存了很多數據,百度也有這樣的經歷,我們存了很多數據,但是數據沒有有效地用起來。就好像你有很多現金,沒有選擇投資而是把現金放在家里,錢是貶值的,并且占用大量的空間。無疑應該讓數據流轉起來,讓它有效的做增值,增值不一定是現金,也有可能是用戶體驗的提升,產品功能的增加,這些都是變相對用戶的價值創造在增值。百度希望通過這樣的平臺為客戶管理好數據,做好數據的增值服務,這是我們的初衷。
對我今天匯報中的核心觀點進行總結:
第一,2025年汽車智能化實現“跨溝”,屆時“高階”,特別是城市領航輔助駕駛、自動駕駛能力將成為用戶購車頭部考慮因素之一,產品研發窗口期短暫,如果這兩年拿不出有競爭力的產品,很有可能2025年階段會有落后的風險。
第二,自動駕駛產品需長期、巨大的前期投入,跟傳統tier1不同的是車輛交付后也要持續演進,特別是數據驅動迭代演進,車企需要找到能按時推向市場,高品質且持續穩定更新的解決方案。
第三,軟/硬件是自動駕駛的“軀體”,解決車輛可移動問題;數據是推動智能汽車演進的燃料,數據是決定差異化的“靈魂”,解決智能汽車成長演進的問題。
第四,希望和廣大同行一起探索探討新的模式,百度為客戶提供“軟硬一體”的解決方案,同時把“數據增值”,解決數據到能力轉化這一圈套的工具鏈和背后的服務賦能給客戶,讓車企自己掌握數據,車企把控靈魂。
再次感謝大會的邀請,百度Apollo愿與更多車企合作伙伴合作共贏,謝謝大家!
(注:本文根據現場速記整理,未經演講嘉賓審閱)