竞彩足球混合投注500网最新消息/足球胜负彩500足彩网天气预报/西班牙黄金一代/湖人几个总冠军

歡迎光臨車網世界!

微信 | 微博 車網中國公眾號二維碼

當前位置:首頁 > 車頭條 > 汽車新聞 > 返回

張宏志:“智”空間,“芯”體驗

發布日期:2021-06-22 11:20   瀏覽次數:3016

車網中國報道
2021年6月17日-19日,由中國汽車工業協會主辦的第11屆中國汽車論壇在上海嘉定舉辦。站在新五年起點上,本屆論壇以“新起點 新戰略 新格局——推動汽車產業高質量發展”為主題,設置“1場閉門峰會+1個大會論壇+2個中外論壇+12個主題論壇”,全面集聚政府主管領導、全球汽車企業領袖、汽車行業精英,共商汽車強國大計,落實國家提出的“碳達峰、碳中和”戰略目標要求,助力構建“雙循環”新發展格局。其中,在6月19日上午舉辦的主題論壇“智能座艙創新技術論壇”上,地平線副總裁、車載智能交互產品總經理張宏志發表了主題演講。以下內容為現場演講實錄:
今天前面韓老師、華為的鄧老師都講了,分兩個階段看,永遠都會把事情分成功能、智能,比如說手機,機器人也是一樣的。

智能化能把服務以主動化的方式推送給到人,這是和以前的機器產生截然不一樣的。以前的機器是一種功能的堆砌,是由人所設計出來的是固定功能的事情。所有的能力、所有的服務全部是由你來發起的,人要他做什么。

但是接下來的時候很大的區別和改變點,不管是深度學習還是寬度學習,機器會產生自主意識。因為機器給你所有內容、所有服務是基于它的理解,但是決策依然是在你這里。

像加拿大人恐懼的文化,在于當人失去了決策權力和決策能力以后,機器所做的很多決策對人所產生的影響將更加深遠。

做人機交互設計時、智能座艙設計時,地平線的觀點是應該錨著最后的點設計,錨著“第三生活空間”來設計,而不是在于把車的功能堆砌和完善出來。

目前來講有兩點:

第一,當前到底處于哪個時代?為什么不能說現在是智能化空間,不能讓我成為智能化的合作體、協作體的原因。

地平線認為主要是技術限制了這件事情。有三點原因:

(1)比較大的計算力芯片。

(2)需要非常多非常成熟的相關算法。

(3)產生的數據、需要的數據、處理的數據超越于移動互聯網。

可能需要更多GPU訓練,更多數據存儲,更多機房,更大的帶寬。在這幾個因素上都會產生限制。

現在大家更多提到的是多模交互,不管是多模感知,通過異構數據放在一起感知它,還是通過人與人的交互方式和機器交互?現在全部都集中在多模交互的階段,最大的特征和特質在于所有提供給你的功能和服務,都是被設計師、產品經理提前預設好的。能夠給你的差異性感覺是TDS的預期,可能是策略的排序優先級高低權重的差別點,難以做到伴隨著數據的不斷輸入、群體性數據的輸入而產生一定推理作用。

人類現在的所有產品設計、交互設計習慣于設計功能,這是這么多年的教育經驗,沒有足夠強的站在上帝視角的設計機器人。本質角度更傾向于把自己作為“上帝”,創造新的生命體、歸集的生命體,最大的特質是讓歸集的生命體自己學習自己晉華。

過去這幾年和汽車行業不斷合作,向車企、客戶提供座艙解決方案時發現幾點:

(1)最容易被用戶和客戶所接受的是在于把車上的功能變得智能,比如說空調、座椅、氛圍燈智能,車身功能接口以及和環境做匹配關系,把不智能的設備、功能變得智能。這點最受用戶的歡迎和喜歡,因為是最淺層次的滿足點。

像今天在這個時候這個季節,上車很難不開空調,必然按空調。但空調主動地按下去換成機器智能化地按下去你會很滿意,你對24度26度的敏感度沒有那么高。但大冬天開不開窗戶很敏感,抽煙的時候必然要開窗戶,智能化水平反而要求更高。

(2)人和機器很大的問題是關系問題,誰做主、誰決策、誰推薦的關系問題。這時候很長一段時間人和機器共同在駕駛那款車,而那時候會影響安全。雙方如何交互共同做決策變成了關鍵問題,更大程度上要通過人和機器的交互過程變得更安全,否則就沒有交互,完全是機器自己去開,是在用L4、L5的要求在要求現有車上的智能化功能。

(3)座艙能把精神通過主動感知和連接服務,連接到網絡世界中去,而智能化的最大價值在于現在處于網絡連接的世界,可以通過手機把自己連接到網絡,智能化的價值在于提高連接效率。

看一下地平線對技術性的理解,機器的核心價值在于主動化服務,現在所有的開發是基于給數據用神經網絡結構的方法學習規律,而規律本身被學習出來后是機器可以主動服務人的基礎。從2020年開始,人機交互趨勢會發生非常變革性的改變,在于要往情感化方向、更加簡單,并且以推理為中心所產生的交互方式。

不管是地平線交互的長安的UNI-T、UNI-K,還是廣汽的AION Y,感知能力都在增強,車的感知遠遠超越手機,車本身所提供的感知接口豐富度是所有智能化設備中很強的。海外不管是奔馳還是寶馬,全部是沖著這個方向在走。

對地平線來講,地平線的觀點是不應該再重復地把手機APP功能做更多詳細化的設計和改版,讓它適應于車上的屏幕。而在于要重構用的功能、內容和服務,把它全部重新連接到新的網絡中去,而新的網絡很大的特征是要具備推理能力。

肯定是突破性的創新,不會是漸進式的,核心整個行業應該做的事情是建立起智能大腦,讓機器學習人的習慣,取得更快的進步。

列一下關系圖,核心來講在于大腦能夠把推理這件事情做的更好,推理很大的特征是可以把人的時間釋放出來,讓人可以從事更有價值的事情。更多交互是以機器發起的這一輪進行交互,并不是由人進行交互。不管人的眼神交互、手勢交互、語音交互,很大的價值在于進行第二輪決策和確認,以及對機器所做推薦的修正。

在未來好的人機交互是什么樣的?應該是趨近于零的。行業的評估方法是機車和用戶交互了多少次,大家一直把次數變得非常多來變成評判標準,這件事情被寫上了研發、產品、設計師的KPI要求里,領導用這個東西來卡獎金、卡考核。

但越來越智能體數字應該趨向于零,現在坐在車上,車的空調自動被打開了,你才不愿意和車做交互,因為你沒必要調空調。但是站在考核的角度來講,必然是“先生我把空調給你打開了,請問25度合適于您嗎?”這種感覺無非是你去飯店吃飯,今天點什么菜?辣的不辣的?有沒有忌口,喝不喝啤酒,喝冰的喝涼的?喝什么?你花了20分鐘和服務員掰扯完之后會發現算了,我去隔壁那家,很簡單,把你們主要的菜給我推薦幾個,我吃好就好了。

人不太愿意和機器過多產生交互,畢竟人和機器人是兩個物種的事情,機器還是屬于低級的物種,我們不愿意和螻蟻的事情產生過多的連接和情感交互,因為它是更強的輔助。

從可實現性的角度來講歸納成為智能化三要素,所有用戶最關心的是車載AI場景應用,但場景應用需要算法,需要開發工具,需要底層計算架構的支持,需要底層芯片的算力支撐。這個系統解決的時候可以總結成三點:

(1)需要不斷增長的算力,計算資源永遠是不夠的,如同電力系統、石油系統一樣。

(2)算法。算力永遠是不夠的,所以算法、軟件必然要跟硬件比較深度的結合設計,滿足高效率問題。

(3)數據。伴隨著智能化時代的來臨,所需要的數據將會是非常大量的,但果人類花自己的時間不斷處理數據,這就變成大家現在聽的高效的話,人有多人工,它就有多智能。這是悖論的事情,根本角度是機器自己處理數據,自動化訓練算法,這是解決問題的根本。

提的目標是每年對數據處理的成本以50%的成本往下降,這樣才能滿足爆發性數據對智能化系統的相關要求,如果數據處理不過來的話,智能化系統進化速度就會慢。

發展趨勢的判斷,所有的智能化以接入傳感器為核心,需要接入麥克風、攝像頭、激光雷達等傳感器設備,傳感器所輸出的數據在不斷增強。

比如說2023年座艙類攝像頭將從DMS的角度進入500萬,從OMS的角度進入800萬,而麥克風數量至少是4麥克以上的。

這么多傳感器和傳感器像素數的增長,并且伴隨著算法的增長。統計了一下,行業內在手機上以及客戶的需求,赫然發現對座艙深度學習算法的需求在端側將達到150個,通過簡單的計算可以得到一點,座艙所需要的AI計算算法將會在上百T。

地平線核心觀點認為要先解決算力問題,解決“地”足夠豐富、足夠厚實才能種出莊稼。大算力計算芯片能把生產力解決掉、釋放出來。

就算有了很好的算力,需要足夠好的開發工具,開發工具最大的特征是能夠數據半標注、全自動標注、算法自動化訓練和測試。這樣這樣的情況系統的進化速度才是足夠快的。

地平線的想法在于把開發工具和社區開發平臺做開放,滿足大家在芯片上盡快把我們認知到的150多個算法開發出來,盡快迭代,看一下人機交互系統到底能進入什么樣的智能化水平,再次進入下一輪迭代修正它。

基于芯片和算法提供全車智能化感知給到上層應用部分,上層應用部分能拿到環境數據進行推理,并進行多輪對話的節奏。

這是接下來發展的Roadmap,端側算法數量在爆發式增長,2022年將會有上百個端側算法跑在車載上。到2023年將達到150多個算法,而2023年和L3級別相配合的車將會給用去營造出來“第三空間”,那時候有些時間已經被釋放出來了,那部分釋放的時間只要有足夠智能化的座艙,把那部分的時間發揮足夠的價值,人的交互就會體現出空間。

謝謝各位! 

上一篇:張晴晴:對話式AI數據推動智能座艙語音交互發展

下一篇:由芳:基于認知的智能座艙的設計和評估

熱門文章

關于我們 聯系方式 招賢納士 隱私政策 車網歷程

Copyright?2004-2030 車網世界版權所有 京ICP證040347號-1 技術支持:想象力

?