猫咪社区免费资源在线观看_色屁屁草草影院ccyycom_免费的av不用播放器的_国产精品久久成人网站_中文字幕与邻居少妇性刺激_婷婷丁香久久

首頁 > 購物 > 正文

他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023 天天新動態(tài)

2023-03-24 14:02:09來源:36kr

首個基于Transformer的駕駛行為描述架構(gòu)

還在玩ChatGPT?已經(jīng)有自動駕駛算法能告訴你“我在干嘛”。


(資料圖片僅供參考)

基于視覺和神經(jīng)網(wǎng)絡(luò)的自動駕駛算法,雖然能通過傳感器數(shù)據(jù),以及學(xué)習(xí)人類的駕駛行為,自主決策并控制車輛。

但是,算法基于什么做出的決策?特別是出現(xiàn)故障,也就是決策錯誤的時候,算法是怎么想的?這些一直被稱為自動駕駛算法里的“黑匣子”,讓算法缺乏透明度可解釋性

不過,現(xiàn)在有這么一個模型,既能預(yù)測車輛控制行為,還能自己解釋“我停車是因為紅燈亮了,并且有行人在過馬路”。

模型論文入選ICRA 2023,相關(guān)模型已開源。

那么,是一個什么樣的算法?

ADAPT:駕駛行為感知說明大模型

這是一種叫ADAPT(Action-aware Driving Caption Transformer)的端到端算法,也是目前第一個基于Transformer的駕駛行為描述框架,可以感知和預(yù)測駕駛行為,并且輸出自然語言敘述和推理。

直白一點說,輸入車輛視頻后,這個算法可以判斷車輛行為并告訴你:車在做什么,為什么要這么做。

在論文作者提供的測試視頻里,這個算法最終上車的效果是這樣的。(紅色字是車輛行為,藍色字是解釋)

“車在向前開。因為路上沒有車。”

駕駛行為變化后,算法也能及時感知:

“車靠左邊停下了。因為要停車。”

“車開始移動并且靠右行駛。因為路左邊停著車。”

算法不僅能識別路口,也能識別騎著車的人。

“車在十字路口停下了。因為要避開街上騎著自行車的人,”

這是怎么實現(xiàn)的?

多任務(wù)框架下的聯(lián)合訓(xùn)練

ADAPT框架可以分為兩個部分:車輛行為描述(DCG,Driving Caption Generation)和車輛控制信號預(yù)測(CSP,Control Signal Prediction)。

首先,傳感器端輸入視頻,Video Swin Transformer對車輛視頻進行編碼,得到的視頻特征會輸入進各任務(wù)模塊里。

在DCG模塊,算法利用Vision-Language Transformer生成兩個自然語句,也就是上文中提到的車輛行為描述原因解釋

相同的視頻特征也會輸入進CSP模塊(類似一般基于視覺的自動駕駛系統(tǒng)),輸出車輛實際的控制信號序列,并利用Motion Transformer輸出模型預(yù)測的控制信號,比如速度、方向和加速度。

在單個網(wǎng)絡(luò)中,作者利用車輛實際的控制信號序列和模型預(yù)測的控制信號序列,兩者的均方誤差作為CSP模塊的損失函數(shù)。

而在多任務(wù)框架下,通過聯(lián)合訓(xùn)練DCG和CSP,可以減少車輛決策和文本描述之間的差異,提高控制信號預(yù)測的準確率。

論文里,作者們在包含控制信號和車輛視頻的大規(guī)模數(shù)據(jù)集BDD-X上,利用機器評測和人工評測驗證了ADAPT的有效性。

機器評測方面,使用的是BLEU4、METEOR、ROUGE-L和CIDEr(對應(yīng)縮寫分別為B4、M、R、C)等多種語言任務(wù)常用的指標。

最終顯示ADAPT達到了當前最優(yōu)(State-of-the-Art)的結(jié)果,ADAPT在動作描述方面比原有先進方法CIDEr高出31.7,在原因解釋方面高33.1。

人工評測分為動作描述、原因解釋和全句三個部分。通過人工判斷,ADAPT在這三部分的準確性分別達到了90%,90.3%和82.7%,證明了ADAPT的有效性。

在可視化結(jié)果里,也能看出ADAPT可以準確識別車輛行為以及決策原因。并且在黑夜、陰雨天等場景下,ADAPT也能保證準確度;即使有雨刷器干擾,ADAPT也可以識別道路上的停止標識。

為什么需要ADAPT?

自動駕駛行為的可解釋性

在基于視覺的自動駕駛算法里,比較常見的解釋圖有視覺注意圖(Attention Map),或者成本量圖(Cost Volume),但不熟悉自動駕駛算法的人容易對這些圖造成誤解。

上:視覺注意圖;下:成本量圖

因此,ADAPT這種能夠生成自然語言、“說人話”的算法,能夠幫助用戶更好地理解自動駕駛算法在做什么、為什么要這么做,同時還能讓用戶更信任自動駕駛技術(shù)。

而對于算法工程師和研究人員來說,當發(fā)生極端情況時、或者發(fā)生故障(比如判斷錯誤)時,ADAPT可以幫助他們獲得更多信息,進而改進算法。

作者們將進一步研究如何在模擬器和實際車輛上如何部署ADAPT,以及如何利用文本轉(zhuǎn)語音技術(shù),讓生成的句子轉(zhuǎn)化為語音,幫助普通乘客,特別是視力障礙乘客使用。

本文作者來自中國科學(xué)院自動化研究所、清華大學(xué)人工智能產(chǎn)業(yè)研究院(AIR)、北京大學(xué)、英特爾中國研究院、西安電子科技大學(xué)、南方科技大學(xué)和北京航空航天大學(xué)。

論文一作晉步和三作鄭宇鵬是來自中國科學(xué)院自動化研究所的研究生,晉步主要研究方向為多模態(tài)學(xué)習(xí)、視覺語言模型等。

通訊作者為劉新宇,清華大學(xué)自動化系學(xué)士和碩士,長期從事軟件研發(fā)工作,著有《算法新解》。

作者之一李鵬飛是AIR在讀博士生,本科畢業(yè)于中國科學(xué)院大學(xué),主要研究智慧交通、機器人、計算機視覺等方向。

另一位作者趙昊是AIR助理教授,本博畢業(yè)于清華大學(xué)電子工程系,曾任英特爾中國研究院研究員和北京大學(xué)聯(lián)合博士后,研究方向為幾何與認知層面的場景理解及其在機器人中的應(yīng)用。

另外,本文的模型已經(jīng)開源,感興趣的可以去試試看~

論文地址

https://arxiv.org/abs/2302.00673

代碼地址

https://github.com/jxbbb/ADAPT

關(guān)鍵詞:

責(zé)任編輯:hnmd004

主站蜘蛛池模板: 亚洲伦理中文字幕 | 九九热免费精品 | 别揉我奶头嗯视频 | 一机毛片 | 粗大的内捧猛烈进出在线视频 | 国产精品美女久久久久图片 | 精品久久久噜噜噜久久 | 人妻中文av无码。久久 | 欧美a级成人淫片免费看 | 人妻无码中文久久久久专区 | 中文字幕亚洲天堂网 | 亚洲高清视频在线 | 131MM少妇做爰视频 | 欧区一欧区二欧区三免费 | 九九在线播放 | 日韩一区二区三区无码免费视频 | 亚洲午夜一区二区三区 | 国产1级视频 | 中文字幕一区二区三区久久 | 精品久久久久久久久久久久久久久 | av免费在线看网站 | 亚洲第一免费 | 潘金莲一级淫片aaa 一区不卡av | 97精品97| 偷拍中年夫妇激情嗷嗷叫 | 欧美黑人巨大精品一区二区 | 最新黄色av网站 | 日本av网站 | 成人av中文解说水果派在线观看 | 亚洲欧美综合精品成人网站 | 男人猛操女人 | 超碰在线人 | 四虎成人精品国产永久免费无码 | 色女人天堂 | 国精产品999永久中国有限 | 国产午夜精品一区二区三区四区 | 亚洲中文久久精品无码浏不卡 | 亚洲精品在线视频免费观看 | 美女午夜福利4K视频在线观看 | 干美少妇视频 | 久久激情五月 |