相關主題
商品描述
本書圍繞純視覺自動駕駛技術的前沿發展,逐層深入,探討技術背景、應用細節及未來趨勢。具體而言,書中首先介紹了高精地圖與無圖模式的概念、演變過程以及它們在自動駕駛中的核心應用。隨後,書中詳細講解了視覺傳感器的選型與校準、目標檢測與跟蹤技術、全景建模與環境理解的基本原理。在此基礎上,本書沿著自動駕駛技術的開發路線,重點闡述了數據采集與管理、算法模型訓練、感知軟件開發、場景開發及測試流程的優化。書中還圍繞行為理解與世界模型的構建、自動化矢量地圖的構建方法,以及環境重建的基本方法展開,強調這些技術在實際應用中的重要性和相互關聯性。此外,書中提供了相關工具和實際案例介紹,幫助讀者將理論知識轉化為實踐能力。 ,書中展望了純視覺自動駕駛技術的未來發展趨勢,探討當前技術面臨的挑戰以及需要解決的問題。本書適合對自動駕駛技術及相關領域感興趣的讀者,無論是開發者、研究人員、設計師,還是剛剛入門的學生均能從書中獲益。同時,對於具備相關知識背景的行業從業者,本書也提供了深入學習和實踐的有力支持。
作者簡介
錢燁強,上海交通大學電信學院自動化系長聘教軌副教授、博士生導師。圍繞智能車感知與導航技術近5年發表學術論文30余篇,IEEE Trans系列長文10余篇。獲得SAA 博士學位論文,全國博士後創新創業大賽銀獎、上海市技術發明一等獎(參與人)等多個獎項。主持國自然科學基金面上項目、 自然科學基金青年項目、中國博士後基金面上項目、上海市 博士後激勵資助計劃等多個項目。擔任中國指揮與控制學會智能指揮與控制系統工程專委會常務委員,擔任IEEE IROS 2024和2023的編委和上海交通大學學報英文版的客座編輯。
目錄大綱
前 言
第 1 章 從高精地圖到無圖模式的自動駕駛技術演變
1.1 地圖的魔力:自動駕駛的起點 / 001
1.1.1 昔日輝煌:自動駕駛的有圖時代 / 001
1.1.2 雙刃劍的舞動:高精地圖的弊端 / 005
1.2 從依賴到獨立:無圖模式的挑戰 / 011
1.2.1 背景驅動:從地圖依賴到無圖探索 / 012
1.2.2 核心支撐:實現無圖的關鍵技術 / 014
1.2.3 產業觀察:無圖方案的發展現況 / 016
1.2.4 隱憂與瓶頸:落地過程中的主要挑戰 / 019
1.2.5 新機與潛能:無圖方案的應用前景 / 021
第 2 章 洞悉自動駕駛之眼:攝影機的妙用與精調
2.1 視覺感測器的種類與原理 / 025
2.1.1 單目攝影機:最基礎的視覺感知 / 025
2.1.2 雙目與多目攝影機:立體視覺的實現 / 027
2.1.3 全景攝影機:360° 無死角的視界 / 030
2.2 視覺感測器的安裝與配置 / 032
2.2.1 合理的感測器配置策略 / 032
2.2.2 感測器視角的最佳化與覆蓋 / 035
2.3 視覺感測器的校準技術 / 037
2.3.1 外參校準:確定感測器的相對位置 / 037
2.3.2 內參校準:提升攝影機的感知精度 / 040
2.4 讓攝影機看得更清楚:資料最佳化的祕密 / 042
2.4.1 去除「雜訊」的影像清理技術 / 042
2.4.2 多隻「眼睛」的協作:視角合成與融合 / 045
2.4.3 鳥瞰圖:為車輛裝上「上帝視角」 / 046
2.5 未來的攝影機:更聰明、更強大 / 049
2.5.1 解析度越高越好嗎? / 049
2.5.2 「自我學習」的攝影機 / 051
2.5.3 AI 賦能的「超級視角」 / 054
第 3 章 目標偵測與目標追蹤
3.1 感知任務中的基礎與關鍵角色 / 056
3.1.1 核心功能:從視覺輸入到目標與軌跡的建立 / 057
3.1.2 價值與意義:安全駕駛的基石與魯棒性的保障 / 059
3.2 目標偵測:理解道路與交通參與者 / 061
3.2.1 道路與規則要素:車道線、路緣、交通標誌與號誌燈 / 062
3.2.2 交通參與者:車輛、行人、騎行者 / 067
3.2.3 異常與低頻目標:施工設施、掉落物、動物等 / 070
3.3 目標追蹤:穩定的時間序列感知 / 071
3.3.1 從偵測到軌跡:多目標追蹤與軌跡生成 / 072
3.3.2 穩定性挑戰:遮擋恢復、身分一致性與軌跡管理 / 074
3.3.3 即時性挑戰:視覺目標追蹤的效率與算力最佳化 / 077
3.4 方法進展與融合方向 / 079
3.4.1 模型演進:大模型驅動的感知範式 / 079
3.4.2 感知與規劃的銜接:端到端與一體化趨勢 / 082
第 4 章 全景建模與環境理解
4.1 佔用網路:開啟環境理解的新視野 / 086
4.1.1 從二維視角到全域感知 / 086
4.1.2 感知賦能:佔用網路在智慧感知中的角色 / 090
4.2 資料生成:建構智慧的「基礎原料」 / 093
4.2.1 資料蒐集:真值建構的核心素材 / 093
4.2.2 資料生成流程揭密:資料的「煉金術」 / 098
4.2.3 精度指標:如何衡量模型效能? / 105
4.3 模型演化:智慧理解的「多樣化路徑」 / 107
4.3.1 佔用網路模型:三維特徵表達的多樣性 / 107
4.3.2 輕量化與稀疏化方案:高效推論的關鍵 / 110
4.3.3 自監督學習方案:模型自主學習的探索之旅 / 115
第 5 章 行為理解與預測:自動駕駛的演繹推理
5.1 像人類駕駛人一樣思考 / 119
5.1.1 人類駕駛人的核心能力 / 120
5.1.2 自動駕駛如何具備推理能力 / 122
5.2 理解交通參與者:行為預測 / 124
5.2.1 感知與規劃的橋樑:預測演算法 / 126
5.2.2 從歷史中學習:時空資訊建模 / 128
5.2.3 行為預測的前景與挑戰 / 131
5.3 場景理解 / 131
5.3.1 從感知到理解:場景解析的背景 / 132
5.3.2 方法與路徑:現有場景理解技術 / 134
5.3.3 邁向未來:場景理解的機會與挑戰 / 139
5.4 推演未來:世界模型 / 140
5.4.1 自動駕駛中的世界模型 / 140
5.4.2 生成式 AI:如何創造未來世界 / 142
5.4.3 自動駕駛中的世界模型(進階) / 145
第 6 章 自動化向量地圖建構
6.1 駛向無圖時代:感知向量構圖的崛起 / 147
6.1.1 感知優先:無圖時代的重要性 / 148
6.1.2 賦能應用:無圖感知的實務場景 / 151
6.1.3 技術沈澱:傳統高精地圖的發展 / 155
6.1.4 輕量化演進:區域高精向量地圖 / 157
6.2 技術引擎:主流向量建構框架解析 / 159
6.2.1 端到端理念:向量構圖網路概述 / 159
6.2.2 核心方案:主流端到端框架剖析 / 161
6.2.3 多元探索:其他向量建構方法 / 164
6.3 如何為區域向量構圖網路評分 / 166
6.3.1 資料基礎:常用資料集 / 166
6.3.2 評測體系:核心評估指標 / 169
6.3.3 對比分析:常見基準表現 / 171
6.3.4 細部評測:含中心線基準的表現 / 173
6.4 未來探索:挑戰與機會的交會點 / 175
6.4.1 難題解析:區域向量地圖建構的挑戰 / 175
6.4.2 未來之光:區域向量構圖的發展機遇 / 177
第 7 章 駕駛模擬與模型重建渲染
7.1 駕駛模擬:從虛擬走向現實 / 179
7.1.1 機器人與模擬:源於虛擬的技術萌芽 / 180
7.1.2 自動駕駛模擬器:幕後英雄的功能與設計 / 182
7.1.3 Sim2Real:虛擬駕駛如何加速真實落地 / 185
7.2 三維重建:為自動駕駛「重現」世界 / 188
7.2.1 傳統建模:人工數位場景重建 / 188
7.2.2 自動化三維重建:理解三維世界的演算法 / 190
7.2.3 智慧重建:基於深度學習的環境建構 / 195
7.3 新視角合成與渲染:賦予駕駛場景新生命 / 199
7.3.1 NeRF 與 3DGS:重塑視野的雙利器 / 199
7.3.2 未來展望:重建渲染的無限可能 / 205
第 8 章 當前挑戰與未來展望
8.1 自動駕駛的「路障」:問題與挑戰 / 207
8.1.1 簡單與複雜:純視覺技術無法涵蓋的情境 / 207
8.1.2 有限與無限:訓練資料不足與硬體成本問題 / 210
8.1.3 衝突與統一:制度與政策差異帶來的挑戰 / 212
8.2 自動駕駛的「突破之道」:解決方案與協作策略 / 212
8.2.1 軟硬體突破:提升視覺系統的適應性與準確度 / 213
8.2.2 資料支援與成本控制:擴充訓練資料並降低系統成本 / 215
8.2.3 協調與引導:推動制度與政策的規範化 / 217
8.3 未來自動駕駛的「藍圖」:願景與創新發展 / 218
參考文獻
