概率機器人 (Probabilistic robotics) 概率机器人

塞巴斯蒂安·特龍

買這商品的人也買了...

商品描述

《概率機器人》對概率機器人學這一新興領域進行了全面的介紹。概率機器人學依賴統計技術表示信息和進行決策,以容納當今大多數機器人應用中必然存在的不確定性,是機器人學的一個分支。它依賴統計技術表示信息和制定決策。這樣做,可以接納在當今大多數機器人應用中引起的不確定性。本書主要專註於算法,對於每種算法,均提供了四項內容:①偽碼示例;②完整的數學推導;③實驗結果;④算法優缺點的詳細討論。
《概率機器人》包括了基礎知識、定位、地圖構建、規劃與控制四大部分。本書共17章,每章的後都提供了練習題和動手實踐的項目。相信本書可以加深讀者對概率機器人學的認識。

作者簡介

作者:(美)塞巴斯蒂安·特龍作者:(德)沃爾弗拉姆·比加爾作者:(美)迪特爾·福克斯譯者:曹紅玉譯者:譚志譯者:史曉霞
塞巴斯蒂安·特龍,Sebastian Thrun博士,計算機科學家,曾任美國谷歌公司副總裁,是美國谷歌公司X實驗室創始人,從事谷歌無人駕駛汽車和谷歌眼鏡的研發。他把統計學引入機器人學,開拓了概率機器人學領域,從此概率技術成為機器人學的主流技術並在無數商業領域得到廣泛應用。沃爾弗拉姆·比加爾,Wolfram Burqard博士,德國弗萊堡大學計算機科學系全職教授,自主智能係統實驗室主任,入選歐洲協調委員會人工智能學會會士和美國人工智能學會會士,是戈特弗里德·威廉·萊布尼茨研究獎獲得者,研究領域為人工智能和移動機器人。迪特爾·福克斯,Dieter Fox博士,美國華盛頓大學計算機科學與工程系教授,機器人學和狀態估計實驗室主任,入選IEEE會士和美國人工智能學會會士,曾任美國英特爾研究實驗室主任,主要研究人工智能、機器人學和概率狀態估計。

目錄大綱

譯者序
原書前言
致謝
第Ⅰ部分基礎知識

第1章緒論1 

1.1機器人學中的不確定性1 
1.2概率機器人學2 
1.3啟示6 
1.4本書導航7 
1.5概率機器人課程教學7 
1.6文獻綜述8 

第2章遞歸狀態估計10 

2.1引言10 
2.2概率的基本概念10 
2.3機器人環境交互14 
2.3.1狀態15 
2.3.2環境交互16 
2.3.3概率生成法則18 
2.3.4置信分佈19 
2.4貝葉斯濾波20 
2.4.1貝葉斯濾波算法20 
2.4.2實例21 
2.4.3貝葉斯濾波的數學推導23 
2.4.4馬爾可夫假設25 
2.5表示法和計算25 
2.6小結26 
2.7文獻綜述26 
2.8習題27 

第3章高斯濾波29 

3.1引言29 
3.2卡爾曼濾波30 
3.2.1線性高斯系統30 
3.2.2卡爾曼濾波算法31 
3.2.3例證32 
3.2.4卡爾曼濾波的數學推導33 
3.3擴展卡爾曼濾波40 
3.3.1為什麼要線性化40 
3.3.2通過泰勒展開的線性化42 
3.3.3擴展卡爾曼濾波算法44 
3.3.4擴展卡爾曼濾波的數學推導44 
3.3.5實際考慮46 
3.4無跡卡爾曼濾波49 
3.4.1 通過無跡變換實現線性化49 
3.4.2無跡卡爾曼濾波算法50 
3.5信息濾波54 
3.5.1正則參數54 
3.5.2信息濾波算法55 
3.5.3信息濾波的數學推導56 
3.5.4擴展信息濾波算法57 
3.5.5擴展信息濾波的數學推導58 
3.5.6實際考慮59 
3.6小結60 
3.7文獻綜述61 
3.8習題62 

第4章非參數濾波64 

4.1直方圖濾波64 
4.1.1離散貝葉斯濾波算法65 
4.1.2連續狀態65 
4.1.3直方圖近似的數學推導67 
4.1.4分解技術69 
4.2靜態二值貝葉斯濾波70 
4.3粒子濾波72 
4.3.1基本算法72 
4.3.2重要性採樣75 
4.3. 3粒子濾波的數學推導77 
4.3.4粒子濾波的實際考慮和特性79 
4.4小結85 
4.5文獻綜述85 
4.6習題86 

第5章機器人運動88 

5.1引言88 
5.2預備工作89 
5.2.1運動學構型89 
5.2 .2概率運動學89 
5.3速度運動模型90 
5.3.1閉式計算91 
5.3.2採樣算法92 
5.3.3速度運動模型的數學推導94 
5.4里程計運動模型99 
5.4.1閉式計算100 
5.4.2採樣算法102 
5.4.3里程 計運動模型的數學推導104 
5.5運動和地圖105 
5.6小結108 
5.7文獻綜述109 
5.8習題110 

第6章機器人感知112 

6.1引言112 
6.2地圖114 
6.3測距儀的波束模型115 
6.3.1基本測量算法115 
6.3 .2調節固有模型參數119 
6.3.3波束模型的數學推導121 
6.3.4實際考慮126 
6.3.5波束模型的局限127 
6.4測距儀的似然域127 
6.4.1基本算法127 
6.4.2擴展130 
6.5基於相關性的測量模型131 
6.6基於特徵的測量模型133 
6.6.1特徵提取133 
6.6.2地標的測量133 
6.6.3已知相關性的傳感器模型134 
6.6.4採樣位姿135 
6.6.5進一步的考慮137 
6.7實際考慮137 
6.8小結138 
6.9文獻綜述139 
6.10習題139 
第Ⅱ部分定位

第7章移動機器人定位:馬爾可夫與高斯142 

7.1定位問題的分類144 
7.2馬爾可夫定位146 
7.3馬爾可夫定位圖例147 
7.4擴展卡爾曼濾波定位149 
7.4.1圖例149 
7.4.2擴展卡爾曼濾波定位算法151 
7.4.3擴展卡爾曼濾波定位的數學推導151 
7.4. 4物理實現157 
7.5估計一致性161 
7.5.1未知一致性的擴展卡爾曼濾波定位161 
7.5.2極大似然數據關聯的數學推導162 
7.6多假設跟踪164 
7.7無跡卡爾曼濾波定位165 
7.7. 1無跡卡爾曼濾波定位的數學推導165 
7.7.2圖例168 
7.8實際考慮172 
7.9小結174 
7.10文獻綜述175 
7.11習題176 

第8章移動機器人定位:柵格與蒙特卡羅179 

8.1介紹179 
8.2柵格定位179 
8.2.1基本算法179 
8.2.2柵格分辨率180 
8.2.3計算開銷184 
8.2.4圖例184 
8.3蒙特卡羅定位189 
8.3.1圖例189 
8.3.2蒙特卡羅定位算法191 
8.3.3物理實現191 
8.3.4蒙特卡羅定位特性194 
8.3.5隨機粒子蒙特卡羅定位:失效恢復194 
8.3.6更改建議分佈198 
8.3.7庫爾貝克-萊布勒散度採樣:調節樣本集合大小199 
8.4動態環境下的定位203 
8.5實際考慮208 
8.6小結209 
8.7文獻綜述209 
8.8習題211 
第Ⅲ部分地圖構建

第9章佔用柵格地圖構建213 

9.1引言213 
9.2佔用柵格地圖構建算 216 
9.2.1多傳感器信息融合222 
9.3反演測量模型的研究223 
9.3.1反演測量模型223 
9.3.2從正演模型採樣224 
9.3.3誤差函數225 
9.3.4實例與深度思考226 
9.4最大化後驗佔用地圖構建227 
9.4.1維持依賴實例227 
9.4.2用正演模型進行佔用柵格地圖構建228 
9.5小結231 
9.6文獻綜述231 
9.7習題232 

第10章同時定位與地圖構建235 

10.1引言235 
10.2基於擴展卡爾曼濾波的SLAM 237 
10.2.1設定和假設237 
10.2.2已知一致性的SLAM問題238 
10.2.3 EKF SLAM的數學推導241 
10.3未知一致性的EKF SLAM 244 
10.3.1通用EKF SLAM算法244 
10.3.2舉例247 
10.3.3特徵選擇和地圖管理250 
10.4小結252 
10.5文獻綜述253 
10.6習題256 

第11章GraphSLAM算法258 

11.1引言258 
11.2直覺描述260 
11.2.1建立圖形260 
11.2.2推論262 
11.3具體的GraphSLAM算法265 
11.4 GraphSLAM算法的數學推導270 
11.4.1全SLAM後驗271 
11.4.2負對數後驗272 
11.4.3泰勒表達式272 
11.4.4構建信息形 273 
11.4.5濃縮信息表274 
11.4.6恢復機器人路徑277 
11.5 GraphSLAM算法的數據關聯278 
11.5.1未知一致性的GraphSLAM算法279 
11.5.2一致性測試的數學推理281 
11.6效率評價283 
11.7實驗應用284 
11.8其他的優化技術288 
11.9小結290 
11.10文獻綜述291 
11.11習題293 

第12章稀疏擴展信息濾波294 

12.1引言294 
12.2直觀描述296 
12.3 SEIF SLAM算法298 
12.4 SEIF的數學推導301 
12.4.1運動更新301 
12.4. 2測量更新304 
12.5稀疏化304 
12.5.1一般思想304 
12.5.2 SEIF的稀疏化306 
12.5.3稀疏化的數學推導307 
12.6分期償還的近似地圖恢復308 
12.7 SEIF有多稀疏310 
12.8增量數據關聯313 
12.8.1計算增量數據關聯概率313 
12.8.2實際考慮315 
12.9分支定界數據關聯318 
12.9.1遞歸搜索318 
12.9.2計算任意的數據關聯概率320 
12.9.3等價約束320 
12.10實際考慮322 
12.11多機器人SLAM 325 
12.11.1整合地圖326 
12.11.2地圖整合的數學推導328 
12.11.3建立一致 329 
12.11.4示例329 
12.12小結332 
12.13文獻綜述333 
12.14習題334 

第13章FastSLAM算法336 

13.1基本算法337 
13.2因子分解SLAM後驗338 
13.2.1因式分解的SLAM後驗的數學推導339 
13.3具有已知數據關聯的FastSLAM算法341 
13.4改進建議分佈346 
13.4.1通過採樣新位姿擴展路徑後驗346 
13.4.2更新可觀察的特徵估計348 
13.4.3計算重要性係數349 
13.5未知數據關聯351 
13.6地圖管理352 
13.7 FastSLAM算法353 
13.8高效實現358 
13.9基於特徵的地圖的FastSLAM 360 
13.9.1經驗思考360 
13.9.2閉環363 
13.10基於柵格的FastSLAM算法366 
13.10.1算法366 
13.10.2經驗見解366 
13.11小結369 
13.12文獻綜述371 
13.13習題372 
第Ⅳ部分規劃與控制

第14章馬爾可夫決策過程374 

14.1目的374 
14.2行動選擇的不確定性376 
14.3值迭代380 
14.3.1目標和報酬380 
14.3.2為完全能觀測的情況尋找最優控制策略383 
14.3.3計算值函數384 
14.4機器人控制的應用387 
14.5 結390 
14.6文獻綜述391 
14.7習題392 

第15章部分能觀測馬爾可夫決策過程394 

15.1動機394 
15.2算例分析395 
15.2.1建立395 
15.2.2控制選擇397 
15.2.3感知398 
15.2.4預測402 
15.2.5深度週期和修剪404 
15.3有限環境POMDP算法407 
15.4 POMDP的數學推導409 
15.4.1置信空間的值迭代409 
15.4.2值函數表示法410 
15.4.3計算值函數410 
15.5實際考慮413 
15.6小結416 
15.7文獻綜述417 
15.8習題419 

第16章近似部分能觀測馬爾可夫決策過程技術421 

16.1動機421 
16.2 QMDP 422 
16.3 AMDP 423 
16.3.1增廣的狀態空間423 
16.3.2 AMDP算法424 
16.3.3 AMDP的數學推導426 
16.3.4移動機器人導航應用427 
16.4 MC-POMDP 430 
16.4.1使用粒子集430 
16.4.2 MC-POMDP算法431 
16.4.3 MC-POMDP的數學推導433 
16.4.4實際考慮434 
16.5小結435 
16.6文獻綜述436 
16.7習題436 

第17章探測438 

17.1介紹438 
17.2基本探測算法439 
17.2.1信息增益439 
17.2.2貪婪技術440 
17.2.3蒙特卡羅探測441 
17.2 .4多步技術442 
17.3主動定位442 
17.4為獲得佔用柵格地圖的探測447 
17.4.1計算信息增益447 
17.4.2傳播增益450 
17.4.3推廣到多機器人系統452 
17.5 SLAM探測457 
17.5.1 SLAM熵分解457 
17.5.2 FastSLAM探測458 
17.5.3實驗描述460 
17.6小結462 
17.7文獻綜述463 
17.8習題466 

參考文獻468