AI 機器人|從感知到行動的下一步
Alishba Imran , Keerthana Gopalakrishnan 著 温榮弘 譯
買這商品的人也買了...
-
嵌入式系統設計實務-電路與驅動程式$250$225 -
Using SQLite (Paperback)$1,800$1,710 -
ASP.NET 本質論$520$410 -
$700Professional Scrum Development with Microsoft Visual Studio 2012 (Paperback) -
Beginning Big Data with Power BI and Excel 2013: Big Data Processing and Analysis Using PowerBI in Excel 2013 (Paperback)$1,730$1,643 -
$474系統分析與設計 : 敏捷疊代方法 (原書第6版) -
IoT Solutions in Microsoft's Azure IoT Suite: Data Acquisition and Analysis in the Real World$3,420$3,351 -
$958深度學習 -
演算法之美:隱藏在資料結構背後的原理 (C++版)$650$507 -
$534JSON 實戰 -
$283大數據技術 -
手機攝影必學 BOOK:用OX帶你學會拍人物、食物、風景等情境照片$398$299 -
創意競擇:從賈伯斯黃金年代的軟體設計機密流程,窺見蘋果的創意方法、本質與卓越關鍵$460$391 -
Web 開發者一定要懂的駭客攻防術 (Web Security for Developers: Real Threats, Practical Defense)$420$331 -
資料科學的統計實務 : 探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步$599$539 -
Martin Fowler 的企業級軟體架構模式:軟體重構教父傳授 51個模式,活用設計思考與架構決策 (Patterns of Enterprise Application Architecture)$800$624 -
我懂了!專案管理 (暢銷紀念版)$400$316 -
電腦視覺機器學習實務|建立端到端的影像機器學習 (Practical Machine Learning for Computer Vision: End-To-End Machine Learning for Images)$780$616 -
$2,185Learning Blazor: Build Single-Page Apps with Webassembly and C# (Paperback) -
ASP.NET Core Razor Pages in Action (Paperback)$2,160$2,052 -
超圖解 ESP32 應用實作$820$647 -
無瑕的程式碼 軟體工匠篇:程式設計師必須做到的紀律、標準與倫理 (Clean Craftsmanship: Disciplines, Standards, and Ethics)$720$561 -
從源頭就優化 - 動手開發自己的編譯器實戰$880$695 -
UX 商業價值實現之道|打造成功的數位產品服務 (UX for Business: How to Design Valuable Digital Companies)$780$616 -
建構可擴展系統|設計分散式架構 (Foundations of Scalable Systems: Designing Distributed Architectures)$780$616
商品描述
發布會上的機器人動作越來越細膩,
影片中的自動駕駛可以在複雜環境中流暢穿梭,
但真正的改變,不是硬體升級或炫目的動作展示,
而是當AI打通了感知與行動之間的連結,機器人真正從實驗室走入真實世界!
當機器能看見環境、理解情境,再根據理解做出決策,
它就不再只是執行指令的工具,而是具備行動能力的智慧系統。
本書由Berkeley AI研究室(BAIR)與Google DeepMind專家執筆,
匯集大神Pieter Abbeel實驗室的前瞻技術與來自NVIDIA、Cruise的實戰經驗,
為您拆解這場變革的關鍵技術——
從影像辨識、深度學習,到強化學習與LLM應用,
看懂機器人如何感知、思考與行動。
帶您了解:
.機器人如何透過影像辨識理解周遭環境
.如何透過學習不斷修正動作與決策
.自駕車、人形機器人與工業機器人背後的核心技術
.AI如何讓機器具備跨任務學習與適應能力
從強化學習走到跨體現機器人實戰,本書不僅讓您澈底掌握LLM與VLM在機器人控制與規劃的最新技術,更是理解未來智慧機器的藍圖。
-----------------------------------------------
本書以深度學習的視角切入機器人學,探討人工智慧(AI)如何徹底改變機器人研究與應用的面貌。引導讀者將過去數十年累積的經典機器人問題,轉化為以AI為核心的技術,並在大型基礎模型的時代,運用現代技術方法解決實務問題。
[本書架構]
■ 關鍵技術解說:AI重塑機器人學的核心問題
.從感知與感測出發,解釋卷積神經網路與視覺轉換器在影像分割、分類、偵測任務中的應用。
.探討大型語言模型(LLM)與多模態模型在機器人推理與控制上的調適方法。
.將模擬、定位、勘測與導航視為深度學習問題,並統整最新技術發展成果。
.涵蓋強化學習與控制,闡述機器人以反覆試誤與自我對弈的未知環境自主訓練能力。
■ 實務應用案例:真實世界的AI機器人應用
.深入分析自駕車、工業型機器人與人形機器人的AI體現應用。
.解說系統設計與演算法選擇的取捨,理解性能與可靠性之間的平衡。
.探討數據驅動的營運模式、基礎設施與安全性議題,以及描繪AI機器人的未來展望。
作者簡介
Alishba Imran 是一位專注於機器人操作與感知學習的機器學習開發者。她目前於柏克萊人工智慧研究室(BAIR Lab)與知名學者Pieter Abbeel合作,深耕強化學習與非監督式學習領域。她擁有極為豐富的業界實戰經驗,曾於Cruise等頂尖企業開發先進的感知系統、在NVIDIA投入基於模擬的機器人操作研究,更曾主導一項大幅降低義肢成本的指標性計畫。此外,在打造知名人形機器人Sophia的Hanson Robotics公司中,她也共同領導了神經符號AI(Neuro-symbolic AI)的前瞻研究,並致力於開發低成本的人形硬體系統。
Keerthana Gopalakrishnan現任Google DeepMind資深研究科學家,負責機器人操作與Gemini專案的前沿研究。她擁有卡內基美隆大學(CMU)與印度理工學院(IIT)的頂尖學歷背景。其研究核心聚焦於最新AI技術在實體機器人上的應用,包含:應用於機器人規劃的大型語言模型(LLM)、用於低階控制的視覺語言模型(VLM)擴展,以及跨體現(Cross-embodiment)機器人學習技術。
目錄大綱
第一章:通用機器人導論
機器人系統
常見機器人類型
機器人設計常見概念
機器人深度學習
深度學習框架
機器人學習框架與目標
邁向體現通用智慧
總結
參考文獻
第二章:機器人感知:感測器與影像處理
感測器
感知問題
卷積神經網路概論
感知CNN
ResNet
EfficientNet
單階段偵測器
模型比較
感知的 Transformer
總結
參考文獻
第三章:機器人感知:3D 數據與感測器融合
3D 數據處理
多模態感知與感測器融合
總結
參考文獻
第四章:機器人基礎模型
大型基礎模型
語言作為機器人的連結組織
端到端機器人控制
從影片示範學習
機器人 AI 安全
總結
參考文獻
第五章:模擬
機器人模擬
機器人模擬器組成
Sim2Real 概念
縮小 RL 到 Sim2Real 的差距
從模擬中學習
總結
參考文獻
第六章:勘測、定位與導航
為何使用深度學習?
傳統移動機器人設置
勘測
定位
導航
總結
參考文獻
第七章:強化學習與控制
強化學習基礎
無模型與基於模型的 RL
離線強化學習
應用與挑戰
機器人的 RL 挑戰
機器人的 RL 湧現趨勢
結論
總結
參考文獻
第八章:自駕車
經濟機遇
系統設計
感知
預測
規劃
安全
總結
參考文獻
第九章:工業機器人
常見任務
常見機器人
市場機遇
取放機器人系統設計
安全考量
總結
參考文獻
第十章:人形機器人
人形機器人案例
替代方法
人形機器人市場
人形機器人建構
結論
總結
參考文獻
第十一章:數據驅動機器人實務
機器人營運
數據基礎設施
訓練與部署基礎設施
機器人數據飛輪
大規模機器人數據收集
未來解方
參考文獻








