實感交互 : 人工智能下的人機交互技術 实感交互:人工智能下的人机交互技术

阿欽蒂亞·K.鮑米克

買這商品的人也買了...

商品描述

過往的科幻現已成真,在人工智能時代現在我們與電腦、手機和娛樂設備的互動正在經歷革命性的變化,基於觸摸、手勢、語音和視覺的自然人機交互正在逐漸替代使用鍵盤、鼠標和游戲手柄等的交互。顯示設備也從單純的顯示設備轉變為提供更具吸引力和沉浸式體驗的雙向交互設備。本書將深入講解基於觸摸、手勢、語音和視覺等自然人機交互領域的技術、應用和未來趨勢。
本書適合從事人機交互領域工作的研究、設計、開發人員,相關專業師生,以及人工智能時代下對人機交互未來發展趨勢有濃厚興趣的人士閱讀。

作者簡介

Achintya K.Bhowmik博士曾是英特爾公司大商業部門——PC部分的負責人,現為英特爾公司感知運算部門技術總監,他負責領導研發基於自然人機交互技術和視覺計算技術的下一代解決方案。這些技術包括視覺感知、語音識別、生物傳感、沉浸式顯示、多模態用戶界面與應用等。
Achintya K.Bhowmik博士出版和發表過多本著作與多篇論文,獲得過27項授予權專利,他是IEEE的高級成員,同時也在加利福尼亞大學聖克魯茲分校教授移動傳感和計算機視覺課程。

目錄大綱

原書序
原書前言
第1章交互式顯示的感知、理解與自然
人機界面1 
1.1引言1 
1.2人類感知和理解3 
1.3人機界面技術7 
1.3.1過往的輸入裝置7 
1.3.2觸控式交互技術9 
1.3.3聲控交互10 
1.3.4視控交互12 
1.3.5多模態交互15 
1.4 “真實”3D交互顯示探索17 
1.5結語19 
參考文獻19 
第2章觸覺感知22 
2.1引言22 
2.2觸控技術簡介23 
2.2.1觸摸屏24 
2.2.2按大小和應用對觸控技術進行分類25 
2.2.3按材質和結構分類的觸控技術27 
2.2.4按檢測物理量分類的觸控技術27 
2.2 .5按感知能力分類的觸控技術28 
2.2.6觸控技術的未來29 
2.3觸控技術的歷史29 
2.4電容式觸控技術32 
2.4.1投射電容式觸控技術(編號1) 32 
2.4. 2表面電容式觸控技術(編號2) 39 
2.5電阻式觸控技術43
2.5.1模擬電阻式觸控技術(編號3) 43 
2.5.2數字多點電阻式觸控技術(編號4) 48 
2.5.3模擬多點電阻式觸控技術(編號5) 49 
2.6聲波觸控技術51 
2.6.1表面聲波觸控技術(編號6) 51 
2.6.2聲學脈衝識別觸控技術(編號7) 53 
2.6.3色散信號技術觸控技術(編號8) 56 
2.7光學觸控技術57 
2.7 .1傳統紅外線觸控技術(編號9) 57 
2.7.2多點觸控紅外技術(編號10) 61 
2.7.3攝像光學觸控技術(編號11) 63 
2.7.4玻璃光學觸控技術(平面散射檢測)(編號12) 68 
2.7.5視覺光學觸控技術(編號13) 69 
2.8嵌入式觸控技術72 
2.8.1外嵌互電容式(編號14) 74 
2.8.2混合互電容式(編號15 ) 74 
2.8.3內嵌互電容式(編號16) 76 
2.8.4內嵌式光感(編號17) 77 
2.9其他觸控技術79 
2.9.1壓力感測(編號18) 79 
2.9.2組合觸控技術81 
2.10結語82 
2.11附錄82 
參考文獻83 
第3章用戶界面中的聲控式交互技術8 8
3.1引言88 
3.2語音識別91 
3.2.1語言的本質91 
3.2.2聲學模型和前端模式92 
3.2.3使語音對齊隱馬爾科夫模型(HMM)的過程93 
3.2.4語言模型93 
3.2.5探索:以每秒1000個單詞完成填字遊戲95 
3.2.6訓練聲學和語言模型96 
3.2.7為特定說話人識別系統調整髮聲和語音模型96 
3.2.8 “標準”系統外的其他系統97 
3.2. 9性能98 
3.3語音識別的深度神經網絡98 
3.4硬件優化100 
3.4.1低電量喚醒運算101 
3.4.2特定運算的硬件優化101 
3.5穩健語音識別的信號強化技術102 
3.5.1穩健語音識別102 
3.5. 2單通道噪聲抑制102 
3.5.3多通道噪聲抑制104 
3.5.4噪聲消除104 
3.5.5回音消除104 
3.5.6波束形成105 
3.6聲音生物計量106 
3.6.1引言106 
3.6.2聲音生物計量面臨的挑戰106 
3.6.3聲音生物計量的新研究領域107 
3.7語音合成107
3.8自然語言理解110 
3.8.1混合主導對話111 
3.8.2預設和填值技術的局限113 
3.9多輪對話管理116 
3.10規劃和推理119 
3.10.1技術挑戰119 
3.10.2語義分析和語篇表達120 
3.10.3語用學121 
3.10.4對話管理協作122 
3.10.5規劃和再規劃122 
3.10.6知識呈現與推理123 
3.10.7監控123 
3.10.8推薦閱讀文獻124 
3.11問題解答124 
3.11.1問題分析125 
3.11.2尋找相關信息125 
3.11.3解答與依據126 
3.11.4呈現答案126 
3.12分佈式語音交互架構126 
3.12.1分佈式用戶界面127 
3.12.2分佈的語音及語言技術128 
3.13結語129 
參考文獻130 
第4章視覺傳感與肢體動作交互技術136 
4.1引言136 
4.2圖像技術:2D和3D 137 
4.3姿勢交互140 
4.4結語146 
參考文獻147
第5章實時3D傳感與結構光技術149 
5.1引言149 
5.2結構化圖案彙編150 
5.2.1 2D偽隨機彙編151 
5.2.2二進制結構化彙編152 
5.2.3多進制彙編153 
5.2.4連續正弦相位彙編154 
5.3結構光系統校準157 
5.4數字條紋投射(DFP)技術下的3D傳感示例160 
5.5實時3D傳感技術162 
5.5.1數字光處理(DLP)技術的原理162 
5.5.2實時3D數據採集164 
5.5.3實時3D數據處理與可視化165 
5.5.4實時3D傳感實例166 
5.6人機交互應用的實時3D傳感166 
5.6.1實時3D面部表情捕捉及其人機交互的意義167 
5.6. 2實時3D身體部分姿勢捕捉及其人機交互的意義167 
5.6.3人機交互意義的總結168 
5.7最新發展169 
5.7.1實時3D傳感與自然2D彩色紋理捕捉169 
5.7.2超高速3D傳感171 
5.8結語173 
參考文獻173 
第6章實時立體3D成像技術178