深度學習應用開發實踐 — 文本音頻圖像處理30例
李永華、田雲龍、許亮斌、苑世寧
- 出版商: 清華大學
- 出版日期: 2025-04-01
- 售價: $474
- 語言: 簡體中文
- 頁數: 306
- ISBN: 7302682666
- ISBN-13: 9787302682660
-
相關分類:
DeepLearning
下單後立即進貨 (約4週~6週)
商品描述
"本書根據當前人工智能及機器學習的發展成果,具體設計基於人工智能的模型算法,並給出了具體實現,**算法流程及代碼實現。其主要內容包括:AI作曲、語音識別、人像識別、車牌識別、骨架識別與肢體定位、人臉識別、古詩與歌詞生成的具體實現。 本書從系統設計、代碼實現以及運行結果展示相結合,語言簡潔,深入淺出,通俗易懂,不僅適合對人工智能編程有興趣的愛好者,而且可作為高等院校參考教材,還可作為從事智能應用創新開發專業人員的技術用書。 "
作者簡介
李永華,現執教於北京郵電大學,擁有超過15年的嵌入式開發經驗,致力於物聯網和智能硬件的研究開發工作。在教學中以興趣為導向,激發學生的創造性;以素質為基礎,提高自身教學水平;以科研為手段,促進教學理念轉變。通過信息工程專業綜合改革,探索了以“學生學為中心”的教學模式,營造生動活潑的學習方法,提高學生獨立思考問題、發現問題、解決問題的能力,激發學生的創造激情。在研發及教學實踐中指導學生實現300餘個創新案例,並指導著一支物聯網開發團隊,曾在物聯網、開源硬件等技術領域進行了多場學術報告,並且出版了《AllJoyn技術原理及物聯網程序開發指南》《Arduino實戰指南——遊戲開發、智能硬件、人機交互、智能家居與物聯網設計30例》《Arduino軟硬件協同設計實戰指南》等多部物聯網技術方向的著作。
目錄大綱
目錄
項目1AI作曲
1.1總體設計
1.1.1整體框架
1.1.2系統流程
1.2運行環境
1.2.1Python環境
1.2.2虛擬機環境
1.2.3TensorFlow環境
1.2.4Python類庫
1.3模塊實現
1.3.1數據準備
1.3.2信息提取
1.3.3模型構建
1.3.4模型訓練及保存
1.3.5音樂模塊
1.4系統測試
1.4.1訓練過程
1.4.2測試效果
項目2語音識別
2.1總體設計
2.1.1整體框架
2.1.2系統流程
2.2運行環境
2.2.1Python環境
2.2.2PyCharm環境
2.2.3PyTorch環境
2.2.4CUDA和cuDNN環境
2.2.5網頁端配置環境
2.3模塊實現
2.3.1數據準備
2.3.2模型構建
2.3.3模型訓練及保存
2.3.4模型應用
2.4系統測試
2.4.1訓練準確率
2.4.2測試效果
項目3人像分割
3.1總體設計
3.1.1整體框架
3.1.2系統流程
3.2運行環境
3.2.1Python環境
3.2.2PyTorch環境
3.2.3PyQt5配置
3.3模塊實現
3.3.1數據準備
3.3.2模型構建
3.3.3模型訓練
3.3.4模型保存
3.3.5模型測試
3.3.6模型運行
3.4系統測試
3.4.1訓練準確率
3.4.2測試效果
項目4車輛信息識別
4.1總體設計
4.1.1整體框架
4.1.2系統流程
4.2運行環境
4.3模塊實現
4.3.1車牌字符分割
4.3.2訓練數據
4.3.3車牌字符識別
4.4系統測試
項目5骨架識別與肢體定位
5.1總體設計
5.1.1整體框架
5.1.2系統流程
5.2運行環境
5.2.1Python環境
5.2.2Openpose環境
5.2.3PyQt6環境
5.3模塊實現
5.3.1靜態識別
5.3.2動態識別
5.3.3模塊展示
5.4系統測試
項目6生成古詩與歌詞
6.1總體設計
6.1.1整體框架
6.1.2系統流程
6.2運行環境
6.2.1Python環境
6.2.2TensorFlow環境
6.2.3PyCharm環境
6.3模塊實現
6.3.1數據準備
6.3.2模型構建
6.3.3模型訓練及保存
6.3.4使用模型生成古詩
6.3.5產生藏頭詩
6.3.6用詞雲展示生成的古詩
6.4歌詞生成
6.4.1數據準備
6.4.2模型構建
6.4.3模型訓練及保存
6.4.4生成歌詞
6.5系統測試
6.5.1生成古詩和藏頭詩
6.5.2生成歌詞
項目7車牌分割與識別
7.1總體設計
7.1.1整體框架
7.1.2系統流程
7.2運行環境
7.3模塊實現
7.3.1模型訓練
7.3.2模型預測
7.3.3模型展示
7.4系統測試
項目8音樂源分離
8.1總體設計
8.1.1整體框架
8.1.2系統流程
8.2運行環境
8.2.1Python環境
8.2.2訓練環境
8.2.3網頁端環境
8.3模塊實現
8.3.1數據準備
8.3.2模型訓練
8.3.3模型調用及音源分離
8.3.4前端交互
8.4系統測試
8.4.1模型訓練效果
8.4.2音頻分離效果
8.4.3前端交互效果
項目9寵物識別
9.1總體設計
9.1.1整體框架
9.1.2系統流程
9.2運行環境
9.2.1Python環境
9.2.2TensorFlow環境
9.2.3網頁端環境
9.3模塊實現
9.3.1數據準備
9.3.2模型構建
9.3.3模型訓練
9.3.4模型保存
9.3.5模型應用
9.4系統測試
9.4.1訓練準確率
9.4.2測試效果
項目10人臉口罩辨別
10.1總體設計
10.1.1整體框架
10.1.2系統流程
10.2運行環境
10.2.1Python環境
10.2.2PyTorch環境
10.2.3Android環境
10.3模塊實現
10.3.1數據準備
10.3.2模型構建
10.3.3模型訓練
10.3.4模型保存
10.3.5模型應用
10.4系統測試
10.4.1訓練準確率
10.4.2測試效果
項目11圖像風格遷移
11.1總體設計
11.1.1整體框架
11.1.2系統流程
11.2運行環境
11.2.1Python環境
11.2.2TensorFlow環境
11.2.3Android環境
11.3模塊實現
11.3.1數據準備
11.3.2模型構建
11.3.3模型訓練
11.3.4模型評估
11.3.5模型保存
11.3.6模型應用
11.4系統測試
11.4.1損失函數變化趨勢
11.4.2模型運行
11.4.3測試效果
項目12目標檢測網頁應用
12.1總體設計
12.1.1整體框架
12.1.2系統流程
12.2運行環境
12.2.1Python環境
12.2.2PyTorch環境
12.2.3網絡環境
12.3模塊實現
12.3.1數據準備
12.3.2模型構建
12.3.3模型訓練
12.4系統測試
12.4.1訓練結果
12.4.2測試效果
項目13圖像隱寫
13.1總體設計
13.1.1整體框架
13.1.2系統流程
13.2運行環境
13.3模塊實現
13.3.1數據準備
13.3.2模型實現
13.3.3模型訓練及評估
13.3.4模型保存
13.4系統測試
13.4.1訓練準確率
13.4.2測試效果
項目14圖像檢索
14.1總體設計
14.1.1整體框架
14.1.2系統流程
14.2運行環境
14.2.1Python環境
14.2.2TensorFlow環境
14.3模塊實現
14.3.1數據準備
14.3.2模型初始化及移植
14.3.3數字圖像處理
14.4系統測試
項目15人臉口罩檢測
15.1總體設計
15.1.1整體框架
15.1.2系統流程
15.2運行環境
15.2.1Python環境
15.2.2PyTorch環境
15.2.3微信小程序
15.3模塊實現
15.3.1數據準備
15.3.2模型訓練
15.3.3服務器端部署
15.3.4移動端應用
15.4系統測試
15.4.1訓練準確率
15.4.2模型推理測試
項目16生活垃圾識別
16.1總體設計
16.1.1整體框架
16.1.2系統流程
16.2運行環境
16.2.1Python環境
16.2.2PyTorch環境
16.2.3網頁端
16.3模塊實現
16.3.1數據準備
16.3.2模型構建
16.3.3模型訓練
16.3.4模型保存
16.4系統測試
16.4.1訓練準確率
16.4.2測試效果
項目17動態交通手勢識別的車輛控制
17.1總體設計
17.1.1整體框架
17.1.2系統流程
17.2運行環境
17.2.1Python環境
17.2.2TensorFlow環境
17.2.3Arduino環境
17.3模塊實現
17.3.1數據準備
17.3.2導入模型並編譯
17.3.3模型訓練及評估
17.3.4訓練結果
17.3.5通信模塊
17.3.6藍牙模塊
17.4系統測試
項目18物體識別
18.1總體設計
18.1.1整體框架
18.1.2系統流程
18.2運行環境
18.2.1Python環境
18.2.2PyTorch環境
18.2.3網頁端環境
18.3模塊實現
18.3.1數據準備
18.3.2模型構建
18.3.3模型訓練
18.3.4模型保存
18.3.5模型應用
18.4系統測試
18.4.1訓練準確率
18.4.2測試效果
項目19人體識別
19.1總體設計
19.1.1整體框架
19.1.2系統流程
19.2運行環境
19.2.1Python 環境
19.2.2StreamYOLO 環境
19.2.3CUDA環境
19.2.4Qt 相關安裝
19.3模塊實現
19.3.1數據準備
19.3.2模型訓練
19.3.3模型應用
19.4系統測試
項目20垃圾分類
20.1總體設計
20.1.1整體框架
20.1.2系統流程
20.2運行環境
20.2.1Python環境
20.2.2TensorFlow環境
20.2.3PyQt5環境
20.3模塊實現
20.3.1數據準備
20.3.2模型構建
20.3.3模型訓練
20.3.4模型應用
20.4系統測試
項目21垃圾郵件識別
21.1總體設計
21.1.1整體框架
21.1.2系統流程
21.2運行環境
21.2.1Python環境
21.2.2Flask 環境
21.3模塊實現
21.3.1數據準備
21.3.2樸素貝葉斯算法
21.3.3詞劃分
21.3.4貝葉斯垃圾郵件分類自動化處理
21.3.5訓練效果展示
21.4系統測試
項目22宿舍門禁系統
22.1總體設計
22.1.1整體框架
22.1.2系統流程
22.2運行環境
22.2.1Python環境
22.2.2網頁端
22.3模塊實現
22.3.1數據準備
22.3.2模型構建
22.3.3模型訓練
22.3.4模型應用
22.3.5模型運行
22.4系統測試
項目23人數檢測
23.1總體設計
23.1.1整體框架
23.1.2系統流程
23.2運行環境
23.2.1Python環境
23.2.2其他安裝包
23.3模塊實現
23.3.1數據準備
23.3.2模型構建
23.3.3模型訓練
23.3.4模型保存
23.3.5模型應用
23.4系統測試
23.4.1訓練準確率
23.4.2測試效果
項目24醫療診斷
24.1總體設計
24.1.1整體框架
24.1.2系統流程
24.2運行環境
24.2.1Python環境
24.2.2Sklearn環境
24.2.3網頁端
24.3模塊實現
24.3.1數據準備
24.3.2模型構建
24.3.3數據集劃分及模型訓練
24.3.4模型選擇
24.3.5模型保存
24.3.6模型應用
24.4系統測試
24.4.1訓練準確率
24.4.2測試效果
項目25水果識別
25.1總體設計
25.1.1整體框架
25.1.2系統流程
25.2運行環境
25.2.1Python環境
25.2.2TensorFlow環境
25.2.3PyQt5環境
25.3模塊實現
25.3.1模型構建及訓練
25.3.2模型測試
25.3.3圖形化界面
25.4系統測試
25.4.1測試準確率
25.4.2測試效果
項目26表情識別
26.1總體設計
26.1.1整體框架
26.1.2系統流程
26.2運行環境
26.3模塊實現
26.3.1數據準備
26.3.2模型構建
26.3.3模型訓練
26.3.4前端展示
26.4系統測試
26.4.1訓練準確率
26.4.2測試效果
項目27生成圖像字幕
27.1總體設計
27.1.1整體框架
27.1.2系統流程
27.2運行環境
27.2.1Python環境
27.2.2PyTorch環境
27.2.3網頁端環境
27.3模塊實現
27.3.1數據準備
27.3.2數據預處理
27.3.3數據讀取
27.3.4模型構建
27.3.5模型保存
27.3.6模型應用
27.4系統測試
項目28驗證碼的生成和識別
28.1總體設計
28.1.1整體框架
28.1.2系統流程
28.2運行環境
28.2.1Python環境
28.2.2TensorFlow環境
28.2.3Android環境/網頁端/鴻蒙/iOS
28.3模塊實現
28.3.1數據準備
28.3.2模型構建
28.3.3模型訓練
28.3.4模型保存
28.3.5模型應用
28.4系統測試
28.4.1訓練準確率
28.4.2測試效果
項目29中文語音輸入法
29.1總體設計
29.1.1整體框架
29.1.2系統流程
29.2運行環境
29.2.1Python環境
29.2.2TensorFlow環境
29.2.3其他依賴庫
29.3模塊實現
29.3.1數據準備
29.3.2模型構建
29.3.3模型訓練及驗證
29.3.4模型應用
29.4系統測試
29.4.1訓練準確率
29.4.2測試效果
項目30狗種類識別
30.1總體設計
30.1.1整體框架
30.1.2系統流程
30.2運行環境
30.2.1Python環境
30.2.2PyTorch環境
30.2.3Android環境
30.3模塊實現
30.3.1數據準備
30.3.2模型構建
30.3.3模型訓練
30.3.4模型保存
30.3.5模型應用
30.3.6模型運行
30.4系統測試
30.4.1訓練準確率
30.4.2測試效果