深度學習應用開發實踐 — 文本音頻圖像處理30例

李永華、田雲龍、許亮斌、苑世寧

  • 出版商: 清華大學
  • 出版日期: 2025-04-01
  • 售價: $474
  • 語言: 簡體中文
  • 頁數: 306
  • ISBN: 7302682666
  • ISBN-13: 9787302682660
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

  • 深度學習應用開發實踐 — 文本音頻圖像處理30例-preview-1
  • 深度學習應用開發實踐 — 文本音頻圖像處理30例-preview-2
  • 深度學習應用開發實踐 — 文本音頻圖像處理30例-preview-3
深度學習應用開發實踐 — 文本音頻圖像處理30例-preview-1

商品描述

"本書根據當前人工智能及機器學習的發展成果,具體設計基於人工智能的模型算法,並給出了具體實現,**算法流程及代碼實現。其主要內容包括:AI作曲、語音識別、人像識別、車牌識別、骨架識別與肢體定位、人臉識別、古詩與歌詞生成的具體實現。 本書從系統設計、代碼實現以及運行結果展示相結合,語言簡潔,深入淺出,通俗易懂,不僅適合對人工智能編程有興趣的愛好者,而且可作為高等院校參考教材,還可作為從事智能應用創新開發專業人員的技術用書。 "

作者簡介

李永華,現執教於北京郵電大學,擁有超過15年的嵌入式開發經驗,致力於物聯網和智能硬件的研究開發工作。在教學中以興趣為導向,激發學生的創造性;以素質為基礎,提高自身教學水平;以科研為手段,促進教學理念轉變。通過信息工程專業綜合改革,探索了以“學生學為中心”的教學模式,營造生動活潑的學習方法,提高學生獨立思考問題、發現問題、解決問題的能力,激發學生的創造激情。在研發及教學實踐中指導學生實現300餘個創新案例,並指導著一支物聯網開發團隊,曾在物聯網、開源硬件等技術領域進行了多場學術報告,並且出版了《AllJoyn技術原理及物聯網程序開發指南》《Arduino實戰指南——遊戲開發、智能硬件、人機交互、智能家居與物聯網設計30例》《Arduino軟硬件協同設計實戰指南》等多部物聯網技術方向的著作。

目錄大綱

 

 

 

 

 

 

 

 

目錄

項目1AI作曲

 

1.1總體設計

 

1.1.1整體框架

 

1.1.2系統流程

 

1.2運行環境

 

1.2.1Python環境

 

1.2.2虛擬機環境

 

1.2.3TensorFlow環境

 

1.2.4Python類庫

 

1.3模塊實現

 

1.3.1數據準備

 

1.3.2信息提取

 

1.3.3模型構建

 

1.3.4模型訓練及保存

 

1.3.5音樂模塊

 

1.4系統測試

 

1.4.1訓練過程

 

1.4.2測試效果

 

項目2語音識別

 

2.1總體設計

 

2.1.1整體框架

 

2.1.2系統流程

 

2.2運行環境

 

2.2.1Python環境

 

2.2.2PyCharm環境

 

2.2.3PyTorch環境

 

2.2.4CUDA和cuDNN環境

 

2.2.5網頁端配置環境

 

2.3模塊實現

 

2.3.1數據準備

 

2.3.2模型構建

 

2.3.3模型訓練及保存

 

2.3.4模型應用

 

2.4系統測試

 

2.4.1訓練準確率

 

2.4.2測試效果

 

項目3人像分割

 

3.1總體設計

 

3.1.1整體框架

 

3.1.2系統流程

 

3.2運行環境

 

3.2.1Python環境

 

3.2.2PyTorch環境

 

3.2.3PyQt5配置

 

3.3模塊實現

 

3.3.1數據準備

 

3.3.2模型構建

 

3.3.3模型訓練

 

3.3.4模型保存

 

3.3.5模型測試

 

3.3.6模型運行

 

3.4系統測試

 

3.4.1訓練準確率

 

3.4.2測試效果

 

項目4車輛信息識別

 

4.1總體設計

 

4.1.1整體框架

 

4.1.2系統流程

 

4.2運行環境

 

4.3模塊實現

 

4.3.1車牌字符分割

 

4.3.2訓練數據

 

4.3.3車牌字符識別

 

4.4系統測試

 

項目5骨架識別與肢體定位

 

5.1總體設計

 

5.1.1整體框架

 

5.1.2系統流程

 

5.2運行環境

 

5.2.1Python環境

 

5.2.2Openpose環境

 

5.2.3PyQt6環境

 

5.3模塊實現

 

5.3.1靜態識別

 

5.3.2動態識別

 

5.3.3模塊展示

 

5.4系統測試

 

項目6生成古詩與歌詞

 

6.1總體設計

 

6.1.1整體框架

 

6.1.2系統流程

 

6.2運行環境

 

6.2.1Python環境

 

6.2.2TensorFlow環境

 

6.2.3PyCharm環境

 

6.3模塊實現

 

6.3.1數據準備

 

6.3.2模型構建

 

6.3.3模型訓練及保存

 

6.3.4使用模型生成古詩

 

6.3.5產生藏頭詩

 

6.3.6用詞雲展示生成的古詩

 

6.4歌詞生成

 

6.4.1數據準備

 

6.4.2模型構建

 

6.4.3模型訓練及保存

 

6.4.4生成歌詞

 

6.5系統測試

 

6.5.1生成古詩和藏頭詩

 

6.5.2生成歌詞

 

項目7車牌分割與識別

 

7.1總體設計

 

7.1.1整體框架

 

7.1.2系統流程

 

7.2運行環境

 

7.3模塊實現

 

7.3.1模型訓練

 

7.3.2模型預測

 

7.3.3模型展示

 

7.4系統測試

 

項目8音樂源分離

 

8.1總體設計

 

8.1.1整體框架

 

8.1.2系統流程

 

8.2運行環境

 

8.2.1Python環境

 

8.2.2訓練環境

 

8.2.3網頁端環境

 

8.3模塊實現

 

8.3.1數據準備

 

8.3.2模型訓練

 

8.3.3模型調用及音源分離

 

8.3.4前端交互

 

8.4系統測試

 

8.4.1模型訓練效果

 

8.4.2音頻分離效果

 

8.4.3前端交互效果

 

項目9寵物識別

 

9.1總體設計

 

9.1.1整體框架

 

9.1.2系統流程

 

9.2運行環境

 

9.2.1Python環境

 

9.2.2TensorFlow環境

 

9.2.3網頁端環境

 

9.3模塊實現

 

9.3.1數據準備

 

9.3.2模型構建

 

9.3.3模型訓練

 

9.3.4模型保存

 

9.3.5模型應用

 

9.4系統測試

 

9.4.1訓練準確率

 

9.4.2測試效果

 

項目10人臉口罩辨別

 

10.1總體設計

 

10.1.1整體框架

 

10.1.2系統流程

 

10.2運行環境

 

10.2.1Python環境

 

10.2.2PyTorch環境

 

10.2.3Android環境

 

10.3模塊實現

 

10.3.1數據準備

 

10.3.2模型構建

 

10.3.3模型訓練

 

10.3.4模型保存

 

10.3.5模型應用

 

10.4系統測試

 

10.4.1訓練準確率

 

10.4.2測試效果

 

項目11圖像風格遷移

 

11.1總體設計

 

11.1.1整體框架

 

11.1.2系統流程

 

11.2運行環境

 

11.2.1Python環境

 

11.2.2TensorFlow環境

 

11.2.3Android環境

 

11.3模塊實現

 

11.3.1數據準備

 

11.3.2模型構建

 

11.3.3模型訓練

 

11.3.4模型評估

 

11.3.5模型保存

 

11.3.6模型應用

 

11.4系統測試

 

11.4.1損失函數變化趨勢

 

11.4.2模型運行

 

11.4.3測試效果

 

項目12目標檢測網頁應用

 

12.1總體設計

 

12.1.1整體框架

 

12.1.2系統流程

 

12.2運行環境

 

12.2.1Python環境

 

12.2.2PyTorch環境

 

12.2.3網絡環境

 

12.3模塊實現

 

12.3.1數據準備

 

12.3.2模型構建

 

12.3.3模型訓練

 

12.4系統測試

 

12.4.1訓練結果

 

12.4.2測試效果

 

項目13圖像隱寫

 

13.1總體設計

 

13.1.1整體框架

 

13.1.2系統流程

 

13.2運行環境

 

13.3模塊實現

 

13.3.1數據準備

 

13.3.2模型實現

 

13.3.3模型訓練及評估

 

13.3.4模型保存

 

13.4系統測試

 

13.4.1訓練準確率

 

13.4.2測試效果

 

項目14圖像檢索

 

14.1總體設計

 

14.1.1整體框架

 

14.1.2系統流程

 

14.2運行環境

 

14.2.1Python環境

 

14.2.2TensorFlow環境

 

14.3模塊實現

 

14.3.1數據準備

 

14.3.2模型初始化及移植

 

14.3.3數字圖像處理

 

14.4系統測試

 

項目15人臉口罩檢測

 

15.1總體設計

 

15.1.1整體框架

 

15.1.2系統流程

 

15.2運行環境

 

15.2.1Python環境

 

15.2.2PyTorch環境

 

15.2.3微信小程序 

 

15.3模塊實現

 

15.3.1數據準備

 

15.3.2模型訓練

 

15.3.3服務器端部署

 

15.3.4移動端應用

 

15.4系統測試

 

15.4.1訓練準確率

 

15.4.2模型推理測試

 

項目16生活垃圾識別

 

16.1總體設計

 

16.1.1整體框架

 

16.1.2系統流程

 

16.2運行環境

 

16.2.1Python環境

 

16.2.2PyTorch環境

 

16.2.3網頁端

 

16.3模塊實現

 

16.3.1數據準備

 

16.3.2模型構建

 

16.3.3模型訓練

 

16.3.4模型保存

 

16.4系統測試

 

16.4.1訓練準確率

 

16.4.2測試效果

 

項目17動態交通手勢識別的車輛控制

 

17.1總體設計

 

17.1.1整體框架

 

17.1.2系統流程

 

17.2運行環境

 

17.2.1Python環境

 

17.2.2TensorFlow環境

 

17.2.3Arduino環境

 

17.3模塊實現

 

17.3.1數據準備

 

17.3.2導入模型並編譯

 

17.3.3模型訓練及評估

 

17.3.4訓練結果

 

17.3.5通信模塊

 

17.3.6藍牙模塊

 

17.4系統測試 

 

項目18物體識別

 

18.1總體設計

 

18.1.1整體框架

 

18.1.2系統流程

 

18.2運行環境

 

18.2.1Python環境

 

18.2.2PyTorch環境

 

18.2.3網頁端環境

 

18.3模塊實現

 

18.3.1數據準備

 

18.3.2模型構建

 

18.3.3模型訓練

 

18.3.4模型保存

 

18.3.5模型應用

 

18.4系統測試

 

18.4.1訓練準確率

 

18.4.2測試效果

 

項目19人體識別

 

19.1總體設計

 

19.1.1整體框架

 

19.1.2系統流程

 

19.2運行環境

 

19.2.1Python 環境

 

19.2.2StreamYOLO 環境

 

19.2.3CUDA環境

 

19.2.4Qt 相關安裝

 

19.3模塊實現

 

19.3.1數據準備

 

19.3.2模型訓練

 

19.3.3模型應用

 

19.4系統測試

 

項目20垃圾分類

 

20.1總體設計

 

20.1.1整體框架

 

20.1.2系統流程

 

20.2運行環境

 

20.2.1Python環境

 

20.2.2TensorFlow環境

 

20.2.3PyQt5環境

 

20.3模塊實現

 

20.3.1數據準備

 

20.3.2模型構建

 

20.3.3模型訓練

 

20.3.4模型應用

 

20.4系統測試

 

項目21垃圾郵件識別

 

21.1總體設計

 

21.1.1整體框架

 

21.1.2系統流程

 

21.2運行環境

 

21.2.1Python環境

 

21.2.2Flask 環境

 

21.3模塊實現

 

21.3.1數據準備

 

21.3.2樸素貝葉斯算法

 

21.3.3詞劃分

 

21.3.4貝葉斯垃圾郵件分類自動化處理

 

21.3.5訓練效果展示

 

21.4系統測試

 

項目22宿舍門禁系統

 

22.1總體設計

 

22.1.1整體框架

 

22.1.2系統流程

 

22.2運行環境

 

22.2.1Python環境

 

22.2.2網頁端

 

22.3模塊實現

 

22.3.1數據準備

 

22.3.2模型構建

 

22.3.3模型訓練

 

22.3.4模型應用

 

22.3.5模型運行

 

22.4系統測試

 

項目23人數檢測

 

23.1總體設計

 

23.1.1整體框架

 

23.1.2系統流程

 

23.2運行環境

 

23.2.1Python環境

 

23.2.2其他安裝包

 

23.3模塊實現

 

23.3.1數據準備

 

23.3.2模型構建

 

23.3.3模型訓練

 

23.3.4模型保存

 

23.3.5模型應用

 

23.4系統測試

 

23.4.1訓練準確率

 

23.4.2測試效果

 

項目24醫療診斷

 

24.1總體設計

 

24.1.1整體框架

 

24.1.2系統流程

 

24.2運行環境

 

24.2.1Python環境

 

24.2.2Sklearn環境

 

24.2.3網頁端

 

24.3模塊實現

 

24.3.1數據準備

 

24.3.2模型構建

 

24.3.3數據集劃分及模型訓練

 

24.3.4模型選擇

 

24.3.5模型保存

 

24.3.6模型應用

 

24.4系統測試

 

24.4.1訓練準確率

 

24.4.2測試效果

 

項目25水果識別

 

25.1總體設計

 

25.1.1整體框架

 

25.1.2系統流程

 

25.2運行環境

 

25.2.1Python環境

 

25.2.2TensorFlow環境

 

25.2.3PyQt5環境

 

25.3模塊實現

 

25.3.1模型構建及訓練

 

25.3.2模型測試

 

25.3.3圖形化界面

 

25.4系統測試

 

25.4.1測試準確率

 

25.4.2測試效果

 

項目26表情識別

 

26.1總體設計

 

26.1.1整體框架

 

26.1.2系統流程

 

26.2運行環境

 

26.3模塊實現

 

26.3.1數據準備

 

26.3.2模型構建

 

26.3.3模型訓練

 

26.3.4前端展示

 

26.4系統測試

 

26.4.1訓練準確率

 

26.4.2測試效果

 

項目27生成圖像字幕

 

27.1總體設計

 

27.1.1整體框架

 

27.1.2系統流程

 

27.2運行環境

 

27.2.1Python環境

 

27.2.2PyTorch環境

 

27.2.3網頁端環境

 

27.3模塊實現

 

27.3.1數據準備

 

27.3.2數據預處理

 

27.3.3數據讀取

 

27.3.4模型構建

 

27.3.5模型保存

 

27.3.6模型應用

 

27.4系統測試

 

項目28驗證碼的生成和識別

 

28.1總體設計

 

28.1.1整體框架

 

28.1.2系統流程

 

28.2運行環境

 

28.2.1Python環境

 

28.2.2TensorFlow環境

 

28.2.3Android環境/網頁端/鴻蒙/iOS

 

28.3模塊實現

 

28.3.1數據準備

 

28.3.2模型構建

 

28.3.3模型訓練

 

28.3.4模型保存

 

28.3.5模型應用

 

28.4系統測試

 

28.4.1訓練準確率

 

28.4.2測試效果

 

項目29中文語音輸入法

 

29.1總體設計

 

29.1.1整體框架

 

29.1.2系統流程

 

29.2運行環境

 

29.2.1Python環境

 

29.2.2TensorFlow環境

 

29.2.3其他依賴庫

 

29.3模塊實現

 

29.3.1數據準備

 

29.3.2模型構建

 

29.3.3模型訓練及驗證

 

29.3.4模型應用

 

29.4系統測試

 

29.4.1訓練準確率

 

29.4.2測試效果

 

項目30狗種類識別

 

30.1總體設計

 

30.1.1整體框架

 

30.1.2系統流程

 

30.2運行環境

 

30.2.1Python環境

 

30.2.2PyTorch環境

 

30.2.3Android環境

 

30.3模塊實現

 

30.3.1數據準備

 

30.3.2模型構建

 

30.3.3模型訓練

 

30.3.4模型保存

 

30.3.5模型應用

 

30.3.6模型運行

 

30.4系統測試

 

30.4.1訓練準確率

 

30.4.2測試效果

 

 

 

最後瀏覽商品 (20)