AI 嵌入式系統:算法優化與實現
應忍冬//劉佩林
- 出版商: 機械工業
- 出版日期: 2021-11-01
- 定價: $594
- 售價: 8.5 折 $505
- 語言: 簡體中文
- 頁數: 348
- 裝訂: 平裝
- ISBN: 7111693256
- ISBN-13: 9787111693253
-
相關分類:
Machine Learning、ARM
立即出貨 (庫存=1)
買這商品的人也買了...
-
Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 -
初探機器學習|使用 Python (Thoughtful Machine Learning with Python)$480$379 -
Deep Learning 2|用 Python 進行自然語言處理的基礎理論實作$680$537 -
精通嵌入式 Linux 程式設計 (暢銷回饋版)$620$484 -
深度學習 -- 硬體設計$750$675 -
Deep Learning 3|用 Python 進行深度學習框架的開發實作$780$616 -
超圖解 ESP32 深度實作$880$695 -
$559嵌入式 C語言自我修養 — 從芯片、編譯器到操作系統 -
$210深度神經網絡 FPGA 設計與實現 -
$796複雜環境下語音信號處理的深度學習方法 -
計算機系統開發與優化實戰$659$626 -
PyTorch 深度學習實作:利用 PyTorch 實際演練神經網路模型$600$300 -
AI 編譯器開發指南$714$678 -
AI 加速器架構設計與實現圖書$594$564 -
Deep Learning 4|用 Python 進行強化學習的開發實作$680$537 -
Xilinx FPGA 權威設計指南:基於 Vivado 2023 設計套件$1,188$1,129 -
超圖解 ESP32 應用實作$820$648 -
Xilinx FPGA 工程師成長手記$419$398 -
基於 FPGA 的機器人計算$594$564 -
你的第一本 Git 與 GitHub 入門書:輕鬆實作本機與遠端儲存庫的版本控制$620$434 -
$421人工智能硬件加速器設計 -
AI 芯片應用開發實踐$414$393 -
$611AI 處理器硬件架構設計 -
$454用 Cursor 玩轉 AI 輔助編程 (不寫代碼也能做軟件開發) -
Deep Learning 5|生成模型開發實作$780$616
商品描述
本書介紹機器學習推理算法在嵌入式系統中的底層實現技術與優化。
給出不同層級的優化方法,包括面向機器學習推理模型結構的優化;面向運算圖中各個算子計算優化;
面向二進制比特運算優化以及面向CPU硬件特性的優化。
內容結合了理論和實踐,
其中底層算法的優化方法涉及其背後的信號處理理論介紹,但同時通過應用例子和大量代碼說明其軟件實現方法。
所討論的內容能夠幫助讀者在嵌入式平臺上實現機器學習算法,
另外也為進一步實現通用的嵌入式環境下機器學習算法自動優化和部署工具的開發提供基本知識。
本書內容面向電子信息及計算機專業本科教學,
也可供相關領域工程技術人員參考。
作者簡介
應忍冬
上海交通大學電子信恩與電氣工程學院副教授,碩士生導師。
研究領域包括嵌入式系統、數字信號處理及VLSI實現架構、
人工智能領域的機器思維原理和實現。
目錄大綱
目錄
前言
第1章 緒論
1.1 AI嵌入式系統的概念與特點
1.2 機器學習在嵌入式系統中的實現
1.3 本書內容概述
第2章 嵌入式軟件編程模式和優化
2.1 嵌入式軟件編程模式
2.1.1 基於週期調用的運行模式
2.1.2 基於中斷的前後臺運行模式
2.1.3 基於事件隊列的運行模式
2.1.4 帶時間信息的事件隊列運行模式
2.1.5 計算圖運行模式
2.2 通用軟件優化方法
2.2.1 循環結構優化
2.2.2 時間空間平衡
2.2.3 運算精度和性能平衡
2.2.4 底層運算的快速實現算法
2.2.5 內存使用優化
2.3 小結
參考文獻
第3章 機器學習算法概述
3.1 高斯樸素貝葉斯分類器
3.1.1 原理概述
3.1.2 模型訓練和推理
3.2 感知器
3.2.1 原理概述
3.2.2 模型訓練和推理
3.3 SVM分類器
3.3.1 原理概述
3.3.2 模型訓練和推理
3.4 決策樹
3.4.1 原理概述
3.4.2 模型訓練和推理
3.4.3 決策樹分類器的代碼實現
3.5 線性數據降維
3.5.1 原理概述
3.5.2 模型訓練和推理
3.6 神經網絡
3.6.1 原理概述
3.6.2 模型訓練和推理
3.7 小結
參考文獻
第4章 數值的表示和運算
4.1 浮點數
4.1.1 單精度和雙精度浮點數
4.1.2 16位浮點數
4.2 定點數
4.2.1 定點數的二進製表示形式
4.2.2 定點數的運算
4.2.3 給定算法的定點化方法
4.3 仿射映射量化
4.3.1 量化數據表示
4.3.2 量化數據運算
4.3.3 基於量化數據的矩陣運算
4.4 常數整數乘法優化
4.4.1 基於正則有符號數的常數整數乘法優化
4.4.2 基於運算圖的常數整數乘法優化
4.4.3 多常數整數乘法優化
4.4.4 浮點數和整數常數乘法優化
4.4.5 常數整數乘法優化的應用
4.5 小結
參考文獻
第5章 捲積運算優化
5.1 捲積運算的定義
5.1.1 一維線性捲積
5.1.2 一維循環捲積
5.1.3 二維線性捲積
5.1.4 二維循環捲積
5.2 快速捲積算法
5.2.1 一維循環捲積頻域快速算法
5.2.2 短序列一維線性捲積快速算法
5.2.3 長序列一維線性捲積的構建
5.2.4 快速FIR濾波器算法
5.2.5 二維快速捲積算法
5.3 近似捲積算法
5.3.1 基於捲積核低秩分解的二維快速捲積
5.3.2 矩形捲積核近似捲積
5.3.3 分段線性捲積核近似
5.3.4 捲積核的分段近似
5.3.5 基於IIR濾波器的近似捲積
5.3.6 基於捲積核低秩近似的二維近似快速捲積
5.3.7 基於二維矩形捲積核的近似快速捲積
5.4 小結
參考文獻
第6章 矩陣乘法優化
6.1 機器學習算法中的矩陣乘法
6.2 Strassen矩陣相乘算法
6.3 Winograd矩陣相乘算法
6.4 低秩矩陣乘法
6.5 循環矩陣乘法
6.6 近似矩陣乘法
6.6.1 基於矩陣低秩近似的矩陣乘法
6.6.2 基於數據統計相關性的近似矩陣乘法
6.6.3 基於向量量化的近似矩陣乘法
6.7 小結
參考文獻
第7章 神經網絡的實現與優化
7.1 神經網絡基本運算及軟件實現
7.1.1 全連接層運算
7.1.2 捲積層運算
7.1.3 BN層運算
7.1.4 激活層運算
7.1.5 池化層運算
7.1.6 神經網絡示例
7.2 神經網絡的權重係數優化
7.2.1 權重係數二值化
7.2.2 權重係數的定點數量化
7.2.3 權重係數量化和神經網絡訓練結合
7.3 神經網絡結構優化
7.3.1 剪枝優化
7.3.2 捲積結構優化
7.3.3 知識蒸餾
7.4 小結
參考文獻
第8章 ARM平臺上的機器學習編程
8.1 CMSIS軟件框架概述
8.2 CMSIS-DSP軟件框架和編程
8.2.1 矩陣運算
8.2.2 高斯樸素貝葉斯算法實現
8.2.3 SVM算法實現
8.2.4 數據降維
8.3 基於CMSIS-NN的神經網絡編程
8.3.1 基於捲積神經網絡的手寫數字識別算法
8.3.2 CMSIS-NN的捲積神經網絡實現
8.3.3 捲積神經網絡的定點化
8.3.4 數據存儲和格式轉換
8.4 ARM Compute Library軟件框架和編程
8.4.1 基於ACL庫的圖像處理編程
8.4.2 基於ACL庫的神經網絡編程
8.5 ARM NN軟件框架和編程
8.5.1 基於ARM NN運行神經網絡模型
8.5.2 基於ONNX格式的機器學習模型構建
8.6 ARM的SIMD指令編程
8.6.1 NEON編程的基本概念和數據寄存器
8.6.2 基於C語言的NEON編程
8.7 小結
附錄A 補充數據和列表
附錄B 技術術語表
