買這商品的人也買了...
-
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)$580$458 -
生成深度學習|訓練機器繪畫、作曲、寫作與玩遊戲 (Generative Deep Learning)$580$458 -
Ubuntu Linux Bible$1,800$1,710 -
架構師的自我修煉:技術、架構和未來$534$507 -
Designing Software Synthesizer Plugins in C++: With Audio DSP (Paperback)$2,400$2,280 -
$327學習的學問:走出低效與無序的實踐法則 -
$374虛擬現實與增強現實技術 -
性能之巔:系統、企業與雲可觀測性, 2/e$1,428$1,357 -
敏捷硬件開發語言 Chisel 與數字系統設計$414$393 -
馬同學圖解線性代數$768$730 -
會動的演算法:61 個演算法動畫+全圖解逐步拆解,人工智慧、資料分析必備$620$490 -
AI 編譯器開發指南$714$678 -
高性能超標量 CPU:微架構剖析與設計$714$678 -
$403深度學習與音樂生成 -
跟 NVIDIA 學深度學習!從基本神經網路到 ......、GPT、BERT...,紮穩機器視覺與大型語言模型 (LLM) 的建模基礎$880$748 -
CPU 製作入門:基於 RISC-V 和 Chisel$588$559 -
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
$378C++ 設計模式 -
算力芯片 — 高性能 CPU / GPU / NPU 微架構分析$774$735 -
這樣寫 code 好不好?辨識、分析、改善,寫出易讀易維護的程式碼$630$498 -
LLVM 編譯器原理與實務$834$792 -
深度學習編譯器設計$534$507 -
生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507 -
生成式 AI x RAG x Hugging Face 提示工程打造數據採樣神技$980$774
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
79折
$564CUDA 並行編程與性能優化 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
79折
$469GitHub Copilot 編程指南 -
87折
$469Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL 計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
79折
$469GitHub Copilot 編程指南 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講 -
79折
$275零基礎玩轉國產大模型DeepSeek -
VIP 95折
人工智能大模型:機器學習基礎$774$735 -
VIP 95折
RAG 極簡入門:原理與實踐$419$398 -
VIP 95折
大模型實戰 : 從零實現 RAG 與 Agent 系統$419$398 -
VIP 95折
算法趣學(第2版)$348$331 -
VIP 95折
大模型理論與實踐——打造行業智能助手$354$336 -
85折
$509生成式人工智能 (基於 PyTorch 實現) -
VIP 95折
Java 學習筆記, 6/e$839$797 -
VIP 95折
ZBrush遊戲角色設計(第2版)$479$455 -
VIP 95折
軟件架構決策之道:軟件架構決策的原則和方法$534$507 -
79折
$374DeepSeek + Dify + Ollama 全棧 AI 開發實戰 (前端本地部署到大模型集成訓練)
相關主題
商品描述
本書全面解析TVM的主要功能,幫助讀者理解TVM運作原理,以及使用TVM對深度學習與機器學習進行最佳化與部署。
本書結合作者多年的工作與學習經驗,力求將TVM基礎理論與案例實踐融合在一起進行詳細講解。
全書共有9章,包括TVM基本知識,使用TVM開發,算符融合與圖優化,TVM量化技術,TVM優化調度,
RelayIR,程式碼生成,後端部署與OpenCL(OpenComputingLanguage,開放運算語言),自動調度、自動搜尋與成本模型。
各章除了包含重要的知識點和實務技能外,還配備了精心挑選的典型案例。
作者簡介
吳建明,上海交通大學模式識別與智慧系統專業博士畢業。長期從事人工智能芯片設計,尤其擅長TVM/LLVM編譯器、AI框架、自動駕駛、芯片製造,嵌入式系統等領域的理論研究與技術創新。長期在第一線工作,包括產品設計與程式碼實現等,主持及參與過30多項產品的研發。也曾參與國家自然科學基金、上海市科委項目,並在核心期刊公開發表8篇論文,其中6篇為第一作者。
目錄大綱
第1章 TVM基本知識/
1.1TVM基本原理/
1.1.1TVM概述/
1.1.2TVM 模型最佳化部署概述/
1.2TVM編譯過程/
1.2.1編譯流程/
1.2.2TVM編譯資料結構/
1.2.3TVM編譯資料處理/
1.2.4TVM的Pass過程/
1.3TVM開源工程邏輯架構/
1.3.1程式碼庫程式碼結構/
1.3.2程式碼自動內核/
1.4TVM應用支援/
1.4.1TVM的工作流程/
1.4.2支援多語言與多平臺/
1.4.3TVM應用場景/
1.4.4TVM優化模型推理/
1.4.5TVM編譯器與運行時組件/
1.4.6TVM運行時主要模組/
1.4.7TVM簡單程式碼生成編譯範例/
1.4.8TVM各模組之間的關係/
1.5TVM特色與挑戰/
1.5.1TVM特色/
1.5.2支援多種後端設備/
1.5.3TVM應對的挑戰/
第2章 使用TVM開發/
2.1配置TVM環境/
2.1.1apache TVM源碼下載/
2.1.2配置TVM的開發環境/
2.1.3TVM conda環境使用方法/
2.1.4編譯實作/
2.1.5導入模型方法/
2.2在conda環境編譯最佳化TVM yolov3範例/
2.3Python與C++的呼叫關係/
2.3.1TVM中底層C++資料結構/
2.3.2進行函數註冊/
2.3.3上層Python呼叫/
2.4TVM自訂程式碼範例/
2.4.1TVM如何添加代碼/
2.4.2TVM程式碼生成實作範例/
2.5用TVM實現演算法全流程/
2.5.1配置張量與建立調度/
2.5.2進行降級算子優化/
2.5.3建置host目標程式/
2.5.4實現後端程式碼產生/
第3章 算子融合與圖形最佳化/
3.1算子概述/
3.1.1TVM融合組件範例/
3.1.2最佳化計算圖/
3.2圖GCN融合/
3.2.1圖的概念/
3.2.2深度學習新特徵/
3.3圖融合GCN範例/
3.3.1GCN的PyTorch實作/
3.3.2融合BN與Conv層/
3.4TVM圖優化與算子融合/
3.4.1圖與算子優化/
3.4.2自訂算子/
3.4.3算子融合步驟/
3.4.4在Relay中加入operator/
3.5端到端優化/
3.5.1 AI框架概述/
3.5.2計算圖優化層/
3.5.3TVM算子融合的4種方法/
3.5.4資料佈局轉換/
3.5.5張量表達式語言/
3.5.6調度空間分析/
3.6 TVM圖優化與算子融合方案分析/
3.6.1圖優化框架分析/
3.6.2TVM優化基礎分析/
3.6.3TVM優化參數/
3.6.4算子優化圖示/
3.6.5自訂圖級優化/
3.7支配樹技術/
3.7.1支配樹概述/
3.7.2算子融合方案及範例/
3.8控制流與優化器/
3.8.1控制流/
3.8.2優化器/
3.9TVM儲存與調度/
3.9.1TVM編譯器最佳化/
3.9.2圖結構基本優化/
3.9.3張量計算/
3.10多功能張量加速器VTA/
3.10.1VTA-TVM 硬件-軟件堆疊/
3.10.2VTA主要功能/
3.10.3VTA範例/
3.10.4VTA計算模組/
3.10.5VTA控制/
3.10.6microTVM模型/
3.11TVM程式碼庫結構與範例/
3.11.1程式碼庫結構/
3.11.2張量新增範例/
3.12主機驅動的執行/
3.12.1 firmware二進制檔案/
3.12.2計算聲明/
3.12.3資料平鋪/
3.12.4捲積運算/
3.12.5空間填充/
第4章 TVM量化技術/
4.1TVM量化概述/
4.1.1TVM量化現狀/
4.1.2TVM量化原理/
4.2int8量化與TVM執行/
4.2.1兩種主要量化方案/
4.2.2int8量化原理分析/
4.2.3KL散度計算/
4.2.4實現int8量化/
4.3低精度訓練與推理/
4.4NN量化/
4.4.1神經網絡量化概述/
4.4.2優化數據與網絡/
4.4.3前向推理與反向傳播/
4.5熵校準範例/
4.6TVM量化流程/
4.6.1Relay的兩種平行量化/
4.6.2Relay優化Pass方法/
4.6.3量化處理硬件說明/
4.6.4閾值估計方案/
4.6.5模擬量化誤差/
4.6.6尺度計算/
4.6.7資料類型分配/
4.6.8資料類型分配日誌/
4.6.9神經網絡低精度量化/
4.7TVM量化程序分析/
第5章 TVM最佳化調度/
5.1TVM 運行時系統/
5.1.1TVM 運行時系統框架/
5.1.2PackedFunc編譯與部署/
5.1.3建置 PackedFunc模組/
5.1.4遠端部署方法/
5.1.5TVM 物件與編譯器分析/
5.2自動微分靜態圖與動態圖/
5.2.1計算圖分類/
5.2.2動態圖實現範例/
5.3機器學習自動微分/
5.3.1微分法/
5.3.2手動微分/
5.3.3數值微分/
5.3.4符號微分/
5.3.5自動微分/
5.3.6自動微分實現範例/
5.4稀疏矩陣分析/
5.4.1稀疏矩陣概念/
5.4.2稀疏矩陣最佳化/
5.4.3特定矩陣壓縮儲存/
5.4.4稀疏矩陣實現範例/
5.5TVM張量計算分析/
5.5.1產生張量運算/
5.5.2嵌套並行與協作/
5.5.3張量化計算/
5.5.4顯式內存延遲隱藏/
第6章 Relay IR/
6.1TVM數據介紹/
6.1.1TVM模組框架介紹/
6.1.2Relay IR原理簡介/
6.1.3建構計算圖/
6.1.4let綁定與作用域/
6.2IR代碼產生/
6.2.1前端優化/
6.2.2節點優化/
6.2.3代數優化/
6.2.4資料流層級的最佳化/
6.3在Relay中註冊算子/
6.3.1新增節點,定義編譯參數/
6.3.2運算類型關係分析/
6.3.3在C++中進行RELAY_REGISTER_OP宏註冊/
6.3.4算子註冊與調度/
6.3.5註冊函數API分析/
6.3.6將Python API打包/
6.3.7單元測試分析/
6.4TVM中IR範例/
6.4.1IRModule技術分析/
6.4.2TVM Runtime(運行時)分析/
6.4.3預測部署實現/
6.4.4動態圖實作/
