大模型垂直領域低算力遷移 微調、部署與優化
程戈
- 出版商: 機械工業
- 出版日期: 2025-01-01
- 售價: $534
- 貴賓價: 9.5 折 $507
- 語言: 簡體中文
- 頁數: 210
- ISBN: 7111767675
- ISBN-13: 9787111767671
-
相關分類:
Large language model
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$455ESP32 物聯網智能硬件開發實戰 (視頻講解版) -
穿越作業系統迷霧:從零實現作業系統$594$564 -
新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程$980$774 -
LLM 走進你的電腦 - 自己動手開發大型語言模型應用$880$695 -
$356物聯網 Python 開發實戰, 2/e -
$469AI繪畫 + LoRA 模型訓練從新手到高手 -
$403單片機三劍客:51單片機與 C語言編程 -
$502單片機三劍客:STM32 單片機與 C語言編程 -
$449單片機三劍客:ESP32 單片機與 Python 語言編程 -
AI 繪畫工坊:Stable Diffusion 從入門到實踐(68集視頻課+40個繪畫案例)$599$569 -
Stable Diffusion AI 繪畫全面貫通:生成參數 + 提示詞庫 + 模型訓練 + 插件擴展$594$564 -
開源閉源 LLM 應用 - 從微調到 RAG、Agent 完整開發實作$880$695 -
AI + ESP32-CAM + AWS:物聯網與雲端運算的專題實作應用$650$507 -
AI 獨家解密 - DALL·E、Midjourney、Stable Diffusion Python 打開圖片生成原理潘朵拉盒子$980$774 -
利用 Python 駕馭 Stable Diffusion:原理解析、擴展開發與高級應用$654$621 -
不加班也能升職!49天打造你的 AI 工作流:Z世代數位分身放大絕$720$569 -
圖像生成 AI Stable Diffusion 實作技法書:從設定、生成到調整,全面掌握 AI 繪圖實戰技!$550$413 -
$594零基礎實戰 AI 大模型:原理、構建與優化 -
完整複習 NLP - 圍繞 LLM 打造自然語言處理應用$1,080$853 -
大模型工程師面試:算法原理、開發實踐與系統部署$714$678 -
現代 AI 是這麼做出來的 - 從訓練、演算法到微調全實作$880$695 -
生成式 AI 開發實作|使用 Transformers 與擴散模型 (Hands-On Generative AI with Transformers and Diffusion Models)$980$774 -
LLM 應用開發 - 業界最實用 30個應用現場直擊$920$727 -
LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent$980$774 -
Grafana Zero to Hero:從視覺化到智慧監控,打造全知視角的可觀測性平台(iThome鐵人賽系列書)$720$562
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書是一本深度探討大模型在低算力環境下實現遷移與微調的實踐指南,並深入講解了大模型的部署與優化策略。書中結合多個垂直領域的應用場景,從理論到技術實現,全程詳盡講解瞭如何應對大模型在行業落地中的技術挑戰,幫助讀者逐步掌握大模型的遷移與微調核心技術。 通過閱讀本書,你將能夠: (1)全面理解垂直領域遷移方式與技術選型 深入瞭解開源大模型向垂直領域遷移的核心方式,包括提示工程、檢索增強生成、參數高效微調與全參數微調等技術路徑,並靈活應對低算力場景下的遷移技術挑戰。 (2)快速獲取高質量領域數據的低成本方案 學習通過指令自舉、無監督標註、自我策展等方法構建高質量數據集,同時掌握數據清洗、去重和質量過濾等關鍵技術,顯著降低數據獲取成本。 (3)掌握低算力環境下的訓練與推理優化技術 全面掌握低算力訓練與微調方法(如LoRA和QLoRA),並結合推理優化技術(如量化、剪枝和模型編譯),高效實現低成本的大模型訓練與推理。 (4)精通大模型的生產環境部署與優化 系統學習生產環境中大模型的部署方案,涵蓋服務器推理加速、分佈式集群架構和多平臺適配技術,確保模型在實際應用中的高效、安全運行。 無論你是大模型開發者、人工智能研究人員,還是對垂直領域AI應用感興趣的行業專家,本書都將帶你深入大模型的核心領域,提供從構建、優化到部署的全流程指導,助你掌握這一前沿技術的實踐精髓
作者簡介
程戈,博士生導師,湘潭大學計算機學院·網絡空間安全學院教授,湘潭大學技術轉移中心副主任,湘潭市京東智能城市與大數據研究院副院長,智慧司法與數字治理湖南省重點實驗室副主任,CCF計算法學會執委。大模型領域技術專家和佈道者,作為兩項科技部國家重點研發子課題的負責人,與成都數之聯等多家企業合作推動人工智能在司法領域的落地,帶領團隊開發了JusticeGPT司法大模型,不同於其他的以提升司法領域知識問答能力為核心的司法大模型,該大模型致力於提升司法文獻檢索增強生成以及司法文檔的多跳信息聚合能力,並通過特定的多任務表徵與控制指令生成框架重構司法信息化系統的業務中臺,實現司法業務編排以及工作流自動化。
目錄大綱
前言
第1章 垂直領域大模型的行業變革與機遇
1.1 大模型下的行業變革
1.1.1 大模型的iPhone時刻
1.1.2 大模型的全行業重塑
1.1.3 勞動力市場的變革
1.2 垂直領域大模型遷移的動機
1.2.1 商業價值
1.2.2 行業技術護城河
1.2.3 領域數據優勢
1.3 垂直領域大模型遷移的機遇
第2章 垂直領域遷移技術棧
2.1 垂直領域遷移的方式
2.1.1 提示工程
2.1.2 檢索增強生成
2.1.3 參數高效微調
2.1.4 全參數微調
2.1.5 從頭預訓練
2.1.6 垂直領域遷移低算力技術選型
2.2 低算力微調
2.3 推理優化
2.3.1 模型編譯
2.3.2 模型壓縮
2.3.3 模型分區
第3章 大模型的開源生態
3.1 大模型的開源社區
3.1.1 Meta
3.1.2 HuggingFace
3.1.3 微軟
3.1.4 英偉達
3.2 開源生態下基座模型選擇的關鍵指標
3.2.1 參數規模
3.2.2 訓練Token
3.2.3 上下文窗口
3.2.4 綜合評測
3.2.5 商業許可
3.3 開源基座模型LLaMA系列
3.3.1 LLaMA
3.3.2 LLaMA
3.3.3 商用限制
第4章 自舉領域數據的獲取
4.1 指令自舉標註
4.2 自舉無監督標註
4.2.1 指令生成階段
4.2.2 答案生成階段
4.2.3 過濾和修剪階段
4.3 自我策展
4.3.1 初始化階段
4.3.2 自我增強階段
4.3.3 自我策展階段
4.4 自我獎勵
4.4.1 種子數據
4.4.2 自我指令創建
4.4.3 指令遵循訓練
4.4.4 疊代訓練
第5章 數據處理
5.1 數據處理的挑戰
5.2 數據質量
5.2.1 文本提取
5.2.2 數據去重
5.2.3 質量過濾
5.2.4 內容毒性過濾
5.3 高效數據集訪問
5.3.1 數據集來源
5.3.2 列式內存格式
5.3.3 向量化計算
5.3.4 零覆制數據交換
5.3.5 虛擬內存
第6章 大模型抽象
6.1 計算圖
6.2 靜態計算圖
6.3 動態計算圖
6.4 算子優化與調度
6.4.1 計算圖與算子優化
6.4.2 計算圖與算子調度
6.4.3 串行調度與並行調度
6.5 大模型中的張量與算子
6.5.1 輸入層
6.5.2 自註意力層
6.5.3 前饋網絡層
6.5.4 輸出層
6.6 大模型的序列化
6.6.1 序列化文件的類型
6.6.2 TensorFlow模型序列化
6.6.3 PyTorch模型序列化
6.6.4 Safetensors序列化格式
第7章 LoRA低算力微調
7.1 LoRA的原理
7.2 LoRA的重參數化方法
7.3 秩的選擇
7.4 LoRA的多任務處理策略
7.5 LoRA量化版本QLoRA
7.6 LoRA微調類型
7.6.1 繼續預訓練
7.6.2 RLHF
7.6.3 DPO
第8章 大模型的分佈式訓練
8.1 分佈式訓練的挑戰
8.1.1 算力與內存瓶頸
8.1.2 分佈式訓練系統的設計挑戰
8.2 分佈式集群架構
8.2.1 GPU集群架構
8.2.2 集合通信算子
8.2.3 通信拓撲
8.3 分佈式訓練的通信架構
8.3.1 基於參數服務器的架構
8.3.2 基於歸約的架構
8.4 並行模式
8.4.1 數據並行
8.4.2 張量並行
8.4.3 流水線並行
8.4.4 並行模式的對比
8.5 大模型的張量並行
8.5.1 輸入層
8.5.2 輸出層
8.5.3 多層感知機
8.5.4 自註意力
8.6 數據並行的內存優化
8.6.1 設備內存占用
8.6.2 ZeRO技術
8.6.3 ZeRO-Offload技術
第9章 推理優化技術
9.1 計算加速
9.1.1 算子融合
9.1.2 並行推理
9.2 內存優化
9.2.1 KV緩存
9.2.2 頁註意力
9.2.3 快速註意力
9.3 吞吐量優化
9.3.1 內存I/O瓶頸
9.3.2 靜態批處理
9.3.3 連續批處理
9.3.4 動態分割融合
9.4 量化
9.4.1 量化的動機
9.4.2 量化的原理
9.4.3 LLM.int8()
9.4.4 GPTQ
第10章 大模型的編譯優化
10.1 深度學習編譯與大模型編譯
10.1.1 深度學習編譯
10.1.2 多級漸進優化
10.1.3 硬件優化偏好
10.1.4 大模型的編譯特點
10.2 深度學習框架
10.2.1 深度學習框架
10.2.2 不同階段的編譯優化
10.3 訓練階段的編譯優化
10.3.1 訓練前優化
10.3.2 訓練優化庫
10.4 端側部署的編譯優化
10.4.1 深度學習框架的端側部署工具
10.4.2 第三方編譯工具
10.4.3 大模型的手動編譯優化
10.5 服務器端部署的編譯優化
第11章 大模型部署的非性能需求
11.1 內容安全
11.1.1 內容安全的分類
11.1.2 應對策略
11.2 水印
11.2.1 主要檢測技術的對比
11.2.2 大模型水印框架
11.2.3 水印攻擊技術
11.3 監控
1l.3.1 監控流程
11.3.2 大模
