探秘大模型應用開發
李瀚 徐斌
- 出版商: 電子工業
- 出版日期: 2025-02-01
- 定價: $648
- 售價: 8.5 折 $551
- 語言: 簡體中文
- 裝訂: 平裝
- ISBN: 7121496569
- ISBN-13: 9787121496561
-
相關分類:
Large language model
立即出貨
買這商品的人也買了...
-
$401矽基物語.AI大爆炸 -
$454自然語言處理與應用 -
$331LangChain 編程:從入門到實踐 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 -
$414大語言模型通識 -
$284大語言模型基礎(微課視頻版) -
$301自然語言處理——基於深度學習的理論和實踐(微課視頻版) -
$454LangChain 大模型 AI 應用開發實踐 -
生成式 AI 實戰基於 Transformer、Stable Diffusion、LangChain 和 AI Agent$479$455 -
$378AI 原生應用開發:提示工程原理與實戰 -
$505大模型應用開發 核心技術與領域實踐 -
深度剖析 DeepSeek 大模型 : 原理開發與優化部署$714$678 -
$607語音識別:原理與應用, 3/e -
$347生成式人工智能(教師應用指南) -
多模態大模型:從理論到實踐$594$564 -
$332大模型應用開發極簡入門(基於DeepSeek雙色版) -
$3525G+智慧教育 -
深入淺出人工智能 — 原理、技術與應用$479$455 -
深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 -
$534DeepSeek 圖解:大模型是怎樣構建的 -
大語言模型認識與應用$414$393 -
語言之舞:大語言模型應用實戰全書$594$564 -
$374大語言模型極速入門:技術與應用 -
大模型核心技術與應用 (微課視頻版)$474$450 -
AI 工程|從基礎模型建構應用 (AI Engineering : Building Applications with Foundation Models)$1,200$948
相關主題
商品描述
《探秘大模型應用開發》圍繞著大模型的生產實施流程,系統介紹大模型的應用實務方法。
第一分系統地介紹了機器學習的場景分類、深度學習的崛起以及基礎模型。
第二分聚焦於應用挑戰,詳細講解問題定義、流程、技術,括嵌入與標記化、向量數據庫、微調、署與推理等。
另外,展示了LLM相關的編排與整合策略,以及兩個實際索引技術的案例。
本書不僅介紹了應用案例,還對前沿技術和未來發展進行了展望,括可解釋性、GANs、強化學習和模型自動化。
團隊協作、專案管理和持續整合等實踐內容也充分涵蓋。
後,透過一個實作案例章節,讀者學習如何調試、署和維運大模型的LLM應用。
這本書將幫助從業者掌握從基礎概念到實際應用的整個過程,使他們能夠建立穩健的應用,將機器學習和深度學習引入現實。
作者簡介
徐斌,擁有10年以上的網絡安全經驗,在矽谷領先的網絡安全公司從事數據分析平臺的設計開發工作。精通網絡安全防護、漏洞分析與滲透測試,尤其擅長結合數據分析和AI技術優化安全系統的檢測與響應能力,如通過深度學習、機器學習等AI技術分析大量的安全數據,實時發現潛在威脅,提升安全防護的效率。
目錄大綱
第1章 AI 2.0時代到來
1.1 ChatGPT旋風
1.1.1 ChatGPT是什麼
1.1.2 豐富的應用
1.1.3 有喜有憂
1.2 認識AI 2.0時代
1.2.1 何謂大模型
1.2.2 AI 1.0時代與AI 2.0時代特點分析
1.2.3 新“工業革命”來臨
1.3 本章小結
第2章 基座大模型準備
2.1 大模型的歷史與未來
2.1.1 發展史
2.1.2 未來趨勢
2.2 基座大模型訓練過程
2.2.1 預訓練
2.2.2 人類反饋的強化學習
2.3 選擇合適的基座大模型
2.3.1 主流基座大模型介紹
2.3.2 選型標準
2.4 本章小結
第3章 GPU相關知識
3.1 基礎知識
3.1.1 顯卡與GPU
3.1.2 GPU與CPU
3.2 GPU的優勢
3.2.1 GPU與深度學習
3.2.2 CUDA編程
3.3 準備合適的GPU
3.3.1 選擇合適的GPU(顯卡)供應商
3.3.2 英偉達與AMD
3.3.3 英偉達GPU各項參數
3.3.4 選型建議
3.4 本章小結
第4章 應用開發概覽
4.1 關鍵概念
4.1.1 提示
4.1.2 上下文學習
4.2 應用趨勢
4.2.1 趨勢變遷
4.2.2 產品形態
4.3 技術實現
4.3.1 對齊方法
4.3.2 優劣勢比較
4.3.3 應用流程
4.4 本章小結
第5章 文檔處理
5.1 分塊
5.1.1 分塊的作用
5.1.2 分塊的策略
5.1.3 策略選擇
5.2 詞元化
5.2.1 概念和方法
5.2.2 Token采樣策略
5.3 嵌入
5.4 本章小結
第6章 向量數據庫
6.1 基本概念
6.2 相關算法
6.2.1 向量相似性算法
6.2.2 工程中常用的向量搜索折中算法
6.3 核心價值
6.4 定位
6.5 主流產品
6.6 本章小結
第7章 微調
7.1 背景與挑戰
7.1.1 背景知識
7.1.2 技術挑戰
7.2 參數高效微調技術
7.3 工具實踐
7.3.1 開源工具包
7.3.2 模型微調服務
7.4 本章小結
第8章 推理優化概論
8.1 優化目標
8.2 理論基礎
8.2.1 模型大小的指標
8.2.2 模型大小對推理性能的影響
8.2.3 大模型相關分析
8.3 常見優化技術
8.3.1 模型壓縮
8.3.2 Offloading
8.3.3 多GPU並行化
8.3.4 高效的模型結構
8.3.5 FlashAttention
8.3.6 PagedAttention
8.3.7 連續批處理
8.4 本章小結
第9章 部署推理工具
9.1 推理架構概述
9.2 Web服務
9.2.1 Streamlit與Gradio
9.2.2 FastAPI與Flask
9.3 推理執行引擎
9.3.1 服務器端推理
9.3.2 端側推理
9.4 推理服務
9.5 對話類系統
9.6 本章小結
第10章 提示工程
10.1 理論與技術
10.1.1 提示的價值
10.1.2 應用領域
10.1.3 提示工程技術
10.2 開發工具
10.2.1 OpenAI Playground
10.2.2 Dify
10.2.3 PromptPerfect
10.3 本章小結
第11章 編排與集成
11.1 相關理論
11.1.1 面臨的問題
11.1.2 核心價值
11.1.3 功能構成
11.2 典型架構模式
11.2.1 RAG
11.2.2 Agent
11.3 常見編排框架
11.3.1 LangChain框架
11.3.2 Llamalndex框架
11.3.3 Semantic Kernel框架
11.4 本章小結
第12章 應用示例
12.1 整體架構
12.2 開發過程
12.2.1 環境準備
12.2.2 實現解析
12.2.3 打包部署
12.2.4 示例演示
12.3 本章小結
參考文獻
