零基礎實戰 AI 大模型：原理、構建與優化

袁重橋

出版商: 化學工業
出版日期: 2025-09-01
定價: $594
售價: 7.9 折 $469
語言: 簡體中文
頁數: 253
ISBN: 712248193X
ISBN-13: 9787122481931
相關分類: Large language model

立即出貨

買這商品的人也買了...

$517

穿越作業系統迷霧：從零實現作業系統
~~$980~~ $774

新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程
~~$880~~ $695

LLM 走進你的電腦 - 自己動手開發大型語言模型應用
$356

物聯網 Python 開發實戰, 2/e
$469

AI繪畫 + LoRA 模型訓練從新手到高手
$331

單片機三劍客：51單片機與 C語言編程
$448

單片機三劍客：STM32 單片機與 C語言編程
$448

單片機三劍客：ESP32 單片機與 Python 語言編程
$509

AI 繪畫工坊：Stable Diffusion 從入門到實踐（68集視頻課+40個繪畫案例）
~~$594~~ $564

Stable Diffusion AI 繪畫全面貫通：生成參數 + 提示詞庫 + 模型訓練 + 插件擴展
$453

大模型垂直領域低算力遷移微調、部署與優化
~~$880~~ $695

開源閉源 LLM 應用 - 從微調到 RAG、Agent 完整開發實作
~~$650~~ $507

AI + ESP32-CAM + AWS：物聯網與雲端運算的專題實作應用
~~$980~~ $774

AI 獨家解密－ DALL·E、Midjourney、Stable Diffusion Python 打開圖片生成原理潘朵拉盒子
~~$654~~ $621

利用 Python 駕馭 Stable Diffusion：原理解析、擴展開發與高級應用
~~$720~~ $568

不加班也能升職！49天打造你的 AI 工作流：Z世代數位分身放大絕
~~$550~~ $434

圖像生成 AI Stable Diffusion 實作技法書：從設定、生成到調整，全面掌握 AI 繪圖實戰技！
~~$1,200~~ $948

AI 工程｜從基礎模型建構應用 (AI Engineering : Building Applications with Foundation Models)
~~$1,080~~ $853

完整複習 NLP - 圍繞 LLM 打造自然語言處理應用
~~$714~~ $678

大模型工程師面試：算法原理、開發實踐與系統部署
~~$880~~ $695

現代 AI 是這麼做出來的 - 從訓練、演算法到微調全實作
~~$980~~ $774

生成式 AI 開發實作｜使用 Transformers 與擴散模型 (Hands-On Generative AI with Transformers and Diffusion Models)
~~$920~~ $726

LLM 應用開發 - 業界最實用 30個應用現場直擊
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
~~$720~~ $561

Grafana Zero to Hero：從視覺化到智慧監控，打造全知視角的可觀測性平台（iThome鐵人賽系列書）

商品描述

本書系統講解了大模型的技術體系與應用實踐。全書在深入解析Transformer和GPT系列模型的核心原理的基礎上，重點講解Llama開源模型的訓練調優及行業應用開發，並對文生圖、文生視頻乃至多模態等前沿技術進行了探討。本書內容系統全面，涵蓋從基礎架構到前沿技術的完整知識體系，註重理論與實踐相結合，通過精選開源項目案例，引導讀者在代碼實踐中理解技術本質。

目錄大綱

第一章大語言模型基礎知識
第一節 LLM基礎
一、LLM概述
二、大模型存在的問題
三、檢索增強生成（RAG）
四、大模型的改進方法
第二節 GPT模型介紹
一、GPT模型的發展歷程
二、GPT模型的關鍵論文
三、GPT模型的結構可視化
第三節開源、工具和實戰
第二章大語言模型的技術細節
第一節大語言模型的全局視圖
第二節註意力機制
一、自註意力機制
二、多頭註意力機制
第三節編碼、嵌入和神經網絡
一、位置編碼
二、旋轉位置編碼
三、字段編碼
四、前饋網絡
五、層歸一化
第四節權重、參數和訓練策略
一、權重
二、Transformer的訓練策略和優化方法
三、Transformer模型的正則化技術
四、註意力機制的變種和改進
五、Transformer模型微調的常見策略
第五節更多原理剖析
一、零樣本提示
二、少量樣本提示
三、Transformer模型中的殘差連接
四、文本生成源碼解讀
第六節大模型的能與不能
一、人工智能的大工業時代
二、ChatGPT不等於人工智能
第七節圖示Transformer和實戰GPT
一、圖示Transformer
二、實戰GPT
第八節實戰：手動部署大模型
第三章開源大模型和Llama實戰
第一節 Llama的結構
第二節運行Llama
第三節 Llama微調
一、微調的步驟
二、微調的方法
三、微調所需的基礎知識
第四節實戰：大語言模型(LLM)微調框架
第四章中文Llama模型
第一節中文數據準備
一、中文數據處理的技術
二、中文數據處理的過程
三、中文數據處理的工具
第二節基於中文數據的模型訓練
一、指令數據搜集和處理
二、AdaLoRA算法剖析
三、大模型指令微調之量化
四、大模型壓縮技術
五、大模型蒸餾技術
第三節模型評測
第四節人類反饋的集成
第五節實戰：中文應用開發
一、基於Llama的醫學大模型的開源項目
二、基於Llama的法律大模型的開源項目
三、基於Llama的金融大模型的開源項目
四、基於Llama的科技論文大模型的開源項目
第五章實戰大語言模型應用
第一節大模型的基礎設施創新
一、數據庫創新開源項目
二、將自然語言問題轉換為SQL查詢
三、將大模型數據查詢SQL化
第二節基於大模型的應用創新
一、基於LLM的開源代碼編寫助手
二、開源數據交互工具
三、領先的文檔GPT開源項目
第三節大模型的優化和發展創新
一、開源的大模型用戶分析平臺
二、低代碼方式搭建大模型
三、開源搜索增強RAG項目
第四節 Agent技術
一、微軟開源的強大Agent——AutoGen
二、讓Agent去完成RPA
三、讓Agent去標註數據——Adala
第六章開源文生圖
第一節文生圖技術概述
一、生成對抗網絡（GANs）介紹
二、GANs在圖片生成方面的應用
三、GANs圖片應用的說明和原理
第二節開源文生圖模型介紹
一、Stable Diffusion介紹
二、LDMs介紹
三、DALL-E和Stable Diffusion
第三節開源文生圖模型技術要點
一、LDMs的源代碼導讀
二、用一個案例說明Stable Diffusion
三、實戰：部署開源項目stable-diffusion-webui
第四節實戰：打造基於開源的文生圖應用
第七章開源文生視頻
第一節開源文生視頻介紹
第二節文生視頻技術難點和路線
一、文生視頻技術難點
二、開源文生視頻路線
第三節開源文生視頻應用
第八章開源多模態
第一節多模態介紹
第二節多模態的技術細節
一、GPT-4o的多模態介紹
二、視覺指令調整
第三節開源多模態案例
一、LLaVA實現GPT-4V級別的開源多模態
二、開源LLaVA-1.5介紹
三、MGM：一個強大的多模態大模型
第九章 DeepSeek實戰
第一節 DeepSeek核心技術介紹
一、混合專家架構
二、多頭潛在註意力機制
三、混合精度訓練
第二節 DeepSeek-R1模型覆現
第三節 DeepSeek-V3本地化源碼級部署
一、使用DeepSeek-Infer進行推理演示
二、基於華為硬件的DeepSeek部署
第四節基於DeepSeek的開源應用
一、基於DeepSeek的PPT生成系統
二、DeepSeek支持的可視化BI解決方案
三、DeepSeek支持的健康分析平臺
四、DeepSeek支持的智能測試用例生成平臺
五、可本地化部署的企業級DeepSeek知識管理平臺
六、基於DeepSeek的智能體RPA

零基礎實戰 AI 大模型：原理、構建與優化

袁重橋

買這商品的人也買了...

商品描述

目錄大綱

類似商品

最後瀏覽商品 (20)