全面掌握 DeepSeek - LLM 微調、生成式 AI、企業級應用開發
未來智慧實驗室 代晶
- 出版商: 碁峰資訊
 - 出版日期: 2025-05-15
 - 定價: $600
 - 售價: 7.9 折 $474
 - 語言: 繁體中文
 - 頁數: 448
 - ISBN: 6264250651
 - ISBN-13: 9786264250658
 - 
    相關分類:
    
      Large language model
 - 此書翻譯自: DeepSeek 原理與專案實戰大模型部署、微調與應用開發
 
立即出貨 (庫存 > 10)
買這商品的人也買了...
- 
                
                  
                  
                圖解多變量分析$350$315 - 
                
                  
                  
                $216生活中的統計學 - 
                
                  
                  
                成為 Git 專家的 18天學習計畫$520$411 - 
                
                  
                  
                Llama 大模型實踐指南$474$450 - 
                
                  
                  
                $658微服務下的領域驅動設計 - 
                
                  
                  
                LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 - 
                
                  
                  
                生成深度學習|訓練機器繪畫、寫作、作曲與玩遊戲, 2/e (Generative Deep Learning: Teaching Machines to Paint, Write, Compose, and Play, 2/e)$880$695 - 
                
                  
                  
                Microsoft Azure 學習手冊|雲端運算與雲端系統開發的關鍵知識 (Learning Microsoft Azure: Cloud Computing and Development Fundamentals)$880$695 - 
                
                  
                  
                邊緣 AI - 使用 NVIDIA Jetson Orin Nano 開發具備深度學習、電腦視覺與生成式 AI 功能的 ROS2 機器人$580$458 - 
                
                  
                  
                全解深度學習 — 九大核心算法$474$450 - 
                
                  
                  
                24小時精通 AI Agent (快速定製你的智能體)$534$507 - 
                
                  
                  
                生成式 AI 專案實踐指南:從模型挑選、上線、RAG 技術到 AI Agent 整合$650$507 - 
                
                  
                  
                無料 AI:ChatGPT + DeepSeek + Gemini + Perplexity + Copilot + Claude + NotebookLM + Coze + Felo + Dzine + ElevenLabs + Suno + Stable Audio + Runway + Sora + Gamma –「文字、筆記、搜尋、繪圖、動漫、視覺、語音、音效、音樂、影片、簡報」AI Agent – 創意無限$690$545 - 
                
                  
                  
                使用者體驗法則 |運用心理學原則設計更好的產品與服務, 2/e (Laws of UX: Using Psychology to Design Better Products & Services, 2/e)$580$458 - 
                
                  
                  
                Python 原力爆擊:OpenAI / Gemini / AWS / Ollama 生成式 AI 應用新手指南$650$507 - 
                
                  
                  
                深度學習最佳入門與專題實戰:理論基礎與影像篇$980$774 - 
                
                  
                  
                深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 - 
                
                  
                  
                GitHub Copilot 讓你寫程式快 10 倍!AI 程式開發大解放$690$545 - 
                
                  
                  
                多核心 CPU 加速程式 32倍 - 深入高平行開發深度原理及專案實戰, 2/e$880$695 - 
                
                  
                  
                $981深度學習:基礎與概念 - 
                
                  
                  
                統計分析入門與應用|SPSS 中文版 + SmartPLS 4 (CB-SEM + PLS-SEM), 5/e$920$727 - 
                
                  
                  
                深度學習詳解|台大李宏毅老師機器學習課程精粹$750$593 - 
                
                  
                  
                生成式 AI x RAG x Hugging Face 提示工程打造數據採樣神技$980$774 - 
                
                  
                  
                生成式 AI 提示工程|以前瞻性的設計打造穩定、可信任的 AI 解決方案 (Prompt Engineering for Generative AI: Future-Proof Inputs for Reliable AI Outputs)$880$695 - 
                
                  
                  
                LLM 最強重武裝 - RAG 開發應用優化現場直擊$980$774 
商品描述
⭐本書基於 DeepSeek-V3,並涵蓋最新版 DeepSeek-R1 解析與應用。
結合最新研究與實戰經驗,深入解析生成式 AI 技術,內容實用、操作簡單,
讓你立即掌握 DeepSeek 真實戰力!🚀
DeepSeek 是一種基於 Transformer 的生成式 AI(Artificial Intelligence)大模型,融合了 MoE 架構、混合精度訓練、分散式優化等先進技術,具備強大的文本生成、多模態處理以及任務客製化能力。
本書系統性地介紹了開源大模型 DeepSeek-V3 的核心技術及其在實際開發中的深度應用,並收錄最新版 DeepSeek-R1 推論大模型架構詳解,帶您緊跟技術發展的脈動。
• 核心技術拆解:從混合專家模型(MoE)、FP8 混合精度訓練,到上下文管理與 API 整合,掌握大模型關鍵技術。
• 應用實例豐富:涵蓋 NLP、程式生成、數學推理、多模態輸出等,案例詳實步驟清楚,學完即可實作。
• 進階提示技巧:教您運用對話前綴、FIM 生成、JSON 輸出等技巧,引導模型高效生成精準內容。
透過深入講解與實用案例,幫助讀者理解 DeepSeek 模型從原理到開發的完整流程,
無論你是剛踏入大語言模型世界的 AI 新手,還是正著手將生成式 AI 落地專案的技術開發者,
本書都能成為你實戰導入、快速上手的最佳攻略。現在就翻開本書,讓 DeepSeek 成為你的 AI 強力助手!
作者簡介
未來智慧實驗室(Future Intelligence Lab)由多位頂尖大學的博士與碩士組成,專注於大模型的研發與創新,聚焦於自然語言處理、深度學習、電腦視覺及多模態學習等領域。團隊致力於推動AI技術的突破,並為企業及開發者提供全方位的技術支援,協助複雜AI專案的高效開發與應用。
代晶畢業於清華大學,其研究領域涵蓋資料探勘與自然語言處理等。曾在IBM、VMware等知名企業擔任技術工程師超過十年,擁有紮實的技術基礎與廣泛的產業經驗。近年來,專注於大模型訓練、自然語言處理與模型優化等前沿技術,擁有敏銳的產業洞察力,熱衷於分享產業新動態,向大眾提供更有價值的知識內容,幫助更多人快速掌握AI領域的前沿知識。
目錄大綱
【Part I 生成式 AI 的理論基礎與技術架構】
Chapter 1 Transformer 與注意力機制的核心原理
 1.1 Transformer 的基本結構
 1.2 注意力機制的核心原理
 1.3 Transformer 的擴充與最佳化
 1.4 上下文視窗
 1.5 訓練成本與運算效能的平衡
 1.6 本章小結
Chapter 2 DeepSeek-V3 核心架構及其訓練技術詳解
 2.1 MoE 架構及其核心概念
 2.2 FP8 混合精度訓練的優勢
 2.3 DualPipe 演算法與通訊最佳化
 2.4 大模型的分散式訓練
 2.5 快取機制與Token 管理
 2.6 DeepSeek 系列模型
 2.7 本章小結
Chapter 3 基於 DeepSeek-V3 模型的開發導論
 3.1 大模型應用場景
 3.2 DeepSeek-V3 的優勢與應用方向
 3.3 Scaling Laws 研究與實踐
 3.4 模型部署與整合
 3.5 開發中的常見問題與解決方案
 3.6 本章小結
【Part II 生成式AI 的專業應用與 Prompt 設計】
Chapter 4 DeepSeek-V3 大模型初體驗
 4.1 對話生成與語意理解能力
 4.2 數學推理能力
 4.3 輔助程式設計能力
 4.4 本章小結
Chapter 5 DeepSeek 開放平台與 API 開發詳解
 5.1 DeepSeek 開放平台簡介
 5.2 DeepSeek API 的基礎操作與 API 介面詳解
 5.3 API 效能最佳化與安全策略
 5.4 本章小結
Chapter 6 對話生成、程式碼補全與客製化模型開發
 6.1 對話生成的基本原理與實作
 6.2 程式碼補全的實作邏輯與最佳化
 6.3 基於 DeepSeek 的客製化模型開發
 6.4 本章小結
Chapter 7 對話前綴續寫、FIM 與 JSON 輸出開發詳解
 7.1 對話前綴續寫的技術原理與應用
 7.2 FIM 生成模式解析
 7.3 JSON 格式輸出的設計與生成邏輯
 7.4 本章小結
Chapter 8 函式回呼與上下文硬碟快取
 8.1 函式回呼機制與應用場景
 8.2 上下文硬碟快取的基本原理
 8.3 函式回呼與快取機制的結合應用
 8.4 本章小結
Chapter 9 DeepSeek 提示庫:探索 Prompt 的更多可能
 9.1 程式碼相關應用
 9.2 內容生成與分類
 9.3 內角色扮演
 9.4 文學創作
 9.5 文案與宣傳
 9.6 模型提示詞與翻譯專家
 9.7 本章小結
【Part III 實戰與進階整合應用】
Chapter 10 整合實戰 1:基於 LLM 的 Chat 類客戶端開發
 10.1 Chat 類客戶端概述及其功能特點
 10.2 DeepSeek API 的配置與整合
 10.3 多模型支援與切換
 10.4 本章小結
Chapter 11 整合實戰 2:AI 助理開發
 11.1 AI 助理:AI 時代的啟動器
 11.2 DeepSeek API 在 AI 助理中的配置與應用
 11.3 智慧助手功能的實作與最佳化
 11.4 本章小結
Chapter 12 整合實戰 3:以 VSCode 為基礎的輔助程式設計外掛開發
 12.1 輔助程式設計外掛概述及其核心功能
 12.2 在 VS Code 中整合 DeepSeekAP
 12.3 程式碼自動補全與智慧建議的實作
 12.4 使用輔助程式設計外掛提升開發效率
 12.5 本章小結
Appendix A DeepSeek-R1 推論大模型架構詳解
 A.1 DeepSeek-R1 整體架構解析
 A.2 DeepSeek-R1 推論機制與高效運算
 A.3 DeepSeek-R1 API 初步開發指南
 A.4 DeepSeek-R1 在推論任務中的應用
 A.5 DeepSeek-R1 的局限性與未來最佳化方向
 A.6 本章小結
 









