深度剖析 DeepSeek 大模型 : 原理開發與優化部署

丁小晶崔遠

出版商: 機械工業
出版日期: 2025-04-01
定價: $714
售價: 7.9 折 $564
語言: 簡體中文
頁數: 312
ISBN: 7111779223
ISBN-13: 9787111779223
相關分類: Large language model

立即出貨

買這商品的人也買了...

~~$780~~ $663

強化式學習：打造最強 AlphaZero 通用演算法
~~$1,000~~ $850

深度強化式學習 (Deep Reinforcement Learning in Action)
$479

圖解機器學習算法 (全彩印刷)
~~$500~~ $425

Microsoft Azure AI 認知服務基礎必修課 - 使用 C# (含MCF AI-900國際認證模擬試題)
~~$250~~ $198

AI-900：Microsoft Azure AI Fundamentals 人工智慧核心能力國際認證應考攻略, 2/e
~~$550~~ $435

Microsoft Azure AI Services 與 Azure OpenAI 開發基礎必修課 -- 使用 C#
$284

AI 時代生存手冊：零基礎掌握 DeepSeek
$356

DeepSeek 實用操作指南 : 入門、搜索、答疑、寫作
$449

DeepSeek 原理與專案實戰大模型部署、微調與應用開發
$331

高效玩轉 DeepSeek：解鎖 90%的人都不知道的使用技巧
$564

DeepSeek 大模型高性能核心技術與多模態融合開發
$327

DeepSeek 使用指南 (全職業場景應用實踐)
$236

DeepSeek 極簡入門與應用
$284

Deepseek 實戰指南
$469

從零構建大模型：算法、訓練與微調
$714

Transformer 深度解析與 NLP 應用開發
$284

圖解 DeepSeek 實用操作教程 (從入門到精通)
$370

DeepSeek 應用大全：從入門到精通的全方位案例解析
$559

知識增強大模型
~~$834~~ $792

函數式算法設計的藝術
~~$560~~ $442

Microsoft Azure AI Services 與 Azure OpenAI 從入門到人工智慧程式開發 -- 使用 Python (含MCF AI-900國際認證)
~~$650~~ $507

生成式 AI 專案實踐指南：從模型挑選、上線、RAG 技術到 AI Agent 整合
~~$690~~ $545

無料 AI：ChatGPT + DeepSeek + Gemini + Perplexity + Copilot + Claude + NotebookLM + Coze + Felo + Dzine + ElevenLabs + Suno + Stable Audio + Runway + Sora + Gamma –「文字、筆記、搜尋、繪圖、動漫、視覺、語音、音效、音樂、影片、簡報」AI Agent – 創意無限
~~$650~~ $507

Python 原力爆擊：OpenAI / Gemini / AWS / Ollama 生成式 AI 應用新手指南
~~$750~~ $593

深度學習詳解｜台大李宏毅老師機器學習課程精粹

DeepSeek簡體書2書75折詳見活動內容 »

79折
$378

利用 AI 進行數據分析 — 基於 DeepSeek + 豆包 + 智譜清言，讓效率提高N倍
79折
$379

超簡單：用DeepSeek+實用AI工具讓Office高效辦公飛起來
79折
$512

大模型應用開發實踐：基於Spring AI+DeepSeek 實現
79折
$374

AI提問之道：DeepSeek提示工程入門與實踐
79折
$284

成為AI高手：從DeepSeek開啟高效能
79折
$378

DEEPSEEK賦能高效數據分析
79折
$275

DeepSeek企業應用指南-每一個職場人的AI必修課/
79折
$611

DeepSeek原生應用與智能體開發實踐
79折
$284

3小時吃透DeepSeek智能辦公
79折
$236

DeepSeek零基礎實戰
79折
$322

DeepSeek實戰操作指南(AI極簡入門與全場景應用攻略)
79折
$469

AI 量化之道：DeepSeek + Python 讓量化交易插上翅膀
79折
$374

高效寫文案：DeepSeek輔助文案寫作
79折
$374

AI智能化辦公：DeepSeek使用方法與技巧從入門到精通
79折
$469

生成式AI應用開發實戰：基於智譜AI與DeepSeek
79折
$422

AI運營新引擎：DeepSeek驅動7大平臺爆款打造與變現實戰
79折
$327

DeepSeek AI 辦公實戰手冊：10倍提升工作效率的方法與技巧
79折
$185

高效辦公：DeepSeek職場應用指南
79折
$284

輕松玩轉DeepSeek：入門實操精通變現
79折
$327

一本書學會DeepSeek：寫給每個人的工作、生活、副業的AI武功秘笈
79折
$422

DeepSeek掘金——從企業智能化到辦公自動化
79折
$141

DeepSeek幫你玩賺全媒體運營
79折
$422

DeepSeek 圖解：大模型是怎樣構建的
79折
$378

超簡單：用Python+DeepSeek+AI讓Excel飛起來
79折
$331

大模型覺醒：DeepSeek引領AI新未來

簡體館年度書展｜現貨2書79折3書75折詳見活動內容 »

VIP 95折
~~$594~~ $564

深入淺出 SSD 測試 : 固態存儲測試流程方法與工具
VIP 95折
~~$515~~ $489

MCP 開發從入門到實戰
85折
$806

Linux x64 匯編語言編程
VIP 95折
~~$479~~ $455

MCP 極簡開發 : 輕鬆打造高效智能體
VIP 95折
~~$534~~ $507

RISC-V 架構 DSP 處理器設計
VIP 95折
~~$419~~ $398

硬件系統模糊測試：技術揭秘與案例剖析
85折
$454

RAG 實踐權威指南：構建精準、高效大模型之道
VIP 95折
~~$714~~ $678

CUDA 並行編程與性能優化
VIP 95折
~~$288~~ $274

生成式視覺模型原理與實踐
87折
$459

AI大模型：賦能通信產業
VIP 95折
~~$408~~ $388

科學預測——預見科學之美
VIP 95折
~~$299~~ $284

Processing創意編程入門：從編程原理到項目案例
VIP 95折
~~$534~~ $507

大模型驅動的具身智能架構,設計與實現
VIP 95折
~~$474~~ $450

納米級CMOS VLSI電路(可制造性設計)
VIP 95折
~~$359~~ $341

Manus應用與AI Agent設計指南：從入門到精通
VIP 95折
~~$414~~ $393

高薪Offer 簡歷、面試、談薪完全攻略
VIP 95折
~~$534~~ $507

軟件系統優化
VIP 95折
~~$414~~ $393

芯片的較量 (日美半導體風雲)
VIP 95折
~~$294~~ $279

Manus AI 智能體從入門到精通
VIP 95折
~~$1,128~~ $1,072

深度學習：基礎與概念
79折
$469

GitHub Copilot 編程指南
79折
$425

Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化
79折
$512

C#核心編程200例（視頻課程+全套源程序）
VIP 95折
~~$354~~ $336

Verilog HDL計算機網絡典型電路算法設計與實現
VIP 95折
~~$708~~ $673

SAAS + AI 架構實戰：業務解析、架構設計、AI 應用

商品描述

DeepSeek-R1大模型是一款具備強大自然語言處理能力的人工智能模型，能夠高效完成文本生成、翻譯、問答、代碼編寫等多種任務，適合企業級應用和開發者集成。本書系統性地解析了大模型的核心原理、關鍵技術以及DeepSeek的多個實際應用場景。全書共分為12章，首先介紹大模型的基礎知識與發展歷程，從神經網絡的起源到大規模預訓練模型的演化，再到Transformer、BERT與GPT等模型架構的深入剖析，幫助讀者理解大模型的技術基石。其次詳細解析了DeepSeek-R1及其Zero版本在強化學習與模型架構上的核心技術，包括混合專家模型、動態學習率調度、分佈式訓練及高效推理優化策略等。再次聚焦於模型訓練與開發實踐，介紹API調用、上下文拼接、多輪對話管理、模型微調、知識蒸餾等關鍵技術，並結合DeepSeek實際案例展示其在數學推理、代碼生成等領域的應用。最後著重探討了大模型在商業化落地場景中的高級應用，如FIM補全、多輪對話、業務代碼自動化生成以及基於雲部署的智能推薦搜索系統等。本書內容兼具理論深度與實戰價值，同時附贈相關案例代碼、各章思考題及教學視頻等學習資源，適合大模型開發者、AI研究人員、工程師、數據科學家、企業技術決策者以及對人工智能技術感興趣的高校師生閱讀。無論是希望深入理解大模型技術的專業人士，還是尋求在實際業務中應用AI技術的從業者，都能從中獲得有價值的信息和實踐指導。

作者簡介

丁小晶資深大模型AI應用技術專家與管理者，擁有超過15年的計算機及AI領域經驗、5年團隊管理經驗的技術創新與項目管理覆合型人才，精通大模型技術及多語言編程，致力於AI大模型的應用和創新。畢業於中國科學院計算技術研究所，從事高性能計算技術研究。先後在三星中國、百度等世界知名企業工作，有多年旅日工作經歷，屢獲百度榮譽並持多項專利。目前作為小度教育業務技術負責人及大模型應用專家，研究基於大模型Al教育產品創新，引領小度教育成為行業先鋒。

目錄大綱

第1章大模型簡介
1.1 大模型基本概念與發展歷程
1.1.1 從神經網絡到大規模預訓練模型
1.1.2 深度學習時代：模型規模與數據驅動
1.1.3 以DeepSeek為例：大模型應用場景擴展及其商業化進程
1.2 大模型關鍵技術概覽
1.2.1 Transformer架構簡述
1.2.2 自監督學習與預訓練技術
1.2.3 分佈式計算與大模型並行化
1.3 大模型訓練、微調與推理
1.3.1 數據預處理與模型初始化
1.3.2 微調技術：全參數微調與參數高效微調
1.3.3 高效推理優化：量化、剪枝與知識蒸餾
1.4 對話大模型V3與推理大模型R1
1.4.1 自然語言理解與自然語言生成模型的異同
1.4.2 推理大模型的性能優化與低延遲處理
1.4.3 推理模型在數學推理與代碼編寫中的應用
1.5 DeepSeek中的模型壓縮與模型蒸餾技術
1.5.1 模型量化技術：PTQ與QAT
1.5.2 知識蒸餾：教師模型與學生模型
1.5.3 壓縮技術對模型性能與推理速度的影響
1.6 本章小結
第2章深度學習與強化學習基礎
2.1 神經網絡與損失函數
2.1.1 前饋神經網絡與捲積神經網絡概述
2.1.2 交叉熵與均方誤差損失
2.1.3 自適應損失函數與動態權重調整
2.2 梯度下降、反向傳播與神經網絡的訓練
2.2.1 SGD、Adam與LAMB優化器
2.2.2 反向傳播算法與計算圖
2.2.3 學習率衰減與訓練收斂加速
2.3 基於PyTorch的深度學習框架簡介
2.3.1 PyTorch張量操作與自動求導機制
2.3.2 構建神經網絡模型的模塊化設計
2.3.3 動態計算圖與GPU加速的實現
2.4 強化學習基礎
2.4.1 強化學習環境、智能體與獎勵機制
2.4.2 時間差分學習與QLearning詳解
2.5 監督學習、無監督學習與強化學習對比
2.5.1 不同學習範式假設
2.5.2 半監督與自監督學習的實際應用場景
2.6 基於神經網絡的強化學習
2.6.1 深度Q網絡與策略梯度方法融合
2.6.2 ActorCritic算法與優勢函數的優化
2.6.3 多智能體強化學習框架概述
2.7 經驗平衡：EpsilonGreedy
2.7.1 探索與利用的基本矛盾及其解決思路
2.7.2 Epsilon參數動態調整策略
2.7.3 基於分佈式系統的Epsilon優化方法
2.8 基於QLearning的神經網絡：DQN
2.8.1 經驗回放機制的實現
2.8.2 目標網絡的穩定性優化
2.8.3 DQN的改進版本：Double DQN與Dueling DQN
2.9 本章小結
第3章早期自然語言處理與大模型基本網絡架構
3.1 詞嵌入與循環神經網絡
3.1.1 Word2Vec與GloVe詞向量模型的實現原理
3.1.2 RNN的時間序列數據建模能力
3.1.3 RNN中的梯度消失與梯度爆炸問題及其緩解策略
3.2 長短期記憶網絡與門控循環單元
3.2.1 LSTM的門控機制與長期依賴建模
3.2.2 GRU的簡化結構與性能對比
3.2.3 LSTM與GRU在自然語言處理任務中的應用場景
3.3 Transformer與註意力機制
3.3.1 自註意力機制
3.3.2 Transformer的編碼器與解碼器架構分析
3.4 編碼器-解碼器架構
3.4.1 Seq2Seq模型與註意力機制的結合
3.4.2 Transformer的編碼器-解碼器架構在機器翻譯中的優勢
3.5 大模型家族：BERT與GPT簡介
3.5.1 BERT的預訓練任務：MLM與NSP詳解
3.5.2 GPT的自回歸語言建模機制與訓練方法
3.6 本章小結
第2部分 DeepSeek-R1的核心架構與訓練技術
第4章基於大規模強化學習的DeepSeek-R1-Zero
4.1 強化學習算法
4.1.1 基於策略優化的強化學習方法：PPO與TRPO
4.1.2 分佈式強化學習架構及其在大模型中的應用
4.1.3 強化學習算法的收斂性與穩定性優化策略
4.2 DeepSeek-R1Zero獎勵模型
4.2.1 獎勵建模的理論基礎與設計方法
4.2.2 DeepSeek-R1Zero的自適應獎勵函數實現
4.2.3 獎勵信號稀疏性問題及其改進策略
4.3 DeepSeek-R1Zero訓練模板
4.3.1 基於強化學習的模型訓練流程設計
4.3.2 模板參數調優與多任務並行訓練策略
4.3.3 數據採樣與經驗回放在訓練中的作用
4.3.4 DeepSeek-R1Zero的自進化過程
4.4 本章小結
第5章基於冷啟動強化學習的DeepSeek-R1
5.1 冷啟動問題
5.1.1 冷啟動場景下的數據稀缺
5.1.2 基於元學習的冷啟動
5.1.3 遷移學習在冷啟動問題中的應用
5.2 面向推理的強化學習
5.2.1 強化學習模型的泛化能力與推理性能優化
5.2.2 基於推理場景的多任務學習方法
5.3 拒絕抽樣與監督微調
5.3.1