DeepSeek本地部署與應用開發:政府與企業級實戰案例解析|
- 出版商: 北京大學
- 出版日期: 2025-09-01
- 售價: $474
- 語言: 簡體中文
- 頁數: 380
- ISBN: 7301364903
- ISBN-13: 9787301364901
-
相關分類:
DeepLearning、雲端運算
尚未上市,歡迎預購
相關主題
商品描述
本書聚焦於DeepSeek大模型在企業與政府場景下的本地化部署應用。開篇對DeepSeek進行全面介紹,涵蓋大模型發展脈絡、DeepSeek的演變歷程,剖析DeepSeek其技術架構和參數版本分類等,還講解如何有效提問以及在熱門平臺的應用場景。隨後深入本地化部署實操,從硬件選型的CPU、GPU配置,到Ollama和DeepSeek模型安裝,再到網絡安全規劃與問題排查,都給出詳細指引。並基於OpenWebUI、Dify、AnythingLLM等工具,介紹企業知識庫搭建的具體流程。通過金融、醫療、政務、企業營銷等行業實戰案例,詳細說明DeepSeek的應用架構與實現步驟,助力讀者將其落地。附錄提供了常用命令、硬件配置參考、術語解釋等資源,方便讀者隨時查閱,是一本實操性強的技術指南書籍。全書共分為12章。內容包括:第1章 DeepSeek介紹;第2章 DeepSeek使用;第3章 本地化部署的必要性;第4章 本地化部署實操;第5章 基於OpenUI的企業知識庫搭建;第6章 基於Dify的企業知識庫搭建;第7章 基於AnythingLLM的企業知識庫搭建;第8章 實戰:金融行業;第9章 實戰:醫療領域; 0章 實戰:政務場景; 1章 實戰:企業營銷; 2章 附錄:工具與資源速查。 本書適合對AIGC和DeepSeek技術感興趣的技術人員、希望深入探究DeepSeek 應用的技術愛好者和開發人員閱讀參考。
作者簡介
康瑋劍【著】【中國】【現當代】———康瑋劍,現任廈門歷思科技的軟件技術總監。CSDN博客專家, 粉絲10w+。擁有10年軟件開發和IT行業經驗,緊跟人工智能大模型技術的發展,成功將其應用於實際項目中,顯著提升企業及政府機構的工作效能。 楊傑斌【著】【中國】【現當代】———楊傑斌,10年大數據和AI應用開發經驗。曾任網宿科技 大數據工程師,現任美圖秀秀 算法工程師,憑借其 的技術能力, 多項關鍵技術項目。致力於企業數字化轉型和人工智能領域的探索和分享。
目錄大綱
第1章
DeepSeek介紹
1.1 DeepSeek發展歷程 002
1.1.1 早期創立與初步探索
(2023年) 002
1.1.2 技術疊代與性能提升(2024年) 002
1.1.3 技術突破與開源登頂
(2025年) 003
1.2 DeepSeek產業革命 004
1.2.1 芯片與算力廠商 004
1.2.2 互聯網與雲廠商 005
1.2.3 車企與手機廠商 006
1.2.4 政府與政務服務 007
1.2.5 醫療與教育服務 007
1.3 DeepSeek爆火原因 009
1.3.1 的推理能力 009
1.3.2 超低的推理和訓練成本 010
1.3.3 開源策略普惠全世界 011
1.4 小結 012
第2章
DeepSeek本地化部署
必要性
2.1 對比矩陣 015
2.2 數據安全與合規 016
2.2.1 高度監管領域 016
2.2.2 經濟損失案例 017
2.2.3 實際應用案例 017
2.3 穩定性與可靠性 018
2.4 低延時與實時性 019
2.4.1 實時性場景 019
2.4.2 本地化部署優勢 020
2.5 模型微調與優化適配 020
2.5.1 DeepSeek優勢 020
2.5.2 實際應用案例 021
2.6 邊緣離線應用 022
2.6.1 邊緣離線場景 022
2.6.2 實際應用案例 022
2.6 長期使用成本 023
2.7.1 人工客服成本基準 023
2.7.2 API調用成本估算(智能客服) 024
2.7.3 API調用成本估算(智能營銷) 025
2.7.4 本地化部署成本 026
2.7.5 小結 026
第3章
DeepSeek本地化部署建議
3.1 評估準備工作 029
3.1.1 必要性評估 029
3.1.2 需求評估 029
3.1.3 資源評估 030
3.1.4 風險評估 031
3.1.5 效益評估 032
3.2 算力申請或租賃 033
3.2.1 購買硬件 033
3.2.2 申請算力 034
3.2.3 租賃算力 035
3.3 分階段實施 036
3.3.1 初期探索階段 037
3.3.2 優化拓展階段 037
3.3.3 全面推廣階段 038
3.4 混合架構策略 039
第4章
DeepSeek本地化部署實操
4.1 本地化部署工具對比 042
4.2 基於Windows系統部署Ollama 043
4.2.1 下載Ollama 043
4.2.2 安裝Ollama 044
4.2.3 Ollama安裝路徑 045
4.2.4 大模型存儲路徑 045
4.3 基於Linux系統部署Ollama 046
4.3.1 下載Ollama 047
4.3.2 啟動Ollama 047
4.4 Ollama安全設置 048
4.4.1 Ollama的風險隱患 048
4.4.2 Ollama的安全防護 049
4.5 部署DeepSeek模型 050
4.5.1 選擇DeepSeek-R1模型 050
4.5.2 拉取DeepSeek-R1模型 053
4.5.3 運行DeepSeek-R1模型 054
4.6 部署過程中的常見問題 056
4.6.1 模型加載時間過長 056
4.6.2 啟動Ollama報錯 057
4.6.3 內存不足錯誤 058
4.6.4 模型響應不準確 058
4.7 DeepSeek本地運行實測 058
4.7.1 基於NVIDIA RTX 3060 12G實測 059
4.7.2 基於AMD RX 7900 XTX 24G實測 065
4.8 DeepSeek本地一體機 071
4.8.1 中國電信:息壤智算一體機—(DeepSeek版) 072
4.8.2 京東雲:DeepSeek大模型一體機 072
4.8.3 聯想:DeepSeek智能體一體機 072
4.8.4 阿裏:飛天智算一體機 073
4.8.5 百度:DeepSeek推理一體機 073
4.8.6 浪潮:DeepSeek元腦一體機 074
第5章
DeepSeek信創系統實操
5.1 信創介紹 076
5.1.1 信創的重要性 076
5.1.2 信創的核心架構體系 077
5.1.3 信創的典型應用示例 078
5.2 基於統信UOS部署DeepSeek 079
5.2.1 統信UOS介紹 079
5.2.2 統信UOS AI 080
5.2.3 基於Ollama部署DeepSeek 082
5.3 基於麒麟openKylin部署DeepSeek 082
5.3.1 銀河麒麟openKylin介紹 083
5.3.2 麒麟AI助手 083
5.3.3 基於Ollama部署DeepSeek 085
第6章
大模型本地化部署安全防護
6.1 大模型本地化部署的安全隱患 087
6.1.1 數據安全隱患 087
6.1.2 網絡安全隱患 088
6.1.3 開源框架漏洞隱患 089
6.2 大模型本地化部署安全隱患的解決方案 090
6.2.1 數據安全解決方案 090
6.2.2 框架漏洞解決方案 091
6.2.3 網絡安全解決方案 093
6.3 漏洞掃描檢測工具 094
6.3.1 漏洞掃描檢測工具對比 094
6.3.2 AI-Infra-Guard安裝 096
6.3.3 AI-infra-Guard的Web使用 098
6.3.4 AI-infra-Guard的命令行使用 102
第7章
DeepSeek本地應用實踐
7.1 基於Chatbox客戶端使用DeepSeek 105
7.1.1 Chatbox下載 105
7.1.2 Chatbox安裝 105
7.1.3 Chatbox配置 106
7.1.4 Chatbox使用 107
7.2 基於REST API使用DeepSeek 108
7.2.1 Ollama API文檔 108
7.2.2 REST API分類和簡述 109
7.2.3 使用Curl快速測試API 連通性 110
7.2.4 使用Apipost調用Ollama
生成文本接口 111
7.2.5 使用Python調用Ollama生成聊天接口 112
7.3 基於Visual Studio Code插件使用DeepSeek 114
7.3.1 VS Code下載 115
7.3.2 VS Code安裝 115
7.3.3 VS Code插件 116
7.3.4 使用Roo Code插件 117
7.3.5 使用twinny插件 120
7.3.6 使用Cline插件 123
7.3.7 使用DeepSeek R1插件 126
第8章
OpenWebUI應用實踐
8.1 基於Windows部署OpenWebUI 131
8.1.1 Docker Desktop下載 131
8.1.2 Docker Desktop安裝 131
8.1.3 Docker Engine啟動 133
8.1.4 Docker Engine鏡像源 134
8.1.5 拉取OpenWebUI鏡像 135
8.1.6 啟動OpenWebUI容器 136
8.1.7 停止OpenWebUI容器 137
8.1.8 刪除OpenWebUI容器 137
8.2 基於Linux部署OpenWebUI 137
8.2.1 準備Conda環境 138
8.2.2 安裝OpenWebUI平臺 139
8.3 OpenWebUI基礎應用 140
8.3.1 創建管理員賬號 141
8.3.2 禁用OpenAI 141
8.3.3 用戶管理 142
8.3.4 權限組管理 144
8.3.5 模型管理 146
8.3.6 知識庫管理 148
8.3.7 提示詞管理 150
8.3.8 本地局域網使用 151
8.4 文檔內容提取引擎 153
8.4.1 動態適配源碼解析 153
8.4.2 內容提取引擎對比 157
8.4.3 Apache Tika安裝 158
8.4.4 Apache Tika集成 159
8.5 聯網搜索引擎 160
8.5.1 SearXNG介紹 161
8.5.2 SearXNG安裝 162
8.5.3 SearXNG集成 163
8.5.4 SearXNG常見問題 164
8.5.5 Open WebUI使用聯網搜索 168
8.6 文本分切器 169
8.6.1 文本分切器對比 170
8.6.2 Tiktoken分切器設置 170
8.7 語義向量模型 171
8.7.1 語義向量模型引擎 171
8.7.2 語義向量模型對比 172
8.7.3 BGE-M3集成 173
8.8 檢索機制 174
8.8.1 向量檢索源碼解析 176
8.8.2 混合檢索源碼解析 177
8.8.3 Reranker重排序模型 181
8.8.4 BAAI/bge-reranker-v2-m3集成 182
8.9 RAG 183
8.9.1 知識庫構建流程 183
8.9.2 RAG工作流程 184
8.9.3 RAG應用示例(辦公助手) 186
第9章
Dify應用實踐
9.1 Dify概述和核心價值 190
9.1.1 Dify概述 190
9.1.2 Dify核心價值 191
9.2 Dify的核心架構與技術實現 191
9.2.1 知識庫管理系統 191
9.2.2 工作流引擎 192
9.2.3 模型管理 193
9.3 Dify的搭建與部署 193
9.3.1 環境準備 193
9.3.2 克隆代碼庫 194
9.3.3 啟動服務 195
9.3.4 常見問題排查 197
9.4 使用Dify搭建AI聊天助手 201
9.4.1 初始化Dify 201
9.4.2 添加模型供應商 202
9.4.3 創建聊天助手 203
9.4.4 發布聊天助手 205
9.5 知識庫的使用 206
9.5.1 新建知識庫 206
9.5.2 安裝Embedding模型 208
9.5.3 在聊天室中配置知識庫 209
9.5.4 知識庫效果展示 210
9.6 Agent的使用 212
9.6.1 聊天助手、Agent、文本生成應用介紹 212
9.6.2 Agent工具介紹 213
9.6.3 使用Agent實現旅遊助手 215
9.7 知識庫優化建議 219
9.7.1 文檔質量 219
9.7.2 分段策略 220
9.7.3 檢索測試 220
9.7.4 成本控制 221
9.8 小結 221
0章
實戰——基於工作流構建企業會議助手
10.1 依賴環境 224
10.2 創建Dify工作流應用 224
10.3 獲取個人用戶信息 225
10.3.1 獲取Dify用戶ID 225
10.3.2 綁定OA用戶ID 226
10.3.3 獲取OA用戶ID 227
10.4 實現預定會議功能 231
10.4.1 獲取預定會議接口 231
10.4.2 獲取接口所需信息 231
10.4.3 請求接口預定會議 237
10.5 實現會議查詢功能 242
10.5.1 獲取查詢會議接口 242
10.5.2 請求接口查詢會議 243
10.6 實現會議取消功能 247
10.6.1 取消會議接口 247
10.6.2 獲取會議ID 247
10.6.3 請求接口取消會議 252
10.7 實現會議紀要功能 254
10.7.1 安裝語音模型 254
10.7.2 開發語音識別服務 257
10.7.3 配置Dify工作流 260
10.7.4 效果演示 264
10.8 實現各個功能匯總 264
1章
實戰——基於智能體構建企業招聘助手
11.1 OpenAI Agents SDK介紹和使用 269
11.1.1 OpenAI Agents SDK介紹 269
11.1.2 OpenAI Agents SDK安裝 270
11.1.3 在OpenAI Agents SDK中使用DeepSeek 270
11.1.4 Agent使用示例 272
11.1.5 Handoffs使用示例 273
11.1.6 Tool使用示例 276
11.2 項目開始前準備工作 277
11.2.1 項目環境準備 277
11.2.2 定義使用的模型供應商 278
11.3 實現簡歷分析功能 279
11.3.1 簡歷分析工具開發 280
11.3.2 簡歷分析Agent定義 281
11.3.4 簡歷分析Agent測試 284
11.4 實現簡歷概要輸出Excel功能 285
11.4.1 簡歷輸出工具開發 285
11.4.2 簡歷輸出Agent定義 288
11.4.3 簡歷分析和輸出Agent測試 289
11.5 實現壓縮包解壓自動識別簡歷功能 291
11.5.1 簡歷解壓工具開發 291
11.5.2 簡歷解壓Agent定義 293
11.5.3 簡歷解壓、分析和輸出Agent測試 294
11.6 實現簡歷評估排序功能 296
11.6.1 簡歷評估排序Agent定義 296
11.6.2 簡歷解壓、分析、排序和輸出Agent測試 298
11.7 功能整合與智能體集成 301
11.7.1 入口Agent定義 301
11.7.2 智能體集成與測試 303
2章
實戰——AI聊天機器人
12.1 小智AI系統架構 309
12.1.1 小智AI介紹 309
12.1.2 系統架構設計 311
12.1.3 語音對話流程 313
12.1.4 本地應用場景 314
12.2 ESP32設備端實現 316
12.2.1 硬件平臺(ESP32-S3-BOX3) 316
12.2.2 軟件框架結構 317
12.2.3 源碼編譯與固件下載 319
12.2.4 Wi-Fi配網功能實現 322
12.2.5 設備激活功能實現 327
12.2.6 語音對話功能實現 331
12.2.7 離線喚醒和對話打斷功能實現 336
12.3 本地服務器實現 347
12.3.1 軟件框架結構 347
12.3.2 本地環境準備 349
12.3.3 本地後端服務運行 355
12.3.4 本地前端服務運行 358
12.3.5 服務器配置管理 359
12.3.6 ESP32連接服務器 362
12.3.7 DeepSeek調用流程 364
12.4 總結 368
全面:涵蓋DeepSeek基礎介紹、常用系統部署及大模型安全部署全流程 部署:全維度解析DeepSeek本地化部署步驟,AI新手也可快速學會 構建:詳解目前 爆的2個AI應用項目,無縫銜接本地DeepSeek能力 實戰:精選3個企業及政府級實戰案例,從0到1快速入門