Python 大模型優化策略：理論與實踐

劉衍琦，高超，閆家碩，賈澤豪

出版商: 北京大學
出版日期: 2025-08-01
售價: $894
貴賓價: 9.5 折 $849
語言: 簡體中文
頁數: 392
ISBN: 7301362749
ISBN-13: 9787301362747
相關分類: DeepLearning

立即出貨 (庫存 < 3)

買這商品的人也買了...

$657

基於 DeepSeek 大模型的深度應用實踐
~~$354~~ $336

Python 區塊鏈量化交易
~~$354~~ $336

開放知識圖譜導論
$426

Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化
~~$768~~ $729

通義千問：大模型架構與智能體開發實戰（基於 QwQ-32B 開源模型）
~~$594~~ $564

Python 大模型應用開發：核心技術與項目實戰

商品描述

本書是一本全面介紹Python大模型優化策略的專業書籍，旨在幫助讀者掌握如何高效訓練、優化、部署和調用大規模深度學習模型。掌握這些優化技巧將是推動大模型應用和提升AI行業競爭力的關鍵。本書以深度學習和大模型技術為引，系統講解了各種優化算法，並深入探討了兩者的融合與應用。本書涵蓋了機器學習與深度學習概述、Transformer模型與大模型概述、模型訓練與優化技巧、模型調用與優化基礎、大模型優化概述、常用的優化算法概述、遺傳算法、多目標優化與遺傳算法進階、蟻群算法、鯨魚優化算法、螢火蟲優化算法、神經網絡優化算法、大模型與優化應用實踐、DeepSeek的介紹與使用等內容，每章通過實踐練習介紹了大模型優化的實際應用。本書面向具備機器學習和深度學習基礎的讀者，適合作為高等院校計算機相關專業的本科及專科教材。對於AI從業者、科研人員和工程師而言，本書能夠助力他們在大模型訓練與優化領域深入理解並積累實踐經驗。

作者簡介

劉衍琦，高超，閆家碩，賈澤豪 ---------------------------- 劉衍琦，碩士，畢業於大連理工大學數學科學學院計算幾何與圖形圖像重點實驗室，現為煙臺理工學院人工智能學院教師。曾在東方電子股份有限公司、計算所煙臺分所任職，具有豐富的企業、研究所及高校從業經歷。長期專註於大數據和人工智能的實踐應用，主要研究領域包括機器學習、計算機視覺和自然語言處理。曾主持和參與多個科研項目，並授權多項專利。出版《計算機視覺與深度學習實戰：以MATLAB、Python為工具》《PyTorch深度學習實戰之目標檢測》等著作。高超，碩士，畢業於山東大學軟件工程碩士專業。現為山東商務職業學院專任教師。具有豐富的企業及高校從業經歷，曾在東方電子股份有限公司、煙臺東方威斯頓電氣有限公司任職。專註於電力物聯網領域實踐應用，主要研究領域包括電力規約的解析和處理、機器視覺和視頻分析領域。閆家碩，煙臺理工學院人工智能協會會長、特納科技（煙臺）有限公司 CEO。掌握人工智能技術開發。參與開發數字生命DL-A、DL-B項目，相關成果於 GitHub 開源並收獲 2.4k star；主持多項guojia級與省級重點科研項目，包括《基於YoloV9-Self Attention 的惡劣天氣輔助駕駛優化算法》（guojia級大創立項）和《鐵翼智盾——基於多模態大模型的無人機偵察與輔助決策系統》（山東省大學生創新大賽銀獎）；帶領團隊開發的《雲行衛道》項目在創客營競賽中榮獲名；參與研發《雷視特偵》自主式電力設備AI巡檢機器人項目，獲山東省高校智能機器人創意競賽二等獎。個人榮獲guojia級獎項2項、省級獎項6項。賈澤豪，煙臺理工學院人工智能學院AI創新團隊核心成員，主要研究領域包括計算機視覺、序列預測等。參與多個科研項目，發表數篇學術論文；榮獲4項人工智能領域guojia級賽事獎項；發表軟件著作權2項；參與多項圖書編著工作，其中主編教材1冊，副主編教材1冊；CSDN人工智能領域新星作者，累積文章閱讀量超百萬。

目錄大綱

第1章機器學習和深度學習概述
1.1機器學習概述002
1.1.1機器學習的定義和基本概念002
1.1.2機器學習的分類002
1.1.3機器學習的應用領域004
1.1.4機器學習的基本流程005
1.1.5常見的機器學習算法006
1.2深度學習基礎007
1.2.1深度學習的基本概念008
1.2.2神經網絡的基本原理010
1.2.3常見的神經網絡結構014
1.2.4深度學習的實際應用015
1.2.5深度學習的挑戰與未來發展017
1.3實踐練習：用Scikit-learn和PyTorch實現基礎模型017
1.3.1用Scikit-learn實現基礎機器學習模型017
1.3.2用PyTorch實現基礎深度學習模型020
1.4Python語言實現：簡化的機器學習和深度學習模型024
1.4.1簡化的機器學習模型024
1.4.2簡化的深度學習模型026
第2章Transformer模型與大模型概述
2.1Transformer模型的基本原理031
2.1.1自註意力機制031
2.1.2多頭自註意力機制036
2.1.3位置編碼038
2.2編碼器和解碼器結構039
2.2.1編碼器040
2.2.2解碼器043
2.3大模型的定義與應用047
2.3.1大模型的定義047
2.3.2大模型的應用047
2.4實踐練習：用HuggingFaceTransformers庫進行文本生成049
2.5Python語言實現：NLP和圖像處理中的Transformer模型應用051
第3章模型訓練與優化技巧
3.1學習率調度策略059
3.1.1學習率059
3.1.2學習率的調整策略060
3.2早停策略064
3.2.1過擬合064
3.2.2運用早停策略防止過擬合066
3.3正則化070
3.3.1L1正則化070
3.3.2L2正則化071
3.3.3Dropout正則化072
3.3.3Dropout正則化072
3.4批標準化074
3.5模型參數初始化技巧076
3.6實踐練習：用Python語言實現高效訓練策略077
3.7Python語言實現：優化技巧在模型訓練中的應用079
第4章模型調用與優化基礎
4.1模型調用概述086
4.1.1模型調用的步驟086
4.1.2大模型調用的分類088
4.1.3大模型調用平臺090
4.2大模型的選擇與量化091
4.2.1選擇適合的模型091
4.2.2模型量化092
4.3遷移學習基礎094
4.3.1基本概念與發展背景095
4.3.2工作原理與分類096
4.3.3大模型的微調096
4.4實踐練習：用Transformers庫調用預訓練模型099
4.5Python語言實現：利用預訓練模型進行基礎應用104
第5章大模型優化概述
5.1大模型優化的基本概念109
5.1.1大模型的定義與背景109
5.1.2大模型在實際應用中的挑戰112
5.1.3大模型優化的核心問題115
5.2梯度下降法及其變種118
5.2.1梯度下降法的基本原理119
5.2.2隨機梯度下降法121
5.2.3動量法122
5.2.4AdaGrad、RMSProp與Adam123
5.3超參數優化125
5.3.1超參數的定義與重要性126
5.3.2常見的超參數優化方法127
5.4實踐練習：用Python語言實現梯度下降法129
5.5Python語言實現：優化算法在圖像分類中的應用示例132
第6章常用的優化算法概述
6.1進化算法138
6.1.1進化類算法的基本概念138
6.1.2遺傳算法139
6.1.3差分進化算法148
6.2生物智能算法框架150
6.2.1生物智能算法簡介150
6.2.2典型生物智能算法151
6.2.3算法性能分析153
6.3智能搜索算法框架155
6.3.1智能搜索算法概述156
6.3.2典型的智能搜索算法157
6.4神經網絡算法框架159
6.4.1神經網絡的基本概念160
6.4.2常見的神經網絡結構162
6.4.2常見的神經網絡結構162
6.5實踐練習：用Python完成元啟發式約束優化164
6.6Python語言實現：約束尋優問題168
第7章遺傳算法
7.1遺傳算法簡介173
7.1.1遺傳算法的定義與核心概念173
7.1.2遺傳算法的基本原理與機制175
7.2選擇、交叉和變異操作176
7.2.1選擇操作177
7.2.2交叉操作179
7.2.3變異操作181
7.3適應度函數設計183
7.3.1適應度函數的定義183
7.3.2適應度函數的構建方法186
7.3.3適應度評價與選擇方法187
7.4實踐練習：實現一個簡單的遺傳算法1897.5Python語言實現：TSP194
第8章多目標優化與遺傳算法進階
8.1多目標優化簡介203
8.1.1多目標優化的基本概念與理論基礎203
8.1.2多目標優化的應用領域與挑戰206
8.2遺傳算法在實際問題中的應用（TSP）209
8.2.1TSP介紹209
8.2.2遺傳算法在旅行商問題中的應用211
8.2.3遺傳算法在多目標TSP中的實現策略213
8.3遺傳算法的性能調優215
8.3.1遺傳算法的參數調優215
8.3.2並行計算在遺傳算法中的應用217
8.4實踐練習：實現一個簡單的多目標遺傳算法220
8.5Python代碼實現：多目標優化和遺傳算法性能調優226
第9章蟻群算法
9.1蟻群算法簡介233
9.1.1蟻群算法的基本概念233
9.1.2蟻群算法應用場景235
9.2信息素新機制236
9.2.1信息素的作用與初始化237
9.2.2信息素揮發與新規則239
9.2.3啟發式因子與路徑選擇規則242
9.3蟻群算法在路徑優化中的應用244
9.3.1TSP的優化方法244
9.3.2應用中的挑戰與優化策略246
9.4實踐練習：實現一個簡單的蟻群算法248
9.5Python語言實現：蟻群算法252
0章鯨魚優化算法
10.1鯨魚優化算法簡介258
10.2模擬鯨魚覓食行為259
10.2.1螺旋新機制259
10.2.2收縮包圍機制 261
10.2.3全局搜索與局部開發的平衡264
10.3算法優化與應用267
10.3.1鯨魚優化算法的優缺點分析267
10.3.2提高算法性能的常用方法270
10.3.3鯨魚優化算法的擴展與應用274
10.4實踐練習：實現一個簡單的鯨魚優化算法276
10.5Python語言實現：鯨魚優化算法278
1章螢火蟲優化算法
11.1螢火蟲優化算法簡介284
11.1.1螢火蟲優化算法的背景和原理284
11.1.2螢火蟲優化算法的核心思想285
11.2吸引力函數和位置新機制288
11.2.1吸引力函數的定義288
11.2.2位置新機制290
11.2.3算法流程293
11.3算法優化與應用295
11.3.1參數優化295
11.3.2實際應用298
11.4實踐練習：實現螢火蟲優化算法30111.5Python語言實現與案例分析308
2章神經網絡優化算法
12.1神經網絡優化算法簡介317
12.1.1神經網絡簡介317
12.1.2優化算法簡介319
12.2梯度下降與訓練321
12.2.1前向傳播與損失函數321
12.2.2反向傳播322
12.2.3梯度下降324
12.3算法優化與應用328
12.3.1Momentum優化算法328
12.3.2RMSprop優化算法329
12.3.3Adam優化算法330
12.3.4AdamW優化算法331
12.4實踐練習：實現一個簡單的神經網絡優化算法332
12.5Python語言實現：神經網絡優化算法336
3章大模型與優化應用實踐
13.1大模型的可解釋性與安全性342
13.1.1大模型的可解釋性342
13.1.2大模型的安全性344
13.2大模型的前沿研究與未來發展346
13.2.1大模型當前的技術進展346
13.2.2技術挑戰349
13.3大模型微調技術351
13.3.1微調的必要性352
13.3.2微調方法354
13.4大模型性能優化技巧356
13.4.1模型優化的基本策略357
13.4.2硬件加速359
13.5大模型在優化項目中的應用359
13.5.1實際應用359
13.5.2優化求解361
13.6實踐練習：用HuggingFaceTransformers庫進行大模型微調並應用於優化項目361
13.7Python語言實現：大模型微調及其在特定領域優化中的應用366
4章DeepSeek的介紹與使用
14.1DeepSeek的簡介372
14.1.1什麼是DeepSeek372
14.1.2為什麼選擇DeepSeek372
14.1.3如何使用DeepSeek373
14.2DeepSeek的使用技巧374
14.2.1選擇適合的模型374
14.2.2聯網搜索375
14.2.3提問技巧375
14.3DeepSeek的應用集成376
14.3.1申請APIkey376
14.3.2將DeepSeek接入PyCharm377
14.3.3DeepSeek與Cline結合377
14.4實踐練習：DeepSeek實現遊戲代碼開發378
14.5Python語言實現：DeepSeekAPI調用379
1.零基礎友好：手把手教你從機器學習小白變身AI優化高手！從基礎概念到實戰代碼，全程圖解+案例拆解，哪怕沒學過Python也能輕松掌握大模型優化技巧。 2.硬核幹貨：一本書搞定深度學習全鏈路優化！覆蓋模型訓練、壓縮、部署全流程，詳解梯度下降、遺傳算法、神經網絡優化等核心技術，附贈可運行代碼庫。 3.實戰派秘籍：真實項目經驗直接搬進書裏！書中包含自動駕駛、醫療診斷等落地場景優化方案，校企合作案例帶你解決實際業務痛點。 4前沿技術解碼：國產大模型DeepSeek深度揭秘！解析分布式訓練、混合專家系統等核心技術細節，手把手教你用API調通大模型。 5.算力焦慮終結者：小設備也能玩轉大模型！量化訓練、剪枝、蒸餾等黑科技全公開，教你用有限資源榨幹模型性能。 6.產學研閉環：內容緊密結合校企合作案例，基於實際業務需求，確保知識點的實用性。