史上最完整 -- 一本書晉升深度學習世界級大師
王成、黃曉輝 編著
- 出版商: 深智
- 出版日期: 2025-12-19
- 定價: $1,280
- 售價: 7.9 折 $1,011
- 語言: 繁體中文
- 頁數: 960
- ISBN: 6267757587
- ISBN-13: 9786267757581
-
相關分類:
DeepLearning
尚未上市,歡迎預購
買這商品的人也買了...
-
CUDA 並行程序設計 : GPU 編程指南 (CUDA Programming: A Developer's Guide to Parallel Computing with GPUs)$894$849 -
$505C++ 新經典:Linux C++ 通信架構實戰 -
C++ 程式設計的樂趣|範例實作與專題研究的程式設計課 (C++ Crash Course: A Fast-Paced Introduction)$880$695 -
不只是 CUDA,通用 GPU 程式模型及架構原理$780$616 -
Docker 實戰 6堂課:56個實驗動手做,掌握 Linux 容器核心技術(iThome鐵人賽系列書)【平裝】$650$507 -
$359GPT 圖解 : 大模型是怎樣構建的 -
多 Agent 智慧體 - LangChain 大型 ReAct 系統開發$880$695 -
光纖通信系統, 4/e$414$393 -
$714CUDA 並行編程與性能優化 -
如何讓 AI 幫你代筆寫出你想要的銷魂文案:教你正確下指令,讓企劃案、簡報、履歷、論文、寫作一秒完成!$300$237 -
比 RAG 更強 - 知識增強 LLM 型應用程式實戰$980$774 -
深度學習黑箱:數學基礎與架構設計$894$849 -
秒懂 AI 輔助行動網頁設計:Visual Studio Code + GitHub Copilot + Bootstrap 5 + CSS3 + HTML5 + Web 專案實作$560$442 -
$474CMake項目構建入門指南 -
$599光通信基礎入門 -
手把手帶你實作完整機器學習專案$760$600 -
深入淺出 C#|使用 C# 與 .NET 來建構實際的程式, 5/e (Head First C#: A Learner's Guide to Real-World Programming with C# and .NET, 5/e)$1,280$1,011 -
AI 助攻!Python 最強學習法|跟 ChatGPT 一起寫程式、練邏輯、做專案$550$435 -
圖解 LINUX 指令操作與網路設定, 2/e$550$435 -
Notion AI 活用術|72個讓工作和生活更輕鬆的絕妙好招$450$356 -
白話人工智慧!矽谷科學家帶你看懂 AI 黑科技$560$442 -
LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)$1,250$938 -
更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練$980$774 -
知道你的下一筆訂單 - 使用 LLM$980$774 -
零花費上手!Gemini 3 / NotebookLM / Nano Banana Pro / Veo 3.x 最強 AI 組合技,打造全能工作流$560$442
商品描述
【內容特點】
★深度神經網路架構與演算法
★卷積神經網路、循環神經網路實作解析
★多頭注意力機制與Transformer原理
★BERT、GPT系列模型結構與應用
★預訓練語言模型任務與資料構建流程
★自然語言處理:Word2Vec、GloVe、fastText
★訓練最佳化:Adam、AdaGrad、BatchNorm
★模型評估指標與過擬合正規化技術
★文字分類、問答系統、命名實體辨識模型建構
★端到端模型訓練與微調流程
★多GPU訓練與參數共享技術
★PyTorch框架與範例程式實作
★深度學習開發環境與GPU部署教學
★ChatGPT、InstructGPT、GPT-4使用與提示詞工程
【內容簡介】
本書針對自然語言處理與大語言模型的完整技術鏈條進行系統化整理,內容涵蓋文字表示、語言模型、詞向量、神經網路架構、預訓練模型、大語言模型訓練與應用等領域。相較於僅以應用為導向的實作教材,本書更注重方法論、模型結構與設計邏輯,透過引導方式逐步建構讀者對自然語言處理任務類型、演算法發展脈絡與各類模型原理的理解,並提供必要的數學符號與程式碼範例輔助說明,特別針對BERT、GPT等模型提供演化系譜與結構剖析,搭配模型調配、微調、部署與評估技術,兼顧訓練方法與應用實作需求,對希望掌握現代語言模型核心機制與架構實現的技術開發者與研究人員具實質參考價值。
作者簡介
王成
華東交通大學電腦應用技術碩士畢業,機器學習領域知乎專欄常駐作者,自媒體創作者。專注於機器學習、深度學習技術原理分享,寫作8年累積數百萬字手稿,出版了《跟我一起學機器學習》,並著有 This Post Is All You Need 等電子讀物。
黃曉輝
哈爾濱工業大學電腦軟體與理論博士畢業,華東交通大學資訊工程學院教授、博士研究生導師,南洋理工大學電腦科學與工程學院訪問學者,贛鄱俊才支持計畫高校領軍人才(青年領軍人才),江西省傑出青年基金得主,江西省自然科學二等獎(排名第一)獲得者。長期從事深度學習、機器學習相關領域的研究工作,主持多項國家級和省級課題,並獲得多項發明專利。
目錄大綱
第1 章 深度學習簡介
1.1 深度學習的發展階段
1.2 深度學習中的關鍵人物
1.3 深度學習框架介紹
1.4 本書的系統結構
第2 章 環境設定
2.1 系統結構介紹
2.2 深度學習環境安裝
2.3 開發環境安裝設定
第3 章 深度學習基礎
3.1 線性迴歸
3.2 線性迴歸的簡捷實現
3.3 梯度下降與反向傳播
3.4 從零實現迴歸模型
3.5 從邏輯迴歸到Softmax 迴歸
3.6 Softmax 迴歸的簡捷實現
3.7 從零實現分類模型
3.8 迴歸模型評估指標
3.9 分類模型評估指標
3.10 過擬合與正規化
3.11 超參數與交叉驗證
3.12 啟動函式
3.13 多標籤分類
第4 章 卷積神經網路
4.1 卷積的概念
4.2 卷積的計算過程
4.3 填充和池化
4.4 LeNet5 網路
4.5 AlexNet 網路
4.6 VGG 網路
4.7 NIN 網路
4.8 GoogLeNet 網路
4.9 ResNet 網路
4.10 DenseNet 網路
第5 章 模型訓練與重複使用
5.1 參數及日誌管理
5.2 TensorBoard 視覺化
5.3 模型的儲存與重複使用
5.4 模型的遷移學習
5.5 開放原始碼模型重複使用
5.6 多GPU 訓練
5.7 資料前置處理快取
第6 章 模型最佳化方法
6.1 學習率排程器
6.2 梯度裁剪
6.3 批歸一化
6.4 層歸一化
6.5 組歸一化
6.6 動量法
6.7 AdaGrad 演算法
6.8 AdaDelta 演算法
6.9 Adam 演算法
6.10 初始化方法
第7 章 循環神經網路
7.1 RNN
7.2 時序資料
7.3 LSTM 網路
7.4 GRU 網路
7.5 BiRNN 網路
7.6 CharRNN 網路
第8 章 時序與模型融合
8.1 TextCNN
8.2 TextRNN
8.3 CNN-RNN
8.4 ConvLSTM 網路
8.5 3DCNN
8.6 STResNet
第9 章 自然語言處理
9.1 自然語言處理介紹
9.2 Word2Vec 詞向量
9.3 Word2Vec 訓練與使用
9.4 GloVe 詞向量
9.5 詞向量的微調使用
9.6 fastText 網路
9.7 Seq2Seq 網路
9.8 序列模型評價指標
9.9 NMT 網路
9.10 注意力機制
9.11 含注意力的NMT 網路
9.12 含注意力的RNN
第10 章 現代神經網路
10.1 ELMo 網路
10.2 Transformer 網路
10.3 Transformer 結構
10.4 Transformer 實現
10.5 Transformer 對聯模型
10.6 BERT 網路
10.7 從零實現BERT
10.8 BERT 文字分類模型
10.9 BERT 問題選擇模型
10.10 BERT 問題回答模型
10.11 BERT 命名實體辨識模型
10.12 BERT 從零訓練
10.13 GPT-1 模型
10.14 GPT-2 與GPT-3 模型
10.15 基於GPT-2 的中文預訓練模型
10.16 InstructGPT 與ChatGPT
10.17 ChatGPT 與提示詞工程
10.18 百川大模型使用
10.19 百川大模型實現
10.20 GPT-4 與GPT 的使用








