史上最完整 -- 一本書晉升深度學習世界級大師

王成、黃曉輝編著

預覽內頁

出版商: 深智
出版日期: 2025-12-19
定價: $1,280
售價: 7.9 折 $1,011
語言: 繁體中文
頁數: 960
ISBN: 6267757587
ISBN-13: 9786267757581
相關分類: DeepLearning
此書翻譯自: 跟我一起學深度學習

立即出貨 (庫存 > 10)

買這商品的人也買了...

~~$880~~ $748

C++ 程式設計的樂趣｜範例實作與專題研究的程式設計課 (C++ Crash Course: A Fast-Paced Introduction)
~~$680~~ $612

機器學習的統計基礎 : 深度學習背後的核心技術
~~$780~~ $616

不只是 CUDA，通用 GPU 程式模型及架構原理
~~$980~~ $774

AI 圖片增強 - 影像畫質演算法及深層視覺技術
~~$880~~ $695

多 Agent 智慧體 - LangChain 大型 ReAct 系統開發
~~$790~~ $624

全民瘋 AI 系列 - 經典機器學習
~~$1,280~~ $1,011

AI 視覺 : 最強入門邁向頂尖高手王者歸來
~~$620~~ $434

你的第一本 Git 與 GitHub 入門書：輕鬆實作本機與遠端儲存庫的版本控制
~~$680~~ $537

FastAPI｜現代 Python 網站開發 (FastAPI : Modern Python Web Development)
~~$980~~ $774

深度學習最佳入門與專題實戰：理論基礎與影像篇
~~$750~~ $592

深度學習詳解｜台大李宏毅老師機器學習課程精粹
~~$980~~ $774

LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)
~~$980~~ $774

比 RAG 更強 - 知識增強 LLM 型應用程式實戰
~~$760~~ $600

手把手帶你實作完整機器學習專案
~~$1,080~~ $853

Vibe Coding CLI 頂級開發 - Claude Code 前瞻菁英育成手冊
~~$880~~ $695

現代 AI 是這麼做出來的 - 從訓練、演算法到微調全實作
~~$980~~ $774

生成式 AI 開發實作｜使用 Transformers 與擴散模型 (Hands-On Generative AI with Transformers and Diffusion Models)
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
~~$550~~ $434

AI 助攻！Python 最強學習法｜跟 ChatGPT 一起寫程式、練邏輯、做專案
~~$550~~ $434

圖解 LINUX 指令操作與網路設定, 2/e
~~$560~~ $442

白話人工智慧！矽谷科學家帶你看懂 AI 黑科技
~~$1,250~~ $987

LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)
~~$980~~ $774

更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練
~~$980~~ $774

知道你的下一筆訂單 - 使用 LLM
~~$560~~ $442

零花費上手！Gemini 3 / NotebookLM / Nano Banana Pro / Veo 3.x 最強 AI 組合技，打造全能工作流

商品描述

【內容特點】

★深度神經網路架構與演算法

★卷積神經網路、循環神經網路實作解析

★多頭注意力機制與Transformer原理

★BERT、GPT系列模型結構與應用

★預訓練語言模型任務與資料構建流程

★自然語言處理：Word2Vec、GloVe、fastText

★訓練最佳化：Adam、AdaGrad、BatchNorm

★模型評估指標與過擬合正規化技術

★文字分類、問答系統、命名實體辨識模型建構

★端到端模型訓練與微調流程

★多GPU訓練與參數共享技術

★PyTorch框架與範例程式實作

★深度學習開發環境與GPU部署教學

★ChatGPT、InstructGPT、GPT-4使用與提示詞工程

【內容簡介】

本書針對自然語言處理與大語言模型的完整技術鏈條進行系統化整理，內容涵蓋文字表示、語言模型、詞向量、神經網路架構、預訓練模型、大語言模型訓練與應用等領域。相較於僅以應用為導向的實作教材，本書更注重方法論、模型結構與設計邏輯，透過引導方式逐步建構讀者對自然語言處理任務類型、演算法發展脈絡與各類模型原理的理解，並提供必要的數學符號與程式碼範例輔助說明，特別針對BERT、GPT等模型提供演化系譜與結構剖析，搭配模型調配、微調、部署與評估技術，兼顧訓練方法與應用實作需求，對希望掌握現代語言模型核心機制與架構實現的技術開發者與研究人員具實質參考價值。

作者簡介

王成

華東交通大學電腦應用技術碩士畢業，機器學習領域知乎專欄常駐作者，自媒體創作者。專注於機器學習、深度學習技術原理分享，寫作8年累積數百萬字手稿，出版了《跟我一起學機器學習》，並著有 This Post Is All You Need 等電子讀物。

黃曉輝

哈爾濱工業大學電腦軟體與理論博士畢業，華東交通大學資訊工程學院教授、博士研究生導師，南洋理工大學電腦科學與工程學院訪問學者，贛鄱俊才支持計畫高校領軍人才（青年領軍人才），江西省傑出青年基金得主，江西省自然科學二等獎（排名第一）獲得者。長期從事深度學習、機器學習相關領域的研究工作，主持多項國家級和省級課題，並獲得多項發明專利。

目錄大綱

第1 章 深度學習簡介

1.1 深度學習的發展階段

1.2 深度學習中的關鍵人物

1.3 深度學習框架介紹

1.4 本書的系統結構

第2 章 環境設定

2.1 系統結構介紹

2.2 深度學習環境安裝

2.3 開發環境安裝設定

第3 章 深度學習基礎

3.1 線性迴歸

3.2 線性迴歸的簡捷實現

3.3 梯度下降與反向傳播

3.4 從零實現迴歸模型

3.5 從邏輯迴歸到Softmax 迴歸

3.6 Softmax 迴歸的簡捷實現

3.7 從零實現分類模型

3.8 迴歸模型評估指標

3.9 分類模型評估指標

3.10 過擬合與正規化

3.11 超參數與交叉驗證

3.12 啟動函式

3.13 多標籤分類

第4 章 卷積神經網路

4.1 卷積的概念

4.2 卷積的計算過程

4.3 填充和池化

4.4 LeNet5 網路

4.5 AlexNet 網路

4.6 VGG 網路

4.7 NIN 網路

4.8 GoogLeNet 網路

4.9 ResNet 網路

4.10 DenseNet 網路

第5 章 模型訓練與重複使用

5.1 參數及日誌管理

5.2 TensorBoard 視覺化

5.3 模型的儲存與重複使用

5.4 模型的遷移學習

5.5 開放原始碼模型重複使用

5.6 多GPU 訓練

5.7 資料前置處理快取

第6 章 模型最佳化方法

6.1 學習率排程器

6.2 梯度裁剪

6.3 批歸一化

6.4 層歸一化

6.5 組歸一化

6.6 動量法

6.7 AdaGrad 演算法

6.8 AdaDelta 演算法

6.9 Adam 演算法

6.10 初始化方法

第7 章 循環神經網路

7.1 RNN

7.2 時序資料

7.3 LSTM 網路

7.4 GRU 網路

7.5 BiRNN 網路

7.6 CharRNN 網路

第8 章 時序與模型融合

8.1 TextCNN

8.2 TextRNN

8.3 CNN-RNN

8.4 ConvLSTM 網路

8.5 3DCNN

8.6 STResNet

第9 章 自然語言處理

9.1 自然語言處理介紹

9.2 Word2Vec 詞向量

9.3 Word2Vec 訓練與使用

9.4 GloVe 詞向量

9.5 詞向量的微調使用

9.6 fastText 網路

9.7 Seq2Seq 網路

9.8 序列模型評價指標

9.9 NMT 網路

9.10 注意力機制

9.11 含注意力的NMT 網路

9.12 含注意力的RNN

第10 章 現代神經網路

10.1 ELMo 網路

10.2 Transformer 網路

10.3 Transformer 結構

10.4 Transformer 實現

10.5 Transformer 對聯模型

10.6 BERT 網路

10.7 從零實現BERT

10.8 BERT 文字分類模型

10.9 BERT 問題選擇模型

10.10 BERT 問題回答模型

10.11 BERT 命名實體辨識模型

10.12 BERT 從零訓練

10.13 GPT-1 模型

10.14 GPT-2 與GPT-3 模型

10.15 基於GPT-2 的中文預訓練模型

10.16 InstructGPT 與ChatGPT

10.17 ChatGPT 與提示詞工程

10.18 百川大模型使用

10.19 百川大模型實現

10.20 GPT-4 與GPT 的使用