大規模語言模式開發基礎與實踐
王振麗
- 出版商: 北京大學
- 出版日期: 2024-08-01
- 定價: $534
- 售價: 7.5 折 $401
- 語言: 簡體中文
- 頁數: 368
- 裝訂: 平裝
- ISBN: 730135259X
- ISBN-13: 9787301352595
-
相關分類:
Large language model、TensorFlow
立即出貨
買這商品的人也買了...
-
$299深入淺出 SSD:固態存儲核心技術、原理與實戰 -
$414機器學習經典算法剖析 基於OpenCV -
超限未來:無人駕駛先端技術核新領航 (舊名: 無人駕駛真的來了:第一本從技術面深入的實作書)$490$417 -
$709遷移學習 -- TRANSFER LEARNING (楊強教授新作) -
$450仿人機器人建模與控制 -
$465計算機視覺中的深度學習 -
$407OpenCV 圖像處理入門與實踐 -
$458動手打造深度學習框架 -
$551自動駕駛算法與芯片設計 -
$659深入理解電腦視覺:關鍵算法解析與深度神經網絡設計 -
$422擴散模型:生成式 AI 模型的理論、應用與代碼實踐 -
$709機器學習高級實踐:運算廣告、供需預測、智慧行銷、動態定價 -
萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰$1,280$1,011 -
PyTorch 自動駕駛視覺感知算法實戰$714$678 -
API 設計模式|簡化整合的訊息交換技術 (Patterns for API Design: Simplifying Integration with Loosely Coupled Message Exchanges)$850$672 -
演算法導論, 4/e (Introduction to Algorithms, 4/e)$1,800$1,422 -
AI 繪圖邁向視覺設計$720$569 -
$407機器視覺偵測與辨識技術及應用 基於深度學習 -
ChatGPT 4 Omni 領軍 - Copilot、Claude、Gemini、36組GPT ...全面探索生成式AI的無限可能(過版書)$780$616 -
輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可$690$545 -
內行人才知道的機器學習系統設計面試指南 (Machine Learning System Design Interview)$680$537 -
世界第一簡單的演算法:圖解 ✕ 程式 ✕ 刷題機器人$599$473 -
決戰半導體:解讀大數據時代的強勢版塊,掌握未來投資趨勢$480$360 -
AI 讀心數 - 推薦系統演算法核心程式碼精通$780$616 -
$422大模型動力引擎 — PyTorch 性能與顯存優化手冊
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書循序漸進、詳細講解了大模型開發技術的核心知識,
並透過具體實例的實現過程演練了使用TensorFlow和PyTorch開發大模型程序的方法和流程。
全書共12章,分別講解了大模型基礎,資料集的加載、基本處理與製作,資料集的預處理,捲積神經網絡模型,循環神經網絡模型,
特徵提取,註意力機制,模型訓練與調優,模型推理和評估,大模型優化演算法和技術,AI智慧問答系統和AI人臉辨識系統。
全書簡潔而不失其技術深度,內容豐富全面。
本書易於閱讀,以極簡的文字介紹了複雜的案例,是學習大模型開發的實用教學。
本書適用於已經瞭解Python基礎開發的讀者,以及想進一步學習大模型開發、模型優化、模型應用和模型架構的讀者,
還可以作為大專院校相關專業的師生用書和培訓學校的專業性教材。
目錄大綱
第1章大模型基礎
1.1人工智能
1.1.1 人工智能的發展歷程
1.1.2 人工智能的研究領域
1.1.3 人工智能對人們生活的影響
1.2機器學和深度學
1.2.1 機器學
1.2.2 深度學
1.2.3 機器學和深度學的區別
1.3大模型簡介
1.3.1 大模型的作用
1.3.2 數據
1.3.3 數據和大模型的關係
1.4大模型開發與應用的技術堆疊
第2章資料集的加載、基本處理和
2.1資料集的加載
2.1.1 PyTorch加載資料集
2.1.2 TensorFlow加載資料集
2.2資料集的基本處理
2.2.1 轉換為Tensor格式
2.2.2 標準化處理
2.2.3 調整大小和裁剪
2.2.4 隨機翻轉和旋轉
2.3數據集的
2.3.1 自訂資料集
2.3.2 簡易圖片資料集
2.3.3 有標籤的資料集
第3章資料集的預處理
3.1資料清洗和處理
3.1.1 缺失值處理
3.1.2 異常值檢測與處理
3.1.3 重複資料處理
3.2資料轉換與整合
3.2.1 徵選擇與抽取
3.2.2 徵變換與降維
3.2.3 資料整合與關聯
3.3數據標準化與歸一化
3.3.1 標準化及其重要性
3.3.2 徵縮放和歸一化
3.3.3 資料轉換與規範化
3.3.4 “ 小- 大”縮放
3.4數據技術
3.4.1 數據的意義
3.4.2 影像數據
3.4.3 自然語言數據
第4章捲積經網絡模型
4.1捲積經網絡簡介
4.1.1 捲積經網絡的發展背景
4.1.2 捲積經網絡的結構
4.2捲積經網絡模型開發實戰
4.2.1 使用TensorFlow建立一個捲積經網絡模型並評估
4.2.2 使用PyTorch建立手寫數碼模型
第5章循環經網絡模型
5.1文本處理與循環經網絡簡介
5.1.1 循環經網絡基礎
5.1.2 文本分類
5.2循環經網絡模型開發實戰
5.2.1 使用PyTorch開發歌詞生成器模型
5.2.2 使用TensorFlow情緒分析模型
第6章徵提取
6.1徵擷取簡介
6.1.1 徵在大模型中的關鍵作用
6.1.2 徵提取與資料預處理的關係
6.2徵的類型和重要性
6.2.1 數值徵和類別徵
6.2.2 高維度資料的挑戰
6.3徵選擇
6.3.1 徵選擇的要性
6.3.2 徵選擇的方法
6.4徵抽取
6.4.1 徵抽取的概念
6.4.2 主成分分析
6.4.3 立成分分析
6.4.4 自動編碼器
6.5文本資料的徵提取
6.5.1 嵌入
6.5.2 詞袋模型
6.5.3 TF-IDF徵
6.6 影像資料的徵提取
6.6.1 預訓練的圖像徵提取模型
6.6.2 基本影像徵:邊緣偵測、色彩直方圖等
第7章註意力機制
7.1註意力機制基礎
7.1.1 註意力機制簡介
7.1.2 註意力機制的變體
7.1.3 註意力機制解決的問題
7.2TensorFlow 機器翻譯系統
7.2.1 專案簡介
7.2.2 下載並準備資料集
7.2.3 文字預處理
7.2.4 編碼器模型
7.2.5 繪製可視化註意力圖
7.2.6 解碼器
7.2.7 訓練
7.2.8 翻譯
7.3 PyTorch 機器翻譯系統
7.3.1 準備資料集
7.3.2 資料預處理
7.3.3 實作Seq2Seq 模型
7.3.4 訓練模型
7.3.5 模型評估
7.3.6 訓練和評估
7.3.7 註意力的可視化
第8章模型訓練與調
8.1模型訓練化
8.1.1 底層化
8.1.2 樣本權重與分類權重
8.2損失函數和化演算法
8.2.1 損失函數與化演算法的概念
8.2.2 TensorFlow損失函數和化演算法
8.2.3 PyTorch損失函數和化演算法
8.3批量訓練和隨機訓練
8.3.1 批量訓練和隨機訓練的概念
8.3.2 小批量隨機梯度下降
8.3.3 批量歸一化
8.3.4 丟棄
8.4模型驗證與調
8.4.1 訓練集、驗證集和測試集
8.4.2 交驗證化
8.4.3 參數調
第9章模型推理與評估
9.1模型推理
9.1.1 模型推理的步驟
9.1.2 前向傳播與輸出計算的過程
9.1.3 模型推理的化與加速
9.2模型評估
9.2.1 模型評估的方法與指標
9.2.2 交驗證和統計顯著性測試的應用
第10章大模型化演算法與技術
10.1常見的大模型化演算法與技術
10.2梯度下降法
10.2.1 梯度下降法簡介
10.2.2 TensorFlow梯度下降法化實踐
10.2.3 PyTorch梯度下降法化實踐
10.3模型並行與資料並行
10.3.1 模型並行與資料並行的基本概念
10.3.2 TensorFlow模型並行與資料並行實踐
10.3.3 PyTorch模型並行與資料並行實踐
10.4學率調度
10.4.1 學率調度的方法
10.4.2 TensorFlow學率調度化實踐
10.4.3 PyTorch學率調度化實踐
10.5權重初始化策略
10.6遷移學
10.6.1 遷移學的基本概念
10.6.2 TensorFlow遷移學化實踐
10.6.3 PyTorch遷移學化實踐
10.7其他大模型化演算法與技術
10.7.1 分佈式訓練
10.7.2 正規化
10.7.3 梯度裁剪
10.7.4 混合度訓練化
10.7.5 量化技術
10.7.6 剪枝化技術
第11章AI智慧問答系統(TensorFlow+TensorFlow. js+SQuAD 2.0+Mobile-BERT)
11.1背景簡介
11.1.1 網絡的影響
11.1.2 問答系統的發展
11.2問答系統的發展趨勢:AI 問答系統
11.3技術架構
11.3.1 TensorFlow.js
11.3.2 SQuAD 2.0
11.3.3 BERT
11.3.4 知識蒸餾
11.4具體實現
11.4.1 編寫HTML文件
11.4.2 腳本處理
11.4.3 加載訓練模型
11.4.4 查詢處理
11.4.5 文章處理
11.4.6 加載處理
11.4.7 尋找答案
11.4.8 提取答案
11.4.9 將答案轉換回原始文本
11.5調試運行
第12章AI人臉辨識系統(PyTorch+OpenCV+Scikit-Image+MobileNet+ArcFace)
12.1 系統簡介
12.1.1 背景簡介
12.1.2 人臉辨識的發展與現狀
12.2系統需求分析
12.2.1 系統功能分析
12.2.2 技術分析
12.2.3 實現流程分析
12.3數據集
12.3.1 準備資料集
12.3.2 提取人臉
12.4訓練模型
12.4.1 ArcFace演算法
12.4.2 MobileNet演算法
12.4.3 開始訓練
12.5評估模型
12.5.1 評估的重要性
12.5.2 評估程序
12.6人臉辨識
12.6.1 影像預處理
12.6.2 人臉辨識模型
12.6.3 開始識別
