大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)

王瑞平、張美航

  • 出版商: 清華大學
  • 出版日期: 2026-05-01
  • 售價: $414
  • 語言: 簡體中文
  • ISBN: 7302715017
  • ISBN-13: 9787302715016
  • 相關分類: Large language model
  • 下單後立即進貨 (約4週~6週)

  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-1
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-2
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-3
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-4
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-5
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-6
  • 大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-7
大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)-preview-1

商品描述

"本書以行業大模型為核心,系統性地介紹了其基礎理論、關鍵技術及行業實踐,為讀者呈現了一條從理論到應用的完整學習路徑。全書圍繞行業大模型的構建、優化與落地,深入淺出地剖析了其在多個領域的應用潛力,並結合實際案例與操作指南,助力讀者掌握行業大模型的核心技術與實踐方法。 全書共11章,分為基礎理論篇、技術方法篇和應用實踐篇。基礎理論篇(第1~4章)從行業大模型的基本概念出發,闡述了其理論基礎、發展必要性、數據收集與預處理方法,以及大模型測試與評估的多維度指標體系,為後續技術實踐奠定紮實基礎。技術方法篇(第5~8章)深入探討了行業大模型的核心技術,包括繼續預訓練、微調、基於人類反饋的強化學習和提示工程,詳細解析了各項技術的原理、實現方法與優化策略,幫助讀者掌握模型定制化的關鍵技術。應用實踐篇(第9~11章)聚焦行業大模型的實際應用,涵蓋檢索增強生成技術、微調平臺操作指南及行業智能體的構建與落地案例,通過代碼示例和實戰演練,指導讀者將理論轉換為行業解決方案。 本書緊密結合行業熱點,既適合人工智能從業者、企業技術決策者參考,也可作為高校和培訓機構的教學用書。書中配有豐富的案例、代碼和工具資源,便於讀者快速上手並深入理解行業大模型的技術脈絡與應用場景,為智能化轉型提供有力支持。 "

作者簡介

王瑞平,湖北師範大學講師,高級工程師(人工智能),珠海市高層次人才,武漢科技大學博士,華中科技大學與遠光研究院人工智能實驗室聯合博士後研究員,IEEE Senior Member,武漢科技大學校外導師,SCI期刊審稿人;遠光大模型-遠光智言研發團隊技術負責人;研究領域包括生成式人工智能(大語言模型和多模態大模型方向)、自然語言處理、圖像處理、計算機視覺和機器視覺等;負責華東科技項目兩項,參與珠海市產學研項目1項(子項目負責人),NW揭榜掛帥項目1項;負責遠光研究院立項項目兩項;發表學術論文10余篇,其中SCI檢索7篇、北大核心期刊4篇,參與國家自然科學基金項目1項,申請並授權發明專利10余項。

目錄大綱

目錄

配套資源(教學課件、源碼)

基礎理論篇

第1章行業大模型概述(26min)

1.1什麼是行業大模型

1.1.1行業大模型的定義

1.1.2行業大模型的特點與優勢

1.1.3行業大模型的核心能力、任務分類和應用場景

1.2為什麼需要行業大模型

1.2.1行業需求決定了行業大模型出現的必然性

1.2.2行業大模型的價值

1.2.3行業大模型如何推動產業智能化發展

1.3行業大模型與通用大模型的異同點解析

1.3.1需要明晰的幾個概念

1.3.2行業大模型與通用大模型的關系

1.3.3行業大模型與通用大模型的差異

1.4本章小結

第2章行業大模型的核心技術與發展趨勢(48min)

2.1行業大模型的關鍵技術要素

2.1.1模型架構

2.1.2模型網絡配置

2.1.3增量預訓練

2.1.4微調

2.2行業大模型發展的必要條件

2.2.1大規模高質量的行業數據

2.2.2充足且兼容的算力支持

2.2.3創新及優化模型算法設計

2.2.4配套的模型測評機制

2.2.5倫理規範與政策約束

2.3行業大模型的未來趨勢

2.3.1行業大模型的規模化與精細化發展

2.3.2多模態融合與跨領域模型發展

2.3.3人機協作與智能體的未來應用

2.3.4行業大模型的可解釋性與透明性

2.4本章小結

第3章數據收集和預處理技術(55min)

3.1數據對於行業大模型構建的重要性

3.1.1行業數據的多樣性與準確性

3.1.2數據規模與模型泛化能力的關系

3.1.3數據在模型可解釋性和決策中的貢獻

3.2數據收集的策略與挑戰

3.2.1行業大數據的來源與采集方式

3.2.2數據采集中的隱私與合規性問題

3.2.3數據樣本平衡與代表性問題

3.2.4動態更新與實時數據收集技術

3.3廣義數據預處理的方法與內容

3.3.1文檔去重與數據去重

3.3.2數據整合與存儲

3.3.3數據去噪與清洗

3.3.4特征工程與特征選擇

3.3.5數據增強與數據擴展

3.3.6數據分塊與批處理優化

3.3.7數據標註與篩選

3.3.8數據質量評估

3.4本章小結

第4章大模型測評(79min)

4.1大模型的主要評價因素

4.1.1性能指標

4.1.2模型的可解釋性

4.1.3計算效率

4.1.4泛化能力

4.1.5數據依賴性

4.1.6公平性與偏差

4.1.7適應性與遷移學習

4.1.8安全性與穩健性

4.1.9生態適應性

4.2常用測評數據集介紹

4.2.1英文測評數據集

4.2.2中文測評數據集

4.2.3多語言測評數據集

4.3數據集劃分: 訓練集、驗證集與測試集的使用

4.3.1訓練集

4.3.2驗證集

4.3.3測試集 

4.3.4數據集劃分的常見策略

4.3.5數據集劃分的挑戰與考慮因素

4.4主流自動化測試平臺

4.4.1lmevaluationharness

4.4.2OpenCompass

4.4.3Open LLM Leaderboard

4.4.4FlagEval

4.5如何提高模型評估的準確性

4.5.1通過交叉驗證提升評估穩健性

4.5.2數據集質量對評估結果的影響

4.5.3選擇合適的評估指標

4.5.4應用A/B測試進行實際場景驗證

4.5.5通過反饋回路不斷優化模型評估過程

4.6本章小結

技術方法篇

第5章構建行業通用能力: 繼續預訓練(11min)

5.1繼續預訓練概述

5.1.1定義與背景

5.1.2作用與優勢

5.2繼續預訓練的技術實現

5.2.1數據準備與模型選擇

5.2.2訓練環境準備

5.2.3啟動第1個繼續預訓練程序

5.3本章小結

第6章拓展領域專業知識: 指令微調(17min)

6.1指令微調概述

6.1.1定義與背景

6.1.2意義與價值

6.1.3困難與挑戰

6.2指令微調的技術實現

6.2.1數據準備與模型選擇

6.2.2啟動第1個微調訓練

6.2.3微調技術的優化與挑戰

6.3指令微調與繼續預訓練的差異

6.3.1目標不同

6.3.2數據集不同

6.3.3應用場景不同

6.3.4計算資源需求不同

6.3.5模型適應性不同

6.4本章小結

第7章規範行業道德水平: 人類反饋強化學習(18min)

7.1人類反饋強化學習基本概述

7.1.1定義與背景

7.1.2意義與價值

7.1.3困難與挑戰

7.2RLHF的技術實現

7.2.1RLHF的幾種主要實現方法

7.2.2RLHF的數據集準備

7.2.3啟動第1個RLHF訓練

7.3人類反饋強化學習與有監督微調的差異

7.3.1定義與核心目標不同

7.3.2訓練目標和優化方式不同

7.3.3數據依賴與標註需求不同

7.3.4模型行為差異

7.3.5應用場景上的差異

7.3.6挑戰與局限性

7.4本章小結

第8章優化應用交互體驗: 提示工程(51min)

8.1提示工程的基本概述

8.1.1何為Prompt?從交互窗口的視角來解讀Prompt

8.1.2Prompt到底是什麼

8.1.3Prompt Engineering是什麼

8.1.4模型參數設置

8.2提示工程的技術實現

8.2.1基於文本描述和內容示例的提示方法

8.2.2基於事實和知識的提示方法

8.2.3其他提示方法

8.3提示工程的應用

8.3.1生成行業和領域數據

8.3.2生成代碼

8.3.3邏輯推理

8.3.4減少危害

8.3.5用戶交互

8.3.6微調和優化

8.3.7提示一致性和連貫性

8.3.8管理情感和語調

8.4本章小結

應用實踐篇

第9章檢索增強生成的應用實踐(22min)

9.1RAG技術基礎與核心價值

9.1.1什麼是RAG

9.1.2技術演進:  從檢索機器人到LLMs的突破

9.1.3技術原理拆解

9.1.4商業價值分析

9.2基礎RAG的關鍵組件和應用實踐

9.2.1準備工作

9.2.2幾種推薦的安裝方式

9.2.3配置大模型API

9.2.4代碼層搭建基礎版RAG

9.3高級RAG應用實踐

9.4模塊化RAG應用實踐

9.5本章小結

第10章微調一個行業大模型(33min)

10.1微調的核心價值與實現基礎

10.1.1微調的背景與核心價值

10.1.2技術實現框架與關鍵要素

10.1.3技術挑戰與前沿突破

10.2借助通用平臺實現無代碼微調

10.2.1微調平臺介紹

10.2.2財務大模型無代碼微調實踐

10.2.3無代碼微調的優勢與局限性分析

10.3利用雲服務平臺實現低門檻微調

10.3.1雲服務平臺介紹

10.3.2AI雲平臺微調優勢與局限性分析

10.4在自有服務器完成全流程微調

10.4.1訓練平臺搭建

10.4.2基礎環境和運行環境配置

10.4.3數據集準備

10.4.4開始微調訓練

10.4.5推理測試

10.5本章小結

第11章行業和領域智能體構建(12min)

11.1智能體簡介

11.1.1定義與基本概念

11.1.2智能體的發展歷程

11.1.3智能體的核心功能模塊

11.1.4主要的智能體框架介紹

11.2構建文本編輯領域智能體

11.2.1高效內容生成智能體

11.2.2創意靈感激發智能體

11.2.3文本編輯與優化智能體

11.2.4內容自動審核智能體

11.3構建娛樂創意行業智能體

11.3.1創意圖像生成智能體

11.3.2人像風格重繪智能體

11.3.3圖像背景生成智能體

11.3.4藝術字生成智能體

11.3.5專屬音樂合成智能體

11.3.6創意視頻生成智能體

11.4構建面向科研領域的智能體

11.4.1代碼生成智能體

11.4.2代碼解析智能體

11.4.3代碼優化智能體

11.5本章小結

參考文獻