大模型時代——行業大模型構建及關鍵技術解密(微課視頻版)
王瑞平、張美航
- 出版商: 清華大學
- 出版日期: 2026-05-01
- 售價: $414
- 語言: 簡體中文
- ISBN: 7302715017
- ISBN-13: 9787302715016
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
商品描述
作者簡介
目錄大綱
目錄
配套資源(教學課件、源碼)
基礎理論篇
第1章行業大模型概述(26min)
1.1什麼是行業大模型
1.1.1行業大模型的定義
1.1.2行業大模型的特點與優勢
1.1.3行業大模型的核心能力、任務分類和應用場景
1.2為什麼需要行業大模型
1.2.1行業需求決定了行業大模型出現的必然性
1.2.2行業大模型的價值
1.2.3行業大模型如何推動產業智能化發展
1.3行業大模型與通用大模型的異同點解析
1.3.1需要明晰的幾個概念
1.3.2行業大模型與通用大模型的關系
1.3.3行業大模型與通用大模型的差異
1.4本章小結
第2章行業大模型的核心技術與發展趨勢(48min)
2.1行業大模型的關鍵技術要素
2.1.1模型架構
2.1.2模型網絡配置
2.1.3增量預訓練
2.1.4微調
2.2行業大模型發展的必要條件
2.2.1大規模高質量的行業數據
2.2.2充足且兼容的算力支持
2.2.3創新及優化模型算法設計
2.2.4配套的模型測評機制
2.2.5倫理規範與政策約束
2.3行業大模型的未來趨勢
2.3.1行業大模型的規模化與精細化發展
2.3.2多模態融合與跨領域模型發展
2.3.3人機協作與智能體的未來應用
2.3.4行業大模型的可解釋性與透明性
2.4本章小結
第3章數據收集和預處理技術(55min)
3.1數據對於行業大模型構建的重要性
3.1.1行業數據的多樣性與準確性
3.1.2數據規模與模型泛化能力的關系
3.1.3數據在模型可解釋性和決策中的貢獻
3.2數據收集的策略與挑戰
3.2.1行業大數據的來源與采集方式
3.2.2數據采集中的隱私與合規性問題
3.2.3數據樣本平衡與代表性問題
3.2.4動態更新與實時數據收集技術
3.3廣義數據預處理的方法與內容
3.3.1文檔去重與數據去重
3.3.2數據整合與存儲
3.3.3數據去噪與清洗
3.3.4特征工程與特征選擇
3.3.5數據增強與數據擴展
3.3.6數據分塊與批處理優化
3.3.7數據標註與篩選
3.3.8數據質量評估
3.4本章小結
第4章大模型測評(79min)
4.1大模型的主要評價因素
4.1.1性能指標
4.1.2模型的可解釋性
4.1.3計算效率
4.1.4泛化能力
4.1.5數據依賴性
4.1.6公平性與偏差
4.1.7適應性與遷移學習
4.1.8安全性與穩健性
4.1.9生態適應性
4.2常用測評數據集介紹
4.2.1英文測評數據集
4.2.2中文測評數據集
4.2.3多語言測評數據集
4.3數據集劃分: 訓練集、驗證集與測試集的使用
4.3.1訓練集
4.3.2驗證集
4.3.3測試集
4.3.4數據集劃分的常見策略
4.3.5數據集劃分的挑戰與考慮因素
4.4主流自動化測試平臺
4.4.1lmevaluationharness
4.4.2OpenCompass
4.4.3Open LLM Leaderboard
4.4.4FlagEval
4.5如何提高模型評估的準確性
4.5.1通過交叉驗證提升評估穩健性
4.5.2數據集質量對評估結果的影響
4.5.3選擇合適的評估指標
4.5.4應用A/B測試進行實際場景驗證
4.5.5通過反饋回路不斷優化模型評估過程
4.6本章小結
技術方法篇
第5章構建行業通用能力: 繼續預訓練(11min)
5.1繼續預訓練概述
5.1.1定義與背景
5.1.2作用與優勢
5.2繼續預訓練的技術實現
5.2.1數據準備與模型選擇
5.2.2訓練環境準備
5.2.3啟動第1個繼續預訓練程序
5.3本章小結
第6章拓展領域專業知識: 指令微調(17min)
6.1指令微調概述
6.1.1定義與背景
6.1.2意義與價值
6.1.3困難與挑戰
6.2指令微調的技術實現
6.2.1數據準備與模型選擇
6.2.2啟動第1個微調訓練
6.2.3微調技術的優化與挑戰
6.3指令微調與繼續預訓練的差異
6.3.1目標不同
6.3.2數據集不同
6.3.3應用場景不同
6.3.4計算資源需求不同
6.3.5模型適應性不同
6.4本章小結
第7章規範行業道德水平: 人類反饋強化學習(18min)
7.1人類反饋強化學習基本概述
7.1.1定義與背景
7.1.2意義與價值
7.1.3困難與挑戰
7.2RLHF的技術實現
7.2.1RLHF的幾種主要實現方法
7.2.2RLHF的數據集準備
7.2.3啟動第1個RLHF訓練
7.3人類反饋強化學習與有監督微調的差異
7.3.1定義與核心目標不同
7.3.2訓練目標和優化方式不同
7.3.3數據依賴與標註需求不同
7.3.4模型行為差異
7.3.5應用場景上的差異
7.3.6挑戰與局限性
7.4本章小結
第8章優化應用交互體驗: 提示工程(51min)
8.1提示工程的基本概述
8.1.1何為Prompt?從交互窗口的視角來解讀Prompt
8.1.2Prompt到底是什麼
8.1.3Prompt Engineering是什麼
8.1.4模型參數設置
8.2提示工程的技術實現
8.2.1基於文本描述和內容示例的提示方法
8.2.2基於事實和知識的提示方法
8.2.3其他提示方法
8.3提示工程的應用
8.3.1生成行業和領域數據
8.3.2生成代碼
8.3.3邏輯推理
8.3.4減少危害
8.3.5用戶交互
8.3.6微調和優化
8.3.7提示一致性和連貫性
8.3.8管理情感和語調
8.4本章小結
應用實踐篇
第9章檢索增強生成的應用實踐(22min)
9.1RAG技術基礎與核心價值
9.1.1什麼是RAG
9.1.2技術演進: 從檢索機器人到LLMs的突破
9.1.3技術原理拆解
9.1.4商業價值分析
9.2基礎RAG的關鍵組件和應用實踐
9.2.1準備工作
9.2.2幾種推薦的安裝方式
9.2.3配置大模型API
9.2.4代碼層搭建基礎版RAG
9.3高級RAG應用實踐
9.4模塊化RAG應用實踐
9.5本章小結
第10章微調一個行業大模型(33min)
10.1微調的核心價值與實現基礎
10.1.1微調的背景與核心價值
10.1.2技術實現框架與關鍵要素
10.1.3技術挑戰與前沿突破
10.2借助通用平臺實現無代碼微調
10.2.1微調平臺介紹
10.2.2財務大模型無代碼微調實踐
10.2.3無代碼微調的優勢與局限性分析
10.3利用雲服務平臺實現低門檻微調
10.3.1雲服務平臺介紹
10.3.2AI雲平臺微調優勢與局限性分析
10.4在自有服務器完成全流程微調
10.4.1訓練平臺搭建
10.4.2基礎環境和運行環境配置
10.4.3數據集準備
10.4.4開始微調訓練
10.4.5推理測試
10.5本章小結
第11章行業和領域智能體構建(12min)
11.1智能體簡介
11.1.1定義與基本概念
11.1.2智能體的發展歷程
11.1.3智能體的核心功能模塊
11.1.4主要的智能體框架介紹
11.2構建文本編輯領域智能體
11.2.1高效內容生成智能體
11.2.2創意靈感激發智能體
11.2.3文本編輯與優化智能體
11.2.4內容自動審核智能體
11.3構建娛樂創意行業智能體
11.3.1創意圖像生成智能體
11.3.2人像風格重繪智能體
11.3.3圖像背景生成智能體
11.3.4藝術字生成智能體
11.3.5專屬音樂合成智能體
11.3.6創意視頻生成智能體
11.4構建面向科研領域的智能體
11.4.1代碼生成智能體
11.4.2代碼解析智能體
11.4.3代碼優化智能體
11.5本章小結
參考文獻







