Python大模型應用開發:核心技術與項目實戰

宿永傑

相關主題

商品描述

(1)打通完整Python開發鏈條:系統梳理大模型應用開發全流程,涵蓋分詞、詞嵌入、向量數據庫、提示詞工程、模型微調與部署等關鍵技術,幫助開發者構建成體系的技能框架。
(2)主流工具一網打盡:聚焦Hugging Face、LangChain、RAG等當前最熱門的大模型開發框架,講解其原理與實操方法,配合可運行的代碼與實戰案例,快速上手、易於應用。
(3)項目實戰導向,深度挖掘數字人場景:通過多個數字人電商項目實戰,完整展示智能系統構建方式,貼近熱門應用場景,增強實戰價值與可落地性。
(4)內容循序漸進,初學與進階開發者友好:全書由淺入深、結構清晰,從基礎認知到高級實戰,兼顧知識體系構建與動手能力提升,既適合AI開發初學者,也能幫助有經驗的工程師補齊短板。
(5)作者技術實力深厚,經驗提煉與代碼實操雙助力:作者傾力總結多年AI架構實戰經驗,結合真實項目中的痛點問題,提供一線開發技巧與工程化思維,幫助開發者在實踐中掌握大模型開發的“術”與“道”。

作者簡介

宿永傑     擁有近10年的技術研發經驗,專註於人工智能(AI)技術架構與研發,研究方向涵蓋大數據處理、AI應用架構及智能系統開發。目前從事智能座艙語音對話系統的架構設計與研發工作。     熱衷於技術分享,長期活躍於技術社區,是CSDN博客專家,全網粉絲量超15萬。     公眾號 「AI研習社」。

目錄大綱

前言
第一篇 基礎知識
  第1章  大語言模型
    1.1  大語言模型概述
      1.1.1  大語言模型的定義
      1.1.2  大語言模型的分類
      1.1.3  大語言模型的應用場景
    1.2  大語言模型的演變與發展
      1.2.1  大語言模型的網路架構演變
      1.2.2  大語言模型發展的關鍵事件
    1.3  大語言模型的基礎知識
      1.3.1  什麼是算力
      1.3.2  顯卡的基礎知識
      1.3.3  大語言模型的參數數量與精度
      1.3.4  大語言模型的基本單位
      1.3.5  通用人工智慧
    1.4  小結
  第2章  Python大語言模型應用開發
    2.1  Python大語言模型應用開發的基礎知識
      2.1.1  Python編程的基礎知識
      2.1.2  介面的設計與優化
      2.1.3  大語言模型介面開發實戰
    2.2  Docker容器的基礎知識
      2.2.1  Docker基礎命令
      2.2.2  Docker構建鏡像
      2.2.3  Docker容器編排
    2.3  大語言模型與NLP
      2.3.1  NLP的研究任務
      2.3.2  傳統NLP的技術實現路徑
      2.3.3  大語言模型對傳統NLP的影響
    2.4  小結
第二篇 開發技術
  第3章  分詞技術
    3.1  分詞
      3.1.1  什麼是分詞
      3.1.2  英文分詞
      3.1.3  中文分詞
      3.1.4  製作詞雲圖
    3.2  常見的分詞演算法
      3.2.1  基於規則的分詞演算法
      3.2.2  基於統計的分詞演算法
      3.2.3  基於深度學習的分詞演算法
      3.2.4  基於預訓練語言模型的分詞演算法
    3.3  使用大語言模型進行分詞
      3.3.1  基於ChatGPT服務的分詞
      3.3.2  基於本地大語言模型的分詞
    3.4  小結
  第4章  詞嵌入技術
    4.1  詞袋模型
      4.1.1  詞袋模型的基本概念和原理

      4.1.2  詞袋模型的構建
    4.2  詞向量模型
      4.2.1  One-Hot編碼
      4.2.2  Word2Vec模型
    4.3  大語言模型生成Embedding
      4.3.1  使用ChatGPT生成Embedding
      4.3.2  使用Text2Vec生成Embedding
      4.3.3  使用sentence-transformers生成Embedding
      4.3.4  使用Transformers庫生成Embedding
      4.3.5  統計輸入文本的Token數
    4.4  大語言模型的Embedding應用
      4.4.1  Embedding數據集準備
      4.4.2  Embedding數據2D可視化
      4.4.3  Embedding中文相似度計算
    4.5  小結
  第5章  向量資料庫
    5.1  向量資料庫簡介
      5.1.1  向量資料庫的緣起
      5.1.2  向量資料庫的特點
      5.1.3  與傳統資料庫的比較
      5.1.4  向量資料庫的應用場景
    5.2  向量資料庫的原理
      5.2.1  向量距離的度量
      5.2.2  相似度搜索演算法
    5.3  向量資料庫的應用
      5.3.1  FAISS向量資料庫入門
      5.3.2  FAISS的相似度度量
      5.3.3  FAISS的索引分類
      5.3.4  FAISS的索引創建與操作
      5.3.5  FAISS的優化
    5.4  小結
  第6章  提示詞工程與優化
    6.1  認識提示詞工程
      6.1.1  人機交互的演進
      6.1.2  什麼是提示詞
      6.1.3  提示詞工程
    6.2  提示詞工程的使用技巧
      6.2.1  使用文本分隔符
      6.2.2  賦予模型角色
      6.2.3  將過程分步拆解
      6.2.4  盡可能量化需求
      6.2.5  提供正反示例
      6.2.6  要求結構化輸出
      6.2.7  合理進行限制
      6.2.8  使用鏈式思維
    6.3  使用提示詞完成NLP任務
      6.3.1  使用提示詞進行分詞
      6.3.2  使用提示詞提取關鍵詞
      6.3.3  使用提示詞進行文本分類
      6.3.4  使用提示詞進行情感分析

      6.3.5  使用提示詞進行文本摘要
      6.3.6  使用提示詞進行中英文翻譯
    6.4  小結
  第7章  Hugging Face入門與開發
    7.1  Hugging Face簡介
      7.1.1  什麼是Hugging Face
      7.1.2  Hugging Face Hub客戶端庫
    7.2  Hugging Face數據集工具
      7.2.1  數據集工具簡介
      7.2.2  數據集工具的基本操作
    7.3  Hugging Face模型工具
      7.3.1  Transformers簡介
      7.3.2  數據預處理
      7.3.3  模型微調
      7.3.4  模型評價指標
    7.4  小結
  第8章  LangChain入門與開發
    8.1  初識LangChain
      8.1.1  LangChain簡介
      8.1.2  LangChain的開發生態
    8.2  模型I/O
      8.2.1  模型I/O簡介
      8.2.2  提示詞模板
      8.2.3  模型包裝器
      8.2.4  輸出解析器
    8.3  數據增強
      8.3.1  文檔載入器
      8.3.2  文檔轉換器
      8.3.3  文本嵌入
      8.3.4  向量存儲庫
      8.3.5  檢索器
    8.4  鏈
    8.5  小結
  第9章  大語言模型微調
    9.1  大語言模型微調概述
      9.1.1  為什麼需要微調
      9.1.2  少樣本提示與微調
      9.1.3  微調的基本流程
    9.2  大語言模型的微調策略
      9.2.1  全面微調
      9.2.2  參數高效微調
    9.3  基於ChatGPT的微調
      9.3.1  使用Fine-Tuning UI微調
      9.3.2  使用CLI命令微調
      9.3.3  使用API微調
    9.4  基於Hugging Face的開源大模型微調
      9.4.1  Accelerate介紹
      9.4.2  PEFT介紹
    9.5  小結
  第10章  大語言模型的部署

    10.1  MLOps與LLMOps
      10.1.1  DevOps簡介
      10.1.2  MLOps簡介
      10.1.3  LLMOps簡介
    10.2  大語言模型量化部署
        10.2.1 Qwen2-0.5  B簡介
      10.2.2  ChatGLM3-6B簡介
        10.2.3 基於Qwen2-0.5  B的CPU推理
      10.2.4  基於ChatGLM3-6B的GPU量化推理
    10.3  大語言模型部署實戰
      10.3.1  基於Gradio框架的網頁部署
      10.3.2  基於FastAPI框架的介面部署
    10.4  小結
第三篇 項目實戰
  第11章  數字人電商直播
    11.1  數字人直播概述
      11.1.1  數字人簡介
      11.1.2  品牌虛擬代言人
      11.1.3  數字人與「人貨場」
    11.2  2D數字人核心技術
      11.2.1  AI生成文案
      11.2.2  AI語音合成
      11.2.3  2D數字人口型驅動
      11.2.4  2D數字人直播推流
    11.3  2D數字人電商直播項目實戰
      11.3.1  數字人直播流程簡介
      11.3.2  大語言模型生成商品臺詞
      11.3.3  TTS將商品臺詞轉成音頻
      11.3.4  口型驅動生成2D數字人
      11.3.5  2D數字人推流到直播間
    11.4  小結
  第12章  數字人口播臺詞生成
    12.1  數字人口播臺詞生成概述
      12.1.1  數字人直播的臺詞特點
      12.1.2  數字人直播的臺詞編排
      12.1.3  數字人直播的防封策略
    12.2  數字人口播臺詞提示詞模板
      12.2.1  整段式商品臺詞提示詞模板
      12.2.2  分段式商品臺詞提示詞模板
      12.2.3  商品互動問答臺詞提示詞模板
    12.3  數字人口播臺詞生成項目實戰
      12.3.1  使用提示詞模板生成口播臺詞
      12.3.2  品牌知識庫和提示詞模板結合生成口播臺詞
    12.4  小結
  第13章  數字人直播間問答分類
    13.1  文本分類簡介
      13.1.1  文本分類的方法
      13.1.2  文本分類的模型及特點
      13.1.3  文本分類的發展與挑戰
    13.2  文本分類器的訓練過程

      13.2.1  傳統分類器的訓練
      13.2.2  提示詞少樣本學習
      13.2.3  定製化微調預訓練模型
    13.3  數字人直播間問答分類項目實戰
      13.3.1  直播間問答分類簡介
      13.3.2  直播間問答分類流程
      13.3.3  直播間問答分類實戰
    13.4  小結
  第14章  數字人直播間互動問答
    14.1  RAG知識庫構建
      14.1.1  RAG知識庫基本概念
      14.1.2  RAG知識庫構建流程
      14.1.3  RAG知識庫的發展與挑戰
    14.2  RAG知識庫的優化策略
      14.2.1  非結構化文檔解析優化
      14.2.2  文檔分塊策略優化
      14.2.3  中文Embedding優化
      14.2.4  Rewrite優化
      14.2.5  Rerank優化
      14.2.6  混合技術優化信息檢索
    14.3  數字人直播間互動問答項目實戰
      14.3.1  數字人直播間互動問答簡介
      14.3.2  基於關鍵詞檢索的互動問答實現
      14.3.3  基於RAG向量庫檢索的互動問答實現
      14.3.4  基於RAG混合檢索的互動問答實現
      14.3.5  基於大語言模型微調的互動問答實現
    14.4  小結
  第15章  數字人直播間數據分析Text2SQL
    15.1  數據分析的本質
    15.2  數據分析的思維和方法論
      15.2.1  費米估計
      15.2.2  辛普森悖論
      15.2.3  必知必會的兩個原則
      15.2.4  三種思考模型
      15.2.5  四大戰略分析工具
      15.2.6  五大生命周期理論
      15.2.7  數字化營銷的「六脈神劍」
    15.3  數字人直播間數據分析Text2SQL項目實戰
      15.3.1  Text2SQL概述
      15.3.2  Text2SQL開源項目簡介
      15.3.3  Text2SQL項目實戰
    15.4  小結