大模型十講
李崇軒
- 出版商: 機械工業
- 出版日期: 2025-09-01
- 售價: $594
- 語言: 簡體中文
- 頁數: 318
- ISBN: 711178555X
- ISBN-13: 9787111785552
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
大模型通過在海量數據上進行學習得到通用知識和模式,在自然語言處理、計算機視覺和強化學習等領域表現出強大的通用性和遷移學習能力,BERT、GPT、Stable Diffusion、Sora等功能強大的模型引發了廣泛的關註。大模型可能是人工智能領域的顛覆性新範式,因此應當作為計算機、人工智能相關方向的研究生教學的一個重要內容。本書共十講,按照基本原理、預訓練技術、重要應用三個層面展開,從生成模型、自監督學習、強化學習的基本原理出發,系統介紹大語言模型、多模態大模型、決策大模型的預訓練技術,以及衍生的自主智能體和世界模擬器等重要應用。本書適合作為計算機、人工智能方向高年級本科生、研究生的教材,也適合作為人工智能領域研究人員和從業人員的參考書。
作者簡介
李崇軒,中國人民大學高瓴人工智能學院準聘副教授、博士生導師,2010-2019年獲清華大學學士和博士學位。主要研究機器學習、深度生成模型,代表性工作Analytic-DPM、DPM-Solver作為核心采樣技術部署於DALL·E 2、Stable Diffusion等。獲 會議ICLR傑出論文獎、吳文俊 青年獎、吳文俊人工智能自然科學一等獎、中國計算機學會 博士論文、ACM SIGAI 中國新星獎等。入選博新計劃、北京市科技新星,主持、參與多項 自然科學基金、科技部課題。擔任ICLR 2024、NeurIPS 2024領域 。