理解大語言模型:學習其基本思想和技術
何明 鄒明光 董經緯
- 出版商: 西安交通大學
- 出版日期: 2024-09-01
- 定價: $450
- 售價: 7.5 折 $338
- 語言: 簡體中文
- 頁數: 180
- ISBN: 7569338812
- ISBN-13: 9787569338812
-
相關分類:
Large language model
立即出貨 (庫存 < 4)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
隨著人工智能技術飛速發展,近兩年出現了以chatGPT為代表的智能化程度極高的處理工具,支撐它們的關鍵技術就是大語言模型(LLM)。大語言模型(LLM)是人工智能在自然語言處理領域的應用,也是人工智能的最新前沿,源於自然語言處理(NLP)和深度學習的研究發展。本書首先介紹了大語言模型的基本情況,講述了自然語言處理的發展歷史、基本概念和主要任務。以一種重要的大語言模型Transformer模型為例介紹了大建模語言的基礎模型、應用方法、過擬合問題等。最後介紹了生成式預訓練Transformer模型、Meta人工智能大語言模型等幾種常用的大語言模型。
作者簡介
他是培生集團斯裏蘭卡公司的高級軟件架構師,擁有超過15年的行業經驗。他也是人工智能、機器學習、教育深度學習和計算機視覺領域的發明家、作家和研究員。蒂姆拉擁有斯裏蘭卡科倫坡大學計算機科學理學碩士學位和信息技術學士學位。他也是TOGAF認證的企業架構師。他為在線學習平臺申請了三項專利(動態神經網絡和語義學領域)。他出版了三本關於深度學習和計算機視覺的書。
目錄大綱
第1章 緒 論
1.1 人工智能簡史
1.2 大語言模型所處的地位
1.3 小結
第2章 自然語言處理的前世今生
2.1 自然語言處理的歷史
形式語法
轉換語法與生成語法
句法解析
語境與語義
語言理解
知識工程
概率模型
隱馬爾可夫模型
統計語言模型
最大熵模型
條件隨機場
大型註釋語料庫
詞義消歧
機器翻譯
信息檢索
統計方法
大型文本語料庫的可用性
自然語言處理任務的監督學習
命名實體識別
情感分析
詞嵌入簡介
深度學習與神經網絡
在現實世界的應用中部署
2.2 自然語言處理的任務
2.3 自然語言處理的基本概念
詞元化
語料庫與詞庫
詞嵌入
2.4 語言建模
N元語言模型
神經語言模型
2.5 小結
第3章 Transformer模型
3.1 註意力機制
3.2 Transformer架構
編碼器
解碼器
縮放點積
多頭註意力
3.3 小結
第4章 大語言模型大在哪?
4.1 如何使Transformer模型成為大語言模型
參數數量
數據規模
計算能力
微調和任務自適應
能力
為什麼參數很重要
計算需求
過擬合的風險
模型大小
數據的規模
4.2 大語言模型的類型
基於架構的分類
基於訓練目標的分類
基於使用的分類
4.3 基礎模型
在廣泛數據上進行預訓練
微調和靈活性
遷移學習
規模經濟
通用能力
微調功能
遷移學習
規模經濟
快速部署
跨學科應用
減少訓練開銷
持續適應性
人工智能的民主化
4.4 應用大語言模型
提示工程
微調
4.5 小結
第5章 流行的大語言模型
5.1 生成式預訓練Transformer模型
5.2 基於Transformer模型的雙向編碼器表示
5.3 Pathways語言模型
5.4 大語言模型Meta AI
5.5 小結
第6章 挑戰、機遇和誤區
6.1 大語言模型與超人工智能的挑戰
人工智能的級別
超人工智能帶來的人類存亡風險
大語言模型適用的場景
6.2 誤解與濫用
6.3 機遇
6.4 小結
