Hands-On Generative AI with Transformers and Diffusion Models (Paperback)
暫譯: 實作生成式 AI:使用 Transformers 與擴散模型
Sanseviero, Omar, Cuenca, Pedro, Passos, Apolinário
- 出版商: O'Reilly
- 出版日期: 2024-12-31
- 定價: $2,640
- 售價: 9.5 折 $2,508
- 貴賓價: 9.0 折 $2,376
- 語言: 英文
- 頁數: 419
- 裝訂: Quality Paper - also called trade paper
- ISBN: 1098149246
- ISBN-13: 9781098149246
-
相關分類:
GAN 生成對抗網絡
立即出貨
買這商品的人也買了...
-
Power BI 入門 大數據視覺化 + 智慧決策 + 雲端分享 王者歸來 (全彩印刷)$620$490 -
$1,015MATLAB 金融風險管理師 FRM : 金融科技 Fintech 應用 -
Python 資料分析必備套件!Pandas 資料清理、重塑、過濾、視覺化 (Pandas 1.x Cookbook, 2/e)$780$616 -
真槍實彈做專案:PyQt5 極速開發視窗軟體$880$695 -
圖深度學習從理論到實踐$534$507 -
精通區塊鏈開發技術, 2/e$894$849 -
Hands-On Graph Neural Networks Using Python: Practical techniques and architectures for building powerful graph and deep learning apps with PyTorch (Paperback)$1,800$1,710 -
AI 神助攻!程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯$560$442 -
R 資料科學, 2/e (R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, 2/e)$980$774 -
LLM 的瑞士刀 - 用 LangChain 極速開發可擴充大型應用程式$880$695 -
LLM 走進你的電腦 - 自己動手開發大型語言模型應用$880$695 -
輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可$690$545 -
多 Agent 智慧體 - LangChain 大型 ReAct 系統開發$880$695 -
$659基於大模型的 RAG 應用開發與優化 — 構建企業級 LLM 應用 -
精通 Python 網路開發 (Mastering Python Networking, 4/e)$980$774 -
LLM 原理完整回顧 - 大型語言模型整體脈絡最詳細剖析$1,080$853 -
Notion X AI 高效管理 300招:筆記×資料庫×團隊協作×自動化,數位生活與工作最佳幫手, 2/e$560$442 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
$564DeepSeek 大模型高性能核心技術與多模態融合開發 -
$370DeepSeek全攻略(人人需要的AI通識課) -
AI 獨家解密 - DALL·E、Midjourney、Stable Diffusion Python 打開圖片生成原理潘朵拉盒子$980$774 -
大模型輕量化:模型壓縮與訓練加速$774$735 -
大模型知識增強:概念、方法與技術$708$673 -
OpenAI API 開發手冊 - 用 Responses API、Realtime API、MCP、Agents SDK、Function calling 打造即時語音、RAG、Agent 應用$790$624 -
零基礎 AI 編程:Cursor 助力 Vibe Coding 實踐$540$513
商品描述
Learn how to use generative media techniques with AI to create novel images or music in this practical, hands-on guide. Data scientists and software engineers will understand how state-of-the-art generative models work, how to fine-tune and adapt them to your needs, and how to combine existing building blocks to create new models and creative applications in different domains.
This book introduces theoretical concepts in an intuitive way, with extensive code samples and illustrations that you can run on services such as Google Colaboratory, Kaggle, or Hugging Face Spaces with minimal setup. You'll learn how to use open source libraries such as Transformers and Diffusers, conduct code exploration, and study several existing projects to help guide your work.
- Learn the fundamentals of classic and modern generative AI techniques
- Build and customize models that can generate text, images, and sound
- Explore trade-offs between training from scratch and using large, pretrained models
- Create models that can modify images by transferring the style of other images
- Tweak and bend transformers and diffusion models for creative purposes
- Train a model that can write text based on your style
- Deploy models as interactive demos or services
商品描述(中文翻譯)
學習如何使用生成媒體技術與 AI 創造新穎的圖像或音樂,這本實用的手冊將提供您動手操作的指導。數據科學家和軟體工程師將了解最先進的生成模型如何運作,如何根據您的需求進行微調和適應,以及如何結合現有的構建模塊來創建新的模型和在不同領域的創意應用。
本書以直觀的方式介紹理論概念,並提供大量的程式碼範例和插圖,您可以在 Google Colaboratory、Kaggle 或 Hugging Face Spaces 等服務上以最小的設置運行。您將學會如何使用開源庫,如 Transformers 和 Diffusers,進行程式碼探索,並研究幾個現有項目以幫助指導您的工作。
- 學習經典和現代生成 AI 技術的基本原理
- 構建和自定義可以生成文本、圖像和聲音的模型
- 探索從零開始訓練與使用大型預訓練模型之間的權衡
- 創建可以通過轉移其他圖像風格來修改圖像的模型
- 調整和改變變壓器和擴散模型以達到創意目的
- 訓練一個可以根據您的風格撰寫文本的模型
- 將模型部署為互動演示或服務