大模型基礎、架構與開發實戰

王振麗

  • 出版商: 化學工業
  • 出版日期: 2026-03-01
  • 售價: $594
  • 語言: 簡體中文
  • 頁數: 289
  • ISBN: 7122491323
  • ISBN-13: 9787122491329
  • 相關分類: Large language model
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書系統闡述了大模型基礎與架構的相關知識,全面覆蓋大模型開發、訓練、優化和部署的核心技術要點。全書共分為12章,從大模型的基本概念與發展背景、深度學習技術棧到模型的預訓練與微調,再到DeepSeek的混合專家模型系統和多模態大模型開發,深入講解了大模型的理論與實踐。內容涵蓋從數據預處理、網絡模型構建到高性能計算和模型優化的完整開發流程,為讀者提供了關於大模型的全景式指導。本書詳細講解了深度學習框架的選擇與應用、分布式訓練技術、數據管理與存儲優化以及硬件加速方案,幫助讀者在覆雜的大模型開發環境中快速入門並掌握核心技術。此外,針對模型的輸入輸出解析、性能評估與解釋、模型優化策略等關鍵環節,書中提供了豐富的理論講解與實際案例,幫助讀者全面理解大模型的開發過程與優化路徑。無論您是人工智能領域的技術開發者、科研人員,還是對大模型技術感興趣的初學者,抑或是相關專業的在校學生,本書都將為您提供從基礎到前沿的 指導,助您掌握大模型開發的核心技能與實踐方法。

最後瀏覽商品 (2)