軟件系統優化
郭健美 黃波 劉通宇 林曉東 趙鵬
- 出版商: 機械工業
- 出版日期: 2025-06-01
- 售價: $534
- 貴賓價: 9.5 折 $507
- 語言: 簡體中文
- 頁數: 293
- ISBN: 7111772245
- ISBN-13: 9787111772248
-
相關分類:
Computer-architecture
立即出貨
買這商品的人也買了...
-
$1,000Advanced Digital Logic Design Using Verilog, State Machines, and Synthesis for FPGA's (Hardcover)
-
$7,930$7,534 -
$780$663 -
$1,800$1,764 -
$390$308 -
$400$360 -
$713$677 -
$1,680$1,646 -
$594$564 -
$468$445 -
$1,200$948
相關主題
商品描述
本書詳細介紹了軟件系統優化的原理、技術和常用方法。本書強調從系統視角進行優化,提出了“數據驅動的系統優化”方法,圍繞“軟件+硬件+數據”三個方面展開講解。本書共18章,分為五個部分。第1章和第2章從一個性能優化案例引入,概述了軟件系統優化的方法論。第二部分包括第3~6章,介紹了性能工程的基礎知識。第三部分包括第7~10章,介紹了計算機體系結構優化的相關知識。第四部分包括第11~16章,介紹了編譯優化的相關知識。第五部分包括第17章和第18章,針對新興場景下的系統優化技術展開專題討論。
作者簡介
郭健美 2011年在上海交通大學獲得博士學位後於加拿大滑鐵盧大學從事博士後研究。2021年至今在華東師範大學任教授,與黃波教授一起開設了“軟件系統優化”課程,入選2023年上海高校市級重點課程。曾在華東理工大學任副教授,在阿裏巴巴集團任 技術專家並負責阿裏雲基礎軟件部系統性能團隊。研究興趣為軟件系統的性能優化與質量保障,主持 自然科學基金等科研項目,2017年入選上海市浦江人才計劃,2022年入選東方英才計劃青年項目。
黃波 華東師範大學特聘教授,研究方向為數據驅動的系統優化。他在覆旦大學獲得博士學位,在編譯技術及系統優化方面積累了豐富的項目經驗,曾創建Intel中國編譯器團隊以及Intel中國系統優化技術中心。曾擔任過馭勢(上海)汽車科技有限公司總經理和華為鯤鵬計算的首席架構師。獲得2013-2014年度中國軟件和信息服務業領軍人物獎項以及2022年高等教育(本科) 教學成果二等
劉通宇華東師範大學數據科學與工程學院博士研究生,師從郭健美教授開展計算機體系結構與性能工程的研究,專註於處理器微體系結構的性能測量與分析。負責研發了開源的跨平臺性能分析套件hperf,在多個CCF A 類 期刊發表學術論文,申請和授權 發明專利多項,作為核心成員參與了 自然科學基金面上項目、校企聯合實驗室以及產學研合作等多個項目,獲得2024年華東師範大學 碩士學位論文獎
林曉東 英特爾 首席工程師,負責管理英特爾中國數據中心和人工智能事業部軟件部,華東師範大學數據科學與工程學院的兼職教授。研究興趣為針對體系結構的計算和系統優化。在x86和英特爾GPU上設計和優化了多個深度學習框架,包括 PyTorch、TensorFlow 和 JAX等。帶領團隊進行了深度學習的關鍵負載(包含大語言模型、 系統、計算機視覺等)的優化,設計和研發了高性能二進制編譯器產品——英特爾 Bridge。擁有 外專利20余項,並兩次贏得英特爾成就獎。
趙鵬 英特爾人工智能與深度學習方向 工程師,研究興趣為人工智能硬件計算加速與軟件解決方案設計。獲2019年英特爾中國 獎(Intel China Awards)等多項榮譽,並發表多篇專利與技術論文。曾擔任NVIDIA 架構工程師和Cadence 軟件工程師,在多核、分布式及GPU通用計算領域積累了豐富的研究與實踐經驗。擅長並行算法的設計、實現與優化,以及解決性能瓶頸問題。
目錄大綱
推薦序一
推薦序二
前言
第一部分 緒論
第1章 開篇案例:矩陣乘法的性能優化
1.1 不同編程語言的實現
1.2 循環交換
1.3 編譯器的不同優化級別
1.4 多核並行優化
1.5 循環分塊
1.6 內建函數
1.7 本章小結
1.8 思考題
第2章 系統優化方法論概述
2.1 後摩爾時代性能優化的驅動力
2.2 數據驅動的系統優化方法
2.3 從單點到全局的系統觀
2.4 本章小結
2.5 思考題
第二部分 性能工程基礎
第3章 性能測量
3.1 測量方法
3.1.1 外部測量
3.1.2 內部測量
3.1.3 仿真測量
3.2 計時器的選擇
3.3 數據收集策略
3.3.1 計數型
3.3.2 采樣型
3.3.3 追蹤型
3.4 性能波動
3.5 測量開銷
3.6 測量誤差
3.7 本章小結
3.8 思考題
第4章 基準評測
4.1 基準評測程序
4.1.1 單一指令
4.1.2 指令組合
4.1.3 合成程序
4.1.4 程序內核
4.1.5 微基準評測程序
4.1.6 應用基準評測程序
4.2 標準化基準評測套件
4.2.1 SPEC CPU 2017
4.2.2 基準評測套件的開發標準
4.3 基準評測的策略
……
第三部分 計算機體系結構優化
第四部分 編譯優化
第五部分 專題討論