現代 CPU 性能分析與化 (原書第2版)
[美]丹尼斯·巴赫瓦洛夫(Denis Bakhvalov) 朱金鵬 李成棟 俞峰
- 出版商: 機械工業
- 出版日期: 2026-06-01
- 售價: $774
- 語言: 簡體中文
- 頁數: 380
- ISBN: 7111807715
- ISBN-13: 9787111807711
-
相關分類:
Computer-architecture
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
Effective STL: 50 Specific Ways to Improve Your Use of the Standard Template Library (Paperback)$2,130$2,023 -
編譯系統設計 (Compilers: Principles, Techniques, and Tools, 2/e)$960$864 -
物件導向設計模式-可再利用物件導向軟體之要素 (精裝典藏版) (Design Patterns: Elements of Reusable Object-Oriented Software)$550$550 -
作業系統精論, 9/e (授權經銷版)$700$665 -
$354並行演算法設計與性能優化 -
$805奔跑吧 Linux 內核 -
$534深入淺出 HTTPS : 從原理到實戰 -
提升程式設計師的面試力|189道面試題目與解答, 6/e (Cracking the Coding Interview : 189 Programming Questions and Solutions, 6/e)$880$695 -
C and C++ Under the Hood (Paperback)$1,210$1,149 -
$657精通 Linux 內核智能設備開發核心技術 -
$601用“芯”探核基於龍芯的 Linux 內核探索解析 -
System Design Interview – An Insider's Guide (Paperback)$1,640$1,607 -
徵服 C指針, 2/e$594$564 -
算法競賽入門經典 — 訓練指南 (升級版)$708$672 -
CPU 設計實戰$594$564 -
Demystified Object-Oriented Programming with C++: Implement proven object-oriented design principles to write better code and create robust software$1,700$1,615 -
$504極限黑客攻防:CTF 賽題揭秘 -
$356數據庫程序員面試筆試通關寶典 -
$662算法訓練營:海量圖解 + 競賽刷題 (入門篇) -
$657C++20 編程技巧:98個問題解決方案示例, 2/e (C++20 Recipes: A Problem-Solution Approach, 2/e) -
$453C++ 新經典:模板與泛型編程 -
$407程序員的制勝技 -
Linux 源碼趣讀$948$900 -
CPU 眼裡的 C/C++$534$507 -
C++ 編程之禪:從理論到實踐$1,134$1,077
商品描述
本書聚焦現代CPU底層性能優化核心需求,分為性能分析與源代碼調優兩大部分,構建了從理論到實操的完整知識體系:第一部分深入解析CPU微架構(流水線、緩存層次、SIMD 等)、性能指標(IPC、CPI、緩存未命中)、分析方法(TMA、采樣、追蹤)及跨平臺工具(VTune、perf、uProf);第二部分聚焦內存訪問優化、計算優化、分支預測優化、多線程應用調優等落地技術。相較上一版,本書新增20多個實驗練習與“Performance Ninja”在線課程,補充AMD、ARM架構適配內容及系統級性能優化,突破第1版Intel架構局限。書中融入Google、Netflix等大廠案例,配套Python/SQL代碼示例與工具實操方案,既覆蓋基礎原理,又深挖前沿技術(如大頁、SIMD向量化、緩存一致性),兼具理論深度與工程實用性,是高性能計算、AI、遊戲開發等領域從業者的必備指南。
作者簡介
朱金鵬,AI系統、運行時架構與編譯優化技術專家,長期專註於高效執行系統與底層性能優化。曾任職於華為與榮耀,參與Android ART、方舟編譯器及WebAssembly運行時等核心系統研發,在虛擬機、執行引擎與編譯優化領域擁有豐富經驗。當前重點探索運行時與編譯技術在AI基礎設施、智能體系統及模型執行效率優化中的應用。
目錄大綱
譯者序
前言
致謝
作者簡介
第1章 導讀
1.1 為什麼軟件很慢
1.2 為什麼要關註性能
1.3 什麼是性能分析
1.4 什麼是性能調優
1.5 本書討論了什麼
1.6 本書未討論的內容
1.7 練習
1.8 本章總結
第一部分 現代CPU性能分析
第2章 性能測量
2.1 現代系統中的噪聲
2.2 在生產環境中測量性能
2.3 持續基準測試
2.4 手動性能測試
2.5 軟件計時器和硬件計時器
2.6 微基準測試
2.7 主動基準測試
2.8 問題與練習
2.9 本章總結
第3章 CPU微架構
3.1 指令集架構
3.2 流水線
3.3 利用指令級並行性
3.3.1 亂序執行
3.3.2 超標量引擎
3.3.3 投機執行
3.3.4 分支預測
3.4 SIMD多處理器
3.5 利用線程級並行性
3.5.1 多核系統
3.5.2 同步多線程
3.5.3 混合架構
3.6 存儲器層次
3.6.1 緩存層次
3.6.2 主存
……
第二部分 源代碼調優
附錄
跋
術語表
主流CPU微架構列表
參考文獻
