買這商品的人也買了...
-
$352OpenACC 並行編程實戰 -
$301嵌入式 Linux 與物聯網軟件開發 : C語言內核深度解析 -
$280特徵工程入門與實踐 (Feature Engineering Made Easy) -
動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 -
$474片上互連網絡 — 多核/眾核處理器關鍵技術 -
深入剖析主板電源設計及環路穩定性能$294$279 -
$594AI 嵌入式系統:算法優化與實現 -
$301圖像處理與圖像分析基礎 (C/C++語言版) -
計算機系統開發與優化實戰$659$626 -
最佳能效晶片平台 - ARM64 架構師高度之程式開發$980$774 -
$749視覺慣性 SLAM:理論與源碼解析 -
$556點雲配準從入門到精通 -
$469Hadoop HDFS 深度剖析與實踐 -
$505Vue 3 移動 Web 開發與性能調優實戰 -
AI 加速器架構設計與實現圖書$594$564 -
Node.js 量化投資全攻略:從資料收集到自動化交易系統建構實戰(iThome鐵人賽系列書)【軟精裝】$760$502 -
$505高效 C/C++ 調試 -
程式設計守則|如何寫出更好的程式碼 (The Rules of Programming: How to Write Better Code)$620$490 -
$658UNIDBG 逆向工程:原理與實務 -
$658ARM 彙編與逆向工程藍狐捲基礎知識 -
$352Android圖形顯示系統 -
CYBERSEC 2024 臺灣資安年鑑 ─ AI 資安 2024 徹底剖析生成式 AI 資安攻防態勢$179$161 -
$458智能駕駛之激光雷達算法詳解 -
$815芯片安全導論 -
算力芯片 — 高性能 CPU / GPU / NPU 微架構分析$774$735
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書融合了底層技術和軟件優化技術兩個層面的內容,以程式設計實踐為核心,提供了較多的程式設計習題,旨在提升讀者的程式設計能力。
全書分為七章,第1章介紹了軟件效能工程、延遲、吞吐率、加速比等基本概念與效能測試方法。
後續章節圍繞著CPU、SIMD指令系統、多執行緒、GPU、物件導向程式設計語言(C++與Java)、磁盤與網絡等專題。
每章的內容既相對獨立,又相互有連結。
目錄大綱
前言
第1章引言
1.1 軟件最佳化概述
1.1.1 軟件最佳化的主要方法
1.1.2 軟件效能工程
1.1.3 關於軟件最佳化的一些觀點
1.2 評估軟件效能的指標與方法
1.2.1 延遲與吞吐率
1.2.2加速比與效率
1.2.3 Amdahl定理
1.2.4 M/M/k模型
1.3 常用軟件工具與時間測量方法
1.3.1 常用軟件工具
1.3.2 時間測量
1.4 一個程式效能分析的實例
1.5 延伸閱讀
1.6 習題
1.7實驗題
參考文獻
第2章CPU上的基本最佳化方法
2.1 電腦體系結構基礎
2.1.1 指令集體系結構
2.1.2 指令鐵律
2.1.3 管線及其相關性
2.1.4 超標量與亂序執行
2.1. 5 典型微處理器的微結構
2.2 針對算術邏輯指令的最佳化
2.2.1 現代微處理器的算術邏輯指令延遲與吞吐率
2.2.2 選擇合適的資料類型
2.2.3 使用簡單指令代替複雜指令
2.2.4使用特殊指令
2.2.5 查表法
2.3 針對條件分支指令的最佳化
2.3.1 分支預測
2.3.2 消除分支
2.3.3 組合多個分支以提高分支預測的準確度
2.3.4 使用條件執行指令
2.3.5合理使用switch語句
2.4 針對Cache的最佳化
2.4.1 現代微處理器的Cache
2.4.2 資料對齊
2.4.3 SoA的結構組織方式
2.4.4 資料分塊以提升Cache命中率
2.4.5 Cache預取
2.5 針對循環結構的最佳化
2.5.1 消除循環
2.5.2 循環展開
2.6 綜合實例
2.6.1 Linux核心中的ECC計算
2.6.2 Hash表的建構
2.7 擴展閱讀
2.8 習題
2.9 實驗題
參考文獻
第3章基於SIMD指令系統的最佳化方法
3.1 SIMD指令系統簡介
3.1.1 SIMD指令系統概況
3.1.2 軟件系統使用SIMD指令的方法
3.2 SIMD內嵌原語
3.2.1 內嵌原語的資料型別
3.2.2 向量設定操作
3.2.3計算操作
3.2.4 比較操作
3.2.5 訪問操作
3.2.6 資料排列操作
3.3 基於內嵌原語的SIMD程式設計
3.3.1 資料對齊與資料寬度
3.3.2 SoA結構
3.3.3 資料比較
3.3.4特殊指令
3.3.5 暫存器數量
3.4 SIMD程式實例
3.4.1 使用SSE指令去除空格
3.4.2 基於SIMD指令的雙調排序和歸併排序
3.4.3 fftw的可移植設計
3.5 擴展閱讀
3.6 習題
3.7 實驗題
參考文獻
第4章基於多執行緒的最佳化方法
4.1 多核心處理器架構
4.1.1 多執行緒處理器
4.1.2 多核心處理器系統
4.1.3 Cache一致性協定
4.2 作業系統層級執行緒呼叫
4.2.1 執行緒4.2.2
執行緒基本API
4.2.3 Linux的執行緒同步與互斥
4.2.4 Windows的執行緒同步與互斥
4.3 OpenMP
4.3.1 for編譯導引語句
4.3.2 共享變量與私有變量
4.3.3 歸約子句
4.3.4 nowait子句
4.3.5 single導引指令
4.3.6 critical子句
4.3.7 barrier子句
4.3.8 其他子句
4.4 多執行緒程式的一些問題
4.4.1 臨界區
4.4.2 Cache偽共享
4.4.3 多執行緒的平行化設計方法
4.5 多執行緒並行化實例
4.5.1 Horner演算法的平行化
4.5.2 建構Hash表
4.5.3 歸併排序
4.6 擴展閱讀
4.7 習題
4.8 實驗題
參考文獻
第5章GPU的最佳化方法
5.1 GPU體系結構
5.1.1 面向吞吐率最佳化的異質運算
5.1.2 GPU整體結構
5.1.3 SIMT機制
5.1.4 內存結構
5.2 GPU基本程式設計方法
5.2.1 執行緒的組織結構
5.2.2 GPU函數說明
5.2.3 內存管理以及與主機的資料交換
5.2. 4 GPU上執行緒之間的同步
5.2.5 OpenCL的程式物件與核心物件
5.2.6 程式執行 個體
5.3 GPU程式最佳化方法
5.3.1 指令吞吐速率
5.3.2 資源利用率
5.3.3 共享內存
5.3.4 全域內存
5.3.5 掩蓋主機與GPU之間的資料傳輸延遲
5.3.6 動態平行機制
5.4 GPU程式實例
5.4.1 矩陣乘法
5.4.2 LU分解
5.5 擴展閱讀
5.6 習題
5.7 實驗題
參考文獻
第6章物件導向程式設計語言的最佳化方法
6.1 C++的效能最佳化
6.1.1 C++實作簡介
6.1.2 STL
6.2 Java的效能最佳化
6.2.1 Java虛擬機簡介
6.2.2 Java字節碼的執行機制
6.2.3 Java本機接口
6.2.4 Java的多執行緒機制
6.3 垃圾回收
6.3.1 垃圾回收基本技術
6.3.2 HotSpotJVM中的垃圾回收
6.4 擴充閱讀
6.5 習題
6.6 實驗題
參考文獻
第7章系統層級軟件最佳化
7.1 硬盤系統與檔案系統的效能最佳化
7.1 .1 硬盤系統
7.1.2 檔案系統
7.1.3 效能最佳化方法
7.1.4 實例:外排序
7.2 網絡連線的效能最佳化
7.2.1 網絡連線硬件
7.2.2 網絡
