計算機體系結構教程

張春元、王誌英、沈立、肖曉強、馬勝

  • 出版商: 清華大學
  • 出版日期: 2025-06-01
  • 售價: $474
  • 語言: 簡體中文
  • ISBN: 730268927X
  • ISBN-13: 9787302689270
  • 相關分類: Computer-architecture
  • 下單後立即進貨 (約4週~6週)

  • 計算機體系結構教程-preview-1
  • 計算機體系結構教程-preview-2
  • 計算機體系結構教程-preview-3
計算機體系結構教程-preview-1

相關主題

商品描述

"本書論述比較成熟的現代計算機體系結構的基本概念、基本原理和基本分析方法,並特別強調采用量化評測的分析技術和方法。本書共8章,主要內容包括計算機體系結構的基本概念、指令系統、流水線技術、指令級並行、存儲層次、輸入輸出系統、多處理機、集群計算機。 本書語言簡練,深入淺出,通俗易懂,適合作為高等學校計算機科學與技術學科各專業以及自動化、電子工程等相關專業本科生、研究生的教材,也可作為計算機領域工程技術人員的參考書。 "

作者簡介

張春元,國防科技大學計算機學院教授、博導,國家計算機類專業工程教育專業認證專家組副秘書長,軍隊計算機專業教學聯席會主任委員。享有國務院頒發的政府特殊津貼。長期從事計算機體系結構、計算機應用等科研和教學工作。主持國家重點研發幾乎按項目、國家自然科學基金、國家自然科學基金重點項目、國家863高技術研究項目、國家973安全重大基礎研究項目、國家重點型號項目及企業合作等20多項,發表科研論文100余篇,出版學術專著2部,已獲授權專列10項。主講過10多門本科生和研究生課程,是國家精品課程“計算機體系結構”主講人之一、軍隊優質課程和湖南省一流線下課程“計算機體系結構”負責人。撰寫教材3種,其中《計算機體系結構》獲得2021年全國首屆優秀教材獎一等獎、2002年全國普通高等學校優秀教材二等獎,發表教學論文10余篇,主編出版有《學位與研究生教育信息管理實踐與探索》。獲得國家科技進步二等獎1次,省部級科技進步獎多次,國家教學成果二等獎2次,省部級教學成果獎多次。

目錄大綱

目錄

第1章計算機體系結構概述1

1.1計算機體系結構的概念1

1.1.1存儲程序計算機3

1.1.2計算機體系結構、組成和實現5

1.1.3計算機系統中的層次概念8

1.1.4系列機和兼容10

1.2計算機體系結構的發展12

1.2.1計算機分代、分型與分類13

1.2.2軟件的發展14

1.2.3應用的發展16

1.2.4相關核心技術產品的發展17

1.2.5計算機體系結構的發展20

1.2.6並行處理技術的發展22

1.2.7體系結構技術的挑戰28

1.3計算機系統設計和分析31

1.3.1成本和價格31

1.3.2性能評測的技術方法34

1.3.3基準測試程序36

1.3.4量化設計的基本原則39

1.4基本的可靠性模型43

1.4.1可靠性的基本概念43

1.4.2多部件系統的可靠性45

1.5小結48

習題148

第2章指令系統51

2.1指令系統的分類51

2.2尋址方式53

2.3指令系統的設計和優化56

2.3.1指令系統設計的基本原則56

2.3.2控制指令57

2.3.3指令操作碼的優化58

2.4指令系統的發展和改進592.4.1沿CISC方向發展和改進指令系統59

2.4.2沿RISC方向發展和改進指令系統61

2.5操作數的類型和大小63

2.6RISCⅤ指令系統64

2.6.1RISCⅤ的寄存器65

2.6.2RISCⅤ的數據類型65

2.6.3RISCⅤ的數據尋址方式66

2.6.4RISCⅤ的指令格式66

2.6.5RISCⅤ的操作67

2.6.6RISCⅤ的控制指令68

2.6.7RISCⅤ的浮點操作69

2.7小結70

習題271

第3章流水線技術73

3.1流水線概述73

3.1.1流水線的基本概念73

3.1.2流水線的分類75

3.2RISCⅤ基本流水線78

3.2.1RISCⅤ的一種簡單實現78

3.2.2基本RISCⅤ流水線82

3.2.3流水線性能分析85

3.3流水線中的依賴90

3.3.1流水線的結構依賴91

3.3.2流水線的數據依賴93

3.3.3流水線的控制依賴102

3.4流水線計算機實例分析109

3.4.1MIPS R4000的整型流水線109

3.4.2MIPS R4000的浮點流水線111

3.4.3MIPS R4000流水線的性能分析112

3.5向量處理機113

3.5.1向量處理方式和向量處理機113

3.5.2向量處理機實例分析116

3.6小結118

習題3119

第4章指令級並行性121

4.1指令級並行性的概念121

4.1.1循環展開調度的基本方法122

4.1.2依賴關系127

4.2指令的動態調度131

4.2.1動態調度的原理132

4.2.2動態調度算法之一: 記分牌133

4.2.3動態調度算法之二: Tomasulo算法140

4.3控制依賴的動態解決技術150

4.3.1分支預測緩沖151

4.3.2分支目標緩沖154

4.3.3前瞻執行的硬件實現156

4.4多指令流出技術160

4.4.1靜態超標量技術161

4.4.2動態多指令流出技術163

4.4.3超長指令字技術165

4.4.4多指令流出處理器受到的限制167

4.5軟件流水168

4.6小結171

習題4172

第5章存儲層次175

5.1存儲器的層次結構175

5.1.1多級存儲層次175

5.1.2存儲層次的性能指標177

5.1.3兩種存儲層次關系177

5.1.4存儲層次的4個關鍵問題178

5.2Cache基本知識178

5.2.1映射規則178

5.2.2查找方法180

5.2.3替換算法182

5.2.4寫策略183

5.2.5Cache結構184

5.2.6Cache性能分析187

5.2.7改進Cache性能190

5.3降低Cache失效率的方法190

5.3.1調節Cache塊大小192

5.3.2提高相聯度194

5.3.3犧牲Cache195

5.3.4硬件預取196

5.3.5編譯器控制的預取197

5.3.6編譯器優化199

5.4減少Cache失效開銷的方法203

5.4.1寫緩沖及寫合並203

5.4.2讓讀失效優先於寫204

5.4.3請求字處理204

5.4.4多級Cache205

5.4.5非阻塞Cache208

5.5減少Cache命中時間的方法210

5.5.1容量小、結構簡單的Cache210

5.5.2虛擬Cache211

5.5.3訪問流水化213

5.5.4多體Cache213

5.5.5路預測213

5.5.6蹤跡Cache214

5.5.7Cache優化技術總結214

5.6主存215

5.6.1存儲器組織技術215

5.6.2存儲器芯片技術219

5.7虛擬存儲器227

5.7.1虛擬存儲器基本原理227

5.7.2快表229

5.7.3虛存和Cache關系的例子230

5.8虛存保護和虛存實例231

5.8.1進程保護技術231

5.8.2頁式虛存舉例: 64位Opteron232

5.8.3虛擬機保護234

5.9綜合例子239

5.9.1AMD Opteron存儲層次239

5.9.2Intel Core i7 6700存儲層次241

5.10小結245

習題5246

第6章輸入輸出系統249

6.1引言249

6.1.1I/O處理對計算機總體性能的影響249

6.1.2I/O系統的可靠性250

6.2外部存儲設備251

6.2.1磁盤設備251

6.2.2Flash存儲器與固態硬盤255

6.2.3磁帶設備256

6.2.4光盤設備258

6.3I/O系統性能分析與評測260

6.3.1I/O性能與系統響應時間260

6.3.2Little定律262

6.3.3M/M/1排隊系統263

6.3.4M/M/m排隊系統264

6.3.5I/O基準測試程序265

6.4I/O系統的可靠性、可用性和可信性267

6.5廉價磁盤冗余陣列269

6.5.1RAID0271

6.5.2RAID1272

6.5.3RAID2273

6.5.4RAID3274

6.5.5RAID4275

6.5.6RAID5276

6.5.7RAID6277

6.5.8RAID的實現與發展278

6.6I/O設備與CPU、存儲器的連接——總線279

6.6.1總線設計應考慮的因素279

6.6.2總線標準和實例281

6.6.3設備的總線連接282

6.7通道283

6.7.1通道的功能284

6.7.2通道的工作過程284

6.7.3通道的種類286

6.8I/O與操作系統286

6.8.1DMA和虛擬存儲器287

6.8.2I/O和Cache數據一致性287

6.8.3異步I/O289

6.8.4文件信息的維護289

6.9小結289

習題6290

第7章多處理機293

7.1引言293

7.1.1並行計算機體系結構的分類293

7.1.2通信模型和存儲器的結構模型295

7.1.3並行處理面臨的挑戰297

7.2集中式共享存儲器體系結構299

7.2.1多處理機Cache一致性299

7.2.2實現一致性的基本方案300

7.2.3監聽協議及其實現302

7.3分布式共享存儲器體系結構303

7.3.1基於目錄的Cache一致性304

7.3.2目錄協議及其實現306

7.4互連網絡307

7.4.1互連網絡的性能參數307

7.4.2靜態互連網絡310

7.4.3動態連接網絡313

7.4.4片上網絡317

7.5同步320

7.5.1基本硬件原語320

7.5.2用一致性實現鎖321

7.5.3同步性能問題323

7.5.4大規模計算機的同步325

7.6同時多線程328

7.6.1將線程級並行轉換為指令級並行329

7.6.2同時多線程處理器的設計330

7.6.3同時多線程的性能331

7.7並行處理器的性能評測333

7.8多處理機實例334

7.8.1多核處理器及性能對比334

7.8.2實例: Origin 2000339

7.9小結340

習題7341

第8章集群計算機343

8.1集群的基本概念和結構343

8.1.1集群的基本結構343

8.1.2集群的軟件模型344

8.2集群的特點346

8.3集群的分類346

8.4典型集群系統簡介348

8.4.1Berkeley NOW348

8.4.2Beowulf348

8.4.3LAMP349

8.4.4IBM SP2349

8.4.5“天河二號”351

8.5小結355

習題8355

參考文獻356