《電腦體繫結構:量化研究方法:第5版》
基本資料
原書名:Computer Architecture:A Quantitative Approach,Fifth Edition
作者: (美)John L. Hennessy David A. Patterson [作譯者介紹]
譯者: 賈洪峰
叢書名: 圖靈程式設計叢書
出版社:人民郵電出版社
ISBN:9787115297655
上架時間:2012-12-26
出版日期:2013 年1月
開本:16開
頁碼:1
版次:1-1
所屬分類:電腦 > 電腦群組織與體繫結構 > 綜合
更多關於 》》》《電腦體繫結構:量化研究方法:第5版》
內容簡介
書籍
電腦書籍
《電腦體繫結構:量化研究方法:第5版》是最權威的電腦體繫結構著作,是久負盛名的經典作品。書中系統地介紹了電腦系統的設計基礎、指令集系統結構、流水線和指令集並行技術、層次化儲存系統與存放裝置、互連網路以及多處理器系統等重要內容。在這個最新版中,作者增加了當前炙手可熱的雲端運算和手機用戶端技術等相關內容,探討了在手機、平板電腦、膝上型電腦和其他移動計算裝置上雲端運算的軟硬體實現方式。
《電腦體繫結構:量化研究方法:第5版》可作為高等院校電腦專業本科生或研究生教材,也可作為從事電腦體繫結構或電腦系統設計的工程技術人員的參考書。
目錄
《電腦體繫結構:量化研究方法:第5版》
第1章 量化設計與分析基礎 1
1.1 引言 2
1.2 電腦的分類 4
1.2.1 個人行動裝置 5
1.2.2 案頭計算 5
1.2.3 伺服器 6
1.2.4 叢集/倉庫級電腦 6
1.2.5 嵌入式電腦 7
1.2.6 並行度與並行體繫結構的分類 7
1.3 電腦體繫結構的定義 8
1.3.1 指令集體繫結構:電腦體繫結構的近距離審視 9
1.3.2 真正的電腦體繫結構:設計滿足目標和功能需求的組成和硬體 12
1.4 技術趨勢 13
1.4.1 效能趨勢:頻寬勝過延遲 15
1.4.2 晶體管效能與連線的發展 17
1.5 整合電路中的功率和能耗趨勢 17
1.5.1 功率和能耗:系統觀點 17
1.5.2 微處理器內部的能耗和功率 18
1.6 成本趨勢 21
1.6.1 時間、產量和福士化的影響 21
1.6.2 整合電路的成本 22
1.6.3 成本與價格 26
1.6.4 製造成本與運行成本 26
1.7 可信任度 26
1.8 效能的測量、報告和匯總 28
1.8.1 基準測試 29
1.8.2 報告效能測試結果 32
1.8.3 效能結果匯總 33
1.9 電腦設計的量化原理 34
1.9.1 充分利用並行 35
1.9.2 局域性原理 35
1.9.3 重點關注常見情形 35
1.9.4 amdahl定律 36
1.9.5 處理器效能公式 38
1.10 融會貫通:效能、價格和功耗 40
1.11 謬論與易犯錯誤 42
1.12 結語 46
1.13 曆史回顧與參考文獻 47
第2章 儲存空間階層設計 53
2.1 引言 54
2.2 緩衝效能的10種進階最佳化方法 59
2.2.1 第一種最佳化:小而簡單的第一級緩衝,用以縮短命中時間、降低功率 59
2.2.2 第二種最佳化:採用路預測以縮短命中時間 61
2.2.3 第三種最佳化:實現緩衝訪問的流水化,以提高緩衝頻寬 61
2.2.4 第四種最佳化:採用無阻塞緩衝,以提高緩衝頻寬 62
2.2.5 第五種最佳化:採用多種緩衝以提高緩衝頻寬 64
2.2.6 第六種最佳化:關鍵字優先和提前重啟動以降低缺失代價 64
2.2.7 第七種最佳化:合并寫緩衝區以降低缺失代價 65
2.2.8 第八種最佳化:採用編譯器最佳化以降低缺失率 66
2.2.9 第九種最佳化:對指令和資料進行硬體預取,以降低缺失代價或缺失率 68
2.2.10 第十種最佳化:用編譯器控制預取,以降低缺失代價或缺失率 69
2.2.11 緩衝最佳化小結 72
2.3 儲存空間技術與最佳化 72
2.3.1 sram技術 73
2.3.2 dram技術 73
2.3.3 提高dram晶片內部的儲存空間效能 75
2.3.4 降低sdram中的功耗 77
2.3.5 快閃記憶體 77
2.3.6 提高儲存空間系統的可靠性 78
2.4 保護:虛擬儲存空間和虛擬機器 79
2.4.1 通過虛擬儲存空間提供保護 79
2.4.2 通過虛擬機器提供保護 81
2.4.3 對虛擬機器監視器的要求 82
2.4.4 虛擬機器(缺少)的指令集體繫結構支援 82
2.4.5 虛擬機器對虛擬儲存空間和i/o的影響 83
2.4.6 vmm執行個體:xen虛擬機器 84
2.5 交叉問題:儲存空間階層的設計 84
2.5.1 保護和指令集體繫結構 84
2.5.2 快取資料的一致性 85
2.6 融會貫通:arm cortex-a8和intel core i7中的儲存空間階層 85
2.6.1 arm cortex-a8 86
2.6.2 intel core i7 89
2.7 謬論與易犯錯誤 95
2.8 結語:展望 98
2.9 曆史回顧與參考文獻 99
第3章 指令級並行及其開發 109
3.1 指令級並行:概念與挑戰 110
3.1.1 什麼是指令級並行 111
3.1.2 資料相關與冒險 111
3.1.3 控制相關 114
3.2 揭示ilp的基本編譯器技術 116
3.2.1 基本流水線調度和迴圈展開 116
3.2.2 迴圈展開與調度小結 119
3.3 用進階分支預測降低分支成本 120
3.3.1 競賽預測器:局部預測器與全域預測器的自適應聯合 122
3.3.2 intel core i7分支預測器 123
3.4 用動態調度克服資料冒險 124
3.4.1 動態調度:思想 124
3.4.2 使用tomasulo演算法進行動態調度 126
3.5 動態調度:樣本和演算法 130
3.5.1 tomasulo演算法:細節 132
3.5.2 tomasulo演算法:基於迴圈的樣本 133
3.6 基於硬體的推測 135
3.7 以多發射和靜態調度來開發ilp 143
3.8 以動態調度、多發射和推測來開發ilp 146
3.9 用於指令傳送和推測的進階技術 150
3.9.1 提高指令提取頻寬 150
3.9.2 推測:實現問題與擴充 155
3.10 ilp局限性的研究 158
3.10.1 硬體模型 158
3.10.2 可實現處理器上ilp的局限性 160
3.10.3 超越本研究的局限 163
3.11 交叉問題:ilp方法與儲存空間系統 164
3.11.1 硬體推測與軟體推測 164
3.11.2 推測執行與儲存空間系統 165
3.12 多線程:開發線程級並行提高單一處理器輸送量 165
3.12.1 細粒度多線程在sun t1上的效果 168
3.12.2 同時多線程在超標量處理器上的效果 170
3.13 融會貫通:intel core i7和armcortex-a8 173
3.13.1 arm cortex-a8 173
3.13.2 intel core i7 176
3.14 謬論與易犯錯誤 179
3.15 結語:前路何方 182
3.16 曆史回顧與參考文獻 183
第4章 向量、simd和gpu體繫結構中的資料級並行 193
4.1 引言 194
4.2 向量體繫結構 195
4.2.1 vmips 196
4.2.2 向量處理器如何工作:一個樣本 198
4.2.3 向量執行時間 199
4.2.4 多條車道:每個刻度超過一個元素 201
4.2.5 向量長度寄存器:處理不等於64的迴圈 203
4.2.6 向量遮罩寄存器:處理向量迴圈中的if語句 204
4.2.7 記憶體組:為向量載入/儲存單元提供頻寬 205
4.2.8 步幅:處理向量體繫結構中的多維陣列 206
4.2.9 集中—分散:在向量體繫結構中處理疏鬆陣列 207
4.2.10 向量體繫結構編程 208
4.3 simd指令集多媒體擴充 209
4.3.1 多媒體simd體繫結構編程 212
4.3.2 roofline可視效能模型 212
4.4 圖形處理器 214
4.4.1 gpu編程 214
4.4.2 nvidia gpu計算結構 216
4.4.3 nvida gpu指令集體繫結構 222
4.4.4 gpu中的條件分支 224
4.4.5 nvidia gpu儲存空間結構 226
4.4.6 fermi gpu體繫結構中的創新 228
4.4.7 向量體繫結構與gpu的相似與不同 230
4.4.8 多媒體simd電腦與gpu之間的相似與不同 233
4.4.9 小結 233
4.5 檢測與增強迴圈強並行 235
4.5.1 尋找相關 238
4.5.2 消除相關計算 240
4.6 交叉問題 240
4.6.1 能耗與dlp:慢而寬與快而窄 240
4.6.2 分組儲存空間和圖形儲存空間 241
4.6.3 步幅訪問和tlb缺失 241
4.7 融會貫通:移動與伺服器gpu、tesla與core i7 241
4.8 謬論與易犯錯誤 247
4.9 結語 248
4.10 曆史回顧與參考文獻 250
第5章 線程級並行 256
5.1 引言 257
5.1.1 多處理器體繫結構:問題與方法 258
5.1.2 平行處理的挑戰 260
5.2 集中式共用儲存空間體繫結構 262
5.2.1 什麼是多處理器緩衝一致性 263
5.2.2 一致性的基本實現方案 264
5.2.3 監聽一致性協議 265
5.2.4 基本實現技術 265
5.2.5 樣本協議 267
5.2.6 基本一致性協議的擴充 270
5.2.7 對稱共用儲存空間多處理器與監聽協議的局限性 271
5.2.8 實施監聽緩衝一致性 272
5.3 對稱共用儲存空間多處理器的效能 273
5.3.1 商業工作負載 274
5.3.2 商業工作負載的效能測量 275
5.3.3 多重編程和作業系統工作負載 279
5.3.4 多重編程和作業系統工作負載的效能 280
5.4 分布式共用儲存空間和目錄式一致性 282
5.4.1 目錄式緩衝一致性協議:基礎知識 283
5.4.2 目錄式協議舉例 285
5.5 同步:基礎知識 288
5.5.1 基本硬體原語 288
5.5.2 使用一致性實現鎖 289
5.6 儲存空間連貫性模型:簡介 291
5.6.1 程式員的觀點 292
5.6.2 寬鬆連貫性模型:基礎知識 293
5.6.3 關於連貫性模型的最後說明 293
5.7 交叉問題 294
5.7.1 編譯器最佳化與連貫性模型 294
5.7.2 利用推測來隱藏嚴格連貫性模型中的延遲 294
5.7.3 包含性及其實現 295
5.7.4 利用多重處理和多線程的效能增益 295
5.8 融會貫通:多核處理器及其效能 297
5.9 謬論與易犯錯誤 301
5.10 結語 304
5.11 曆史回顧與參考文獻 306
第6章 以倉庫級電腦開發請求級、資料級並行 319
6.1 引言 320
6.2 倉庫級電腦的編程模型與工作負載 323
6.3 倉庫級電腦的電腦體繫結構 327
6.3.1 儲存 328
6.3.2 陣列交換器 328
6.3.3 wsc儲存空間階層 329
6.4 倉庫級電腦的物理基礎設施與成本 331
6.4.1 測量wsc的效率 334
6.4.2 wsc的成本 335
6.5 雲端運算:公用計算的回報 338
6.6 交叉問題 342
6.6.1 成為瓶頸的wsc網路 342
6.6.2 在伺服器內部高效利用能量 343
6.7 融會貫通:google倉庫級電腦 344
6.7.1 集裝箱 344
6.7.2 google wsc中的冷卻與供電 346
6.7.3 google wsc中的伺服器 348
6.7.4 google wsc中的連網 348
6.7.5 google wsc的監控與修複 349
6.7.6 小結 349
6.8 謬論與易犯錯誤 350
6.9 結語 353
6.10 曆史回顧與參考文獻 354
附錄a 指令集基本原理 365
a.1 引言 366
a.2 指令集體繫結構的分類 366
a.3 儲存空間定址 369
a.4 運算元的類型與大小 374
a.5 指令集中的操作 375
a.6 控制流程指令 376
a.7 指令集編碼 380
a.8 交叉問題:編譯器的角色 382
a.9 融會貫通:mips體繫結構 388
a.10 謬論和易犯錯誤 396
a.11 結語 399
a.12 曆史回顧與參考文獻 400
附錄b 儲存空間階層回顧 405
b.1 引言 406
b.2 緩衝效能 416
b.3 6種基本的緩衝最佳化 421
b.4 虛擬儲存空間 435
b.5 虛擬儲存空間的保護與樣本 441
b.6 謬論與易犯錯誤 447
b.7 結語 448
b.8 曆史回顧與參考文獻 449
附錄c 流水線:基礎與中級概念 454
c.1 引言 455
c.2 流水化的主要阻礙——流水線冒險 461
c.3 如何?流水化 476
c.4 妨礙流水線實現的難題 485
c.5 擴充mips流水線,以處理多周期操作 490
c.6 融會貫通:mips r4000流水線 498
c.7 交叉問題 504
c.8 謬論與易犯錯誤 511
c.9 結語 512
c.10 曆史回顧與參考文獻 512
參考文獻 518 索引 543
本圖書資訊來源:中國互動出版網