图书目录

第1章  计算机体系结构的基本概念  /1

           ??1.1  计算机体系结构的概念  /1

           1.1.1  存储程序计算机  /2

           1.1.2  计算机体系结构、组成和实现  /4

           1.1.3  计算机系统中的层次概念  /6

           1.1.4  系列机和兼容  /9

           ??1.2  计算机体系结构的发展  /11

           1.2.1  计算机分代、分型与分类  /11

           1.2.2  软件的发展  /13

           1.2.3  应用的发展  /14

           1.2.4  相关核心技术产品的发展  /16

           1.2.5  计算机体系结构的发展  /18

           1.2.6  并行处理技术的发展  /21

           1.2.7  体系结构技术的挑战  /26

           ??1.3  计算机系统设计和分析  /28

           1.3.1  成本与价格  /28

           1.3.2  基准测试程序  /31

           1.3.3  量化设计的基本原则  /34

           ??1.4  基本的可靠性模型  /38

           1.4.1  可靠性的基本概念  /38

           1.4.2  多部件系统的可靠性  /39

           ??1.5  小结  /40

           ??习题1  /41

           第2章  指令系统  /43

           ??2.1  指令系统结构的分类  /43

           ??2.2  寻址方式  /45

           ??2.3  指令系统的设计和优化  /48

           2.3.1  指令系统设计的基本原则  /48

           2.3.2  控制指令  /49

           2.3.3  指令操作码的优化  /50

           ??2.4  指令系统的发展和改进  /51

           2.4.1  沿CISC方向发展和改进指令系统  /51

           

  

  

  

  

  

           2.4.2  沿RISC方向发展和改进指令系统  /53

           ??2.5  操作数的类型和大小  /55

           ??2.6  MIPS指令系统结构  /57

           2.6.1  MIPS的寄存器  /57

           2.6.2  MIPS的数据表示  /57

           2.6.3  MIPS的数据寻址方式  /57

           2.6.4  MIPS的指令格式  /58

           2.6.5  MIPS的操作  /59

           2.6.6  MIPS的控制指令  /60

           2.6.7  MIPS的浮点操作  /61

           ??2.7  小结  /62

           ??习题2  /62

           第3章  流水线技术  /64

           ??3.1  流水线概述  /64

           3.1.1  流水线的基本概念  /64

           3.1.2  流水线的分类  /66

           ??3.2  MIPS的基本流水线  /69

           3.2.1  MIPS的一种简单实现  /69

           3.2.2  基本的MIPS流水线  /72

           3.2.3  流水线性能分析  /76

           ??3.3  流水线中的相关  /82

           3.3.1  流水线的结构相关  /82

           3.3.2  流水线的数据相关  /85

           3.3.3  流水线的控制相关  /94

           ??3.4  流水线计算机实例分析(MIPS R4000)  /101

           3.4.1  MIPS R4000整型流水线  /101

           3.4.2  MIPS R4000浮点流水线  /103

           3.4.3  MIPS R4000流水线的性能分析  /104

           ??3.5  向量处理机  /105

           3.5.1  向量处理方式和向量处理机  /105

           3.5.2  向量处理机实例分析  /107

           ??3.6  小结  /110

           

  

  

  

  

  

           ??习题3  /111

           第4章  指令级并行  /112

           ??4.1  指令级并行的概念  /112

           4.1.1  循环展开调度的基本方法  /113

           4.1.2  相关性  /117

           ??4.2  指令的动态调度  /121

           4.2.1  动态调度的原理  /121

           4.2.2  动态调度算法之一:记分牌  /122

           4.2.3  动态调度算法之二:Tomasulo

??????????算法  /130

           ??4.3  控制相关的动态解决技术  /140

           4.3.1  分支预测缓冲  /141

           4.3.2  分支目标缓冲  /143

           4.3.3  基于硬件的前瞻执行  /146

           ??4.4  多指令流出技术  /150

           4.4.1  静态超标量技术  /150

           4.4.2  动态多指令流出技术  /153

           4.4.3  超长指令字技术  /155

           4.4.4  多流出处理器受到的限制  /156

           ??4.5  小结  /158

           ??习题4  /158

           第5章  存储层次  /161

           ??5.1  存储器的层次结构  /161

           5.1.1  多级存储层次  /161

           5.1.2  存储层次的性能参数  /162

           5.1.3  两种存储层次关系  /163

           5.1.4  存储层次的4个问题  /164

           ??5.2  Cache基本知识  /164

           5.2.1  映像规则  /165

           5.2.2  查找方法  /167

           5.2.3  替换算法  /168

           5.2.4  写策略  /169

           

  

  

  

  

  

           5.2.5  Cache结构  /171

           5.2.6  Cache性能分析  /173

           5.2.7  改进Cache性能  /177

           ??5.3  降低Cache失效率的方法  /177

           5.3.1  调节Cache块大小  /180

           5.3.2  提高相联度  /181

           5.3.3  Victim Cache  /183

           5.3.4  硬件预取  /184

           5.3.5  编译器控制的预取  /185

           5.3.6  编译器优化  /187

           ??5.4  减少Cache失效开销  /191

           5.4.1  写缓冲及写合并  /191

           5.4.2  让读失效优先于写  /192

           5.4.3  请求字处理  /193

           5.4.4  多级Cache  /193

           5.4.5  非阻塞Cache  /196

           ??5.5  减少命中时间  /198

           5.5.1  容量小、结构简单的Cache  /198

           5.5.2  虚拟Cache  /199

           5.5.3  访问流水化  /201

           5.5.4  多体Cache  /201

           5.5.5  路预测  /202

           5.5.6  Trace Cache  /202

           5.5.7  Cache优化技术总结  /203

           ??5.6  主存  /204

           5.6.1  存储器组织技术  /204

           5.6.2  存储器芯片技术  /208

           ??5.7  虚拟存储器  /211

           5.7.1  虚拟存储器基本原理  /211

           5.7.2  快表  /214

           5.7.3  虚存和Cache关系的例子  /215

           ??5.8  虚存保护和虚存实例  /216

           

  

  

  

  

  

           5.8.1  进程保护技术  /216

           5.8.2  页式虚存举例:64位Opteron  /217?

           5.8.3  虚拟机保护  /219

           ??5.9  综合实例:AMD Opteron存储层次  /223

           ??5.10  小结  /226

           ??习题5  /227

           第6章  输入输出系统  /229

           ??6.1  引言  /229

           6.1.1  I/O处理对计算机总体性能的

??????????影响  /229

           6.1.2  I/O系统的可靠性  /230

           ??6.2  外部存储设备  /230

           6.2.1  磁盘设备  /231

           6.2.2  Flash存储器与固态硬盘SSD  /235

           6.2.3  磁带设备  /236

           6.2.4  光盘设备  /239

           ??6.3  I/O系统性能分析与评测  /240

           6.3.1  I/O性能与系统响应时间  /241

           6.3.2  Little定律  /242

           6.3.3  M/M/1排队系统  /243

           6.3.4  M/M/m排队系统  /245

           6.3.5  I/O基准测试程序  /246

           ??6.4  I/O系统的可靠性、可用性和可信性  /248

           ??6.5  廉价磁盘冗余阵列  /250

           6.5.1  RAID0  /252

           6.5.2  RAID1  /253

           6.5.3  RAID2  /255

           6.5.4  RAID3  /255

           6.5.5  RAID4  /257

           6.5.6  RAID5  /258

           6.5.7  RAID6  /259

           6.5.8  RAID的实现与发展  /260

           

  

  

  

  

  

           ??6.6  I/O设备与CPU/存储器的连接——总线  /261

           6.6.1  总线设计应考虑的因素  /261

           6.6.2  总线标准和实例  /262

           6.6.3  设备的总线连接  /264

           ??6.7  通道  /265

           6.7.1  通道的功能  /265

           6.7.2  通道的工作过程  /266

           6.7.3  通道的种类  /268

           ??6.8  I/O与操作系统  /268

           6.8.1  DMA和虚拟存储器  /269

           6.8.2  I/O和Cache的数据一致性  /269

           6.8.3  异步I/O  /271

           6.8.4  文件信息的维护  /271

           ??6.9  小结  /272

           ??习题6  /273

           第7章  多处理机  /274

           ??7.1  引言  /274

           7.1.1  并行计算机体系结构的分类  /274

           7.1.2  通信模型和存储器的结构模型  /276

           7.1.3  并行处理面临的挑战  /278

           ??7.2  对称式共享存储器体系结构  /280

           7.2.1  多处理机Cache一致性  /280

           7.2.2  实现一致性的基本方案  /281

           7.2.3  监听协议及其实现  /283

           ??7.3  分布式共享存储器体系结构  /284

           7.3.1  基于目录的Cache一致性  /285

           7.3.2  目录协议及其实现  /287

           ??7.4  互联网络  /288

           7.4.1  互联网络的性能参数  /288

           7.4.2  静态连接网络  /291

           7.4.3  动态连接网络  /295

           7.4.4  片上网络  /299

           

  

  

  

  

  

           ??7.5  同步  /302

           7.5.1  基本硬件原语  /302

           7.5.2  用一致性实现锁  /304

           7.5.3  同步性能问题  /305

           7.5.4  大规模机器的同步  /308

           ??7.6  同时多线程  /311

           7.6.1  将线程级并行转换为指令级并行  /312

           7.6.2  同时多线程处理器的设计  /313

           7.6.3  同时多线程的性能  /314

           ??7.7  并行处理器的性能评测  /316

           ??7.8  多处理机实例  /317

           7.8.1  实例1:T1处理器  /317

           7.8.2  实例2:Origin 2000  /320

           ??7.9  小结  /321

           ??习题7  /322

           第8章  集群计算机  /324

           ??8.1  集群的基本概念和结构  /324

           8.1.1  集群的基本结构  /324

           8.1.2  集群的软件模型  /326

           ??8.2  集群的特点  /327

           ??8.3  集群的分类  /328

           ??8.4  典型集群系统简介  /329

           8.4.1  Berkeley NOW  /329

           8.4.2  Beowulf  /330

           8.4.3  LAMP  /330

           8.4.4  IBM SP2  /331

           ??8.5  小结  /333

           ??习题8  /333

           参考文献  /334