受到能耗的限制,仅靠CPU提升工作频率便可直接提升处理性能的方式已经不再适用。因此设计更多但是频率更低的处理核心便成为处理器发展的方向。多核处理器成为趋势,为了充分利用这些处理核心,必须采用并行方式才可以发掘它们的计算能力。因此并行处理就成了未来提高处理器性能的一种必需的手段。
本书正好可以满足这样一种需求,它提供了关于并行计算与并行算法设计的基本知识与具体的实现案例,可以指导我们设计高效的并行算法。
本书大概可以分为两大部分,第1~11章侧重于基本的并行算法与知识的介绍,第12~21章侧重于如何利用前面介绍的知识来解决具体的应用问题。其中,第1章对本书中出现的几种重要算法: 串行算法,并行算法,以及正则迭代算法等进行了介绍。第2章介绍了提升单处理器性能的手段。第3章介绍了并行计算机的主要类型,包括: 共享内存,分布式内存,单指令多数据流,脉动阵列以及多核系统。第4章介绍了共享内存多核系统以及紧密相关的两个问题: 高速缓存一致性和处理器同步。第5章介绍了并行处理器的集中内部互联网络: 总线型,星型,环型,以及网络拓扑,探讨了几种更高效的网络类型: 交换阵列,多层级网络。第6章介绍了用于开发并行应用的并发平台软件工具,包括Cilk++、OpenMP以及统一计算设备架构(CUDA) 。第7章介绍了特定算法在并行计算机上的实现方法、算法任务级别的流水线处理等。第8章介绍了NSPA算法的处理方法,NSPA是指无法归类于串行、并行或者是串并行的算法。第9章介绍z-变换的方法。第10章介绍构建迭代算法的依赖图。第11章介绍基于计算几何和线性代数概念的迭代算法分析技术。第12章探讨的是不同的一维(1D)有限脉冲响应(FIR)数码滤波器的并行处理架构。第13章探讨的是不同的二维(2D)和三维(3D)无限脉冲响应(IIR)数码滤波器的并行处理架构。第14章探讨的是不同的多采样率抽样器和中断器的并行处理架构。第15章探讨的是模式识别算法所需的并行处理架构。第16章探讨的是运用于视频压缩的运动估计并行处理架构。第17章探讨的是不同的有限域的2m阶伽罗瓦域乘法的并行处理架构。第18章探讨的是不同的有限域的2m阶伽罗瓦域除法的并行处理架构。第19章探讨的是不同的快速傅里叶变换算法的并行处理架构。第20章探讨了线性方程的求解系统。第21章讨论了使用有限差分法(FDM)来求解偏微分方程的不同的并行处理架构。
本书不是一本特别初级的入门教材,但是有一定计算机专业基础的读者阅读起来是不会有很大障碍的。另外对于需要直接了解某些具体案例的并行处理方法的读者,也可以从本书找到答案或者启发。推荐计算机、电子电气工程等相关专业的高年级本科生、研究生以及从事相关研究的科研人员阅读本书。
