首页 > 图书中心 > 图像处理、分析与机器视觉(第4版)

目录

目    录

第1章  引言 1

1.1  动机 1

1.2  计算机视觉为什么是困难的 2

1.3  图像表达与图像分析的任务 4

1.4  总结 7

1.5  习题 7

1.6  参考文献 8

第2章  图像及其表达与性质 9

2.1  图像表达若干概念 9

2.2  图像数字化 11

2.2.1  采样 11

2.2.2  量化 12

2.3  数字图像性质 13

2.3.1  数字图像的度量和拓扑性质 13

2.3.2  直方图 17

2.3.3  熵 18

2.3.4  图像的视觉感知 18

2.3.5  图像品质 20

2.3.6  图像中的噪声 21

2.4  彩色图像 22

2.4.1  色彩物理学 22

2.4.2  人所感知的色彩 23

2.4.3  彩色空间 26

2.4.4  调色板图像 28

2.4.5  颜色恒常性 28

2.5  摄像机概述 29

2.5.1  光敏传感器 29

2.5.2  黑白摄像机 30

2.5.3  彩色摄像机 32

2.6  总结 32

2.7  习题 33

2.8  参考文献 35

第3章  图像及其数学与物理背景 37

3.1  概述 37

3.1.1  线性 37

3.1.2  狄拉克(Dirac)分布和卷积 37

3.2  积分线性变换 38

3.2.1  作为线性系统的图像 39

3.2.2  积分线性变换引言 39

3.2.3  1D傅里叶变换 39

3.2.4  2D傅里叶变换 43

3.2.5  采样与香农约束 45

3.2.6  离散余弦变换 47

3.2.7  小波变换 48

3.2.8  本征分析 52

3.2.9  奇异值分解 53

3.2.10  主分量分析 54

3.2.11  Radon变换 56

3.2.12  其他正交图像变换 56

3.3  作为随机过程的图像 57

3.4  图像形成物理 59

3.4.1  作为辐射测量的图像 59

3.4.2  图像获取与几何光学 60

3.4.3  镜头像差和径向畸变 63

3.4.4  从辐射学角度看图像获取 65

3.4.5  表面反射 67

3.5  总结 69

3.6  习题 70

3.7  参考文献 71

第4章  图像分析的数据结构 73

4.1  图像数据表示的层次 73

4.2  传统图像数据结构 74

4.2.1  矩阵 74

4.2.2  链 76

4.2.3  拓扑数据结构 76

4.2.4  关系结构 77

4.3  分层数据结构 78

4.3.1  金字塔 78

4.3.2  四叉树 79

4.3.3  其他金字塔结构 80

4.4  总结 81

4.5  习题 82

4.6  参考文献 83

第5章  图像预处理 85

5.1  像素亮度变换 85

5.1.1  位置相关的亮度校正 85

5.1.2  灰度级变换 86

5.2  几何变换 88

5.2.1  像素坐标变换 88

5.2.2  亮度插值 89

5.3  局部预处理 91

5.3.1  图像平滑 91

5.3.2  边缘检测算子 97

5.3.3  二阶导数过零点 100

5.3.4  图像处理中的尺度 104

5.3.5  Canny边缘提取 105

5.3.6  参数化边缘模型 107

5.3.7  多光谱图像中的边缘 107

5.3.8  频域的局部预处理 108

5.3.9  用局部预处理算子作线检测 112

5.3.10  角点(兴趣点)检测 113

5.3.11  最大稳定极值区域检测 116

5.4  图像复原 117

5.4.1  容易复原的退化 118

5.4.2  逆滤波 118

5.4.3  维纳滤波 118

5.5  总结 120

5.6  习题 121

5.7  参考文献 126

第6章  分割Ⅰ 130

6.1  阈值化 130

6.1.1  阈值检测方法 132

6.1.2  最优阈值化 133

6.1.3  多光谱阈值化 135

6.2  基于边缘的分割 136

6.2.1  边缘图像阈值化 137

6.2.2  边缘松弛法 138

6.2.3  边界跟踪 139

6.2.4  作为图搜索的边缘跟踪 143

6.2.5  作为动态规划的边缘跟踪 149

6.2.6  Hough变换 152

6.2.7  使用边界位置信息的边界

???检测 157

6.2.8  从边界构造区域 157

6.3  基于区域的分割 159

6.3.1  区域归并 160

6.3.2  区域分裂 161

6.3.3  分裂与归并 162

6.3.4  分水岭分割 165

6.3.5  区域增长后处理 167

6.4  匹配 167

6.4.1  模版匹配 168

6.4.2  模版匹配的控制策略 170

6.5  分割的评测问题 170

6.5.1  监督式评测 171

6.5.2  非监督式评测 173

6.6  总结 174

6.7  习题 176

6.8  参考文献 178

第7章  分割Ⅱ 185

7.1  均值移位分割 185

7.2  活动轮廓模型——蛇行 190

7.2.1  经典蛇行和气球 191

7.2.2  扩展 193

7.2.3  梯度矢量流蛇 194

7.3  几何变形模型——水平集和测地

?? 活动轮廓 198

7.4  模糊连接性 203

7.5  面向基于3D图的图像分割 208

7.5.1  边界对的同时检测 208

7.5.2  次优的表面检测 211

7.6  图割分割 212

7.7  最优单和多表面分割 217

7.8  总结 227

7.9  习题 228

7.10  参考文献 229

第8章  形状表示与描述 237

8.1  区域标识 239

8.2  基于轮廓的形状表示与描述 241

8.2.1  链码 241

8.2.2  简单几何边界表示 242

8.2.3  边界的傅里叶变换 245

8.2.4  使用片段序列的边界描述 246

8.2.5  B样条表示 249

8.2.6  其他基于轮廓的形状描述

???方法 250

8.2.7  形状不变量 251

8.3  基于区域的形状表示与描述 253

8.3.1  简单的标量区域描述 254

8.3.2  矩 257

8.3.3  凸包 259

8.3.4  基于区域骨架的图表示 262

8.3.5  区域分解 266

8.3.6  区域邻近图 267

8.4  形状类别 268

8.5  总结 268

8.6  习题 270

8.7  参考文献 272

第9章  物体识别 278

9.1  知识表示 278

9.2  统计模式识别 281

9.2.1  分类原理 282

9.2.2  最近邻 283

9.2.3  分类器设置 285

9.2.4  分类器学习 287

9.2.5  支持向量机 288

9.2.6  聚类分析 291

9.3  神经元网络 293

9.3.1  前馈网络 294

9.3.2  非监督学习 295

9.3.3  Hopfield神经元网络 296

9.4  句法模式识别 297

9.4.1  语法与语言 298

9.4.2  句法分析与句法分类器 300

9.4.3  句法分类器学习与语法推导 301

9.5  作为图匹配的识别 302

9.5.1  图和子图的同构 303

9.5.2  图的相似度 305

9.6  识别中的优化技术 306

9.6.1  遗传算法 307

9.6.2  模拟退火 308

9.7  模糊系统 309

9.7.1  模糊集和模糊隶属函数 310

9.7.2  模糊集运算 311

9.7.3  模糊推理 312

9.7.4  模糊系统设计与训练 314

9.8  模式识别中的Boosting方法 315

9.9  随机森林 317

9.9.1  随机森林训练 318

9.9.2  随机森林决策 321

9.9.3  随机森林扩展 322

9.10  总结 322

9.11  习题 325

9.12  参考文献 330

第10章  图像理解 335

10.1  图像理解控制策略 336

10.1.1  并行和串行处理控制 336

10.1.2  分层控制 337

10.1.3  自底向上的控制 337

10.1.4  基于模型的控制 337

10.1.5  混合的控制策略 338

10.1.6  非分层控制 341

10.2  SIFT:尺度不变特征转换 342

10.3  RANSAC:通过随机抽样一致来

???拟合 344

10.4  点分布模型 347

10.5  活动表观模型 355

10.6  图像理解中的模式识别方法 362

10.6.1  基于分类的分割 362

10.6.2  上下文图像分类 364

10.6.3  梯度方向直方图-HOG 367

10.7  Boosted层叠分类器用于快速物体

???检测 370

10.8  基于随机森林的图像理解 372

10.9  场景标注和约束传播 377

10.9.1  离散松弛法 378

10.9.2  概率松弛法 379

10.9.3  搜索解释树 381

10.10  语义图像分割和理解 382

10.10.1  语义区域增长 383

10.10.2  遗传图像解释 384

10.11  隐马尔可夫模型 390

10.11.1  应用 394

10.11.2  耦合的HMM 394

10.11.3  贝叶斯信念网络 395

10.12  马尔科夫随机场 397

?10.12.1  图像和视觉的应用 398

10.13  高斯混合模型和期望最大化 399

10.14  总结 404

10.15  习题 407

10.16  参考文献 410

第11章  3D几何,对应,从亮度到3D 419

11.1  3D视觉任务 419

11.1.1  Marr理论 421

11.1.2  其他视觉范畴:主动和

有目的的视觉 422

11.2  射影几何学基础 423

11.2.1  射影空间中的点和超平面 424

11.2.2  单应性 426

11.2.3  根据对应点估计单应性 427

11.3  单透视摄像机 430

11.3.1  摄像机模型 430

11.3.2  齐次坐标系中的投影和

反投影 432

11.3.3  从已知场景标定一个

摄像机 432

11.4  从多视图重建场景 433

11.4.1  三角测量 433

11.4.2  射影重建 434

11.4.3  匹配约束 435

11.4.4  光束平差法 436

11.4.5  升级射影重建和自标定 437

11.5  双摄像机和立体感知 438

11.5.1  极线几何学——基本矩阵 438

11.5.2  摄像机的相对运动——本质

矩阵 440

11.5.3  分解基本矩阵到摄像机

矩阵 441

11.5.4  从对应点估计基本矩阵 441

11.5.5  双摄像机矫正结构 442

11.5.6  矫正计算 444

11.6  三摄像机和三视张量 445

11.6.1  立体对应点算法 446

11.6.2  距离图像的主动获取 451

11.7  由辐射测量到3D信息 453

11.7.1  由阴影到形状 453

11.7.2  光度测量立体视觉 455

11.8  总结 456

11.9  习题 457

11.10  参考文献 459

第12章  3D视觉的应用 464

12.1  由X到形状 464

12.1.1  由运动到形状 464

12.1.2  由纹理到形状 468

12.1.3  其他由X到形状的技术 469

12.2  完全的3D物体 471

12.2.1  3D物体、模型以及相关

问题 471

12.2.2  线条标注 472

12.2.3  体积表示和直接测量 474

12.2.4  体积建模策略 475

12.2.5  表面建模策略 476

12.2.6  为获取完整3D模型的面元

标注与融合 478

12.3  3D场景的2D视图表达 482

12.3.1  观察空间 482

12.3.2  多视图表达和示象图 482

12.4  从无组织的2D视图集合进行

3D重建,从运动到结构 483

12.5  重建场景几何 485

12.6  总结 487

12.7  习题 487

12.8  参考文献 488

第13章  数学形态学 493

13.1  形态学基本概念 493

13.2  形态学四原则 494

13.3  二值膨胀和腐蚀 495

13.3.1  膨胀 495

13.3.2  腐蚀 497

13.3.3  击中击不中变换 498

13.3.4  开运算和闭运算 499

13.4  灰度级膨胀和腐蚀 499

13.4.1  顶面、本影、灰度级膨胀和

腐蚀 500

13.4.2  本影同胚定理和膨胀、腐蚀

及开、闭运算的性质 502

13.4.3  顶帽变换 502

13.5  骨架和物体标记 503

13.5.1  同伦变换 503

13.5.2  骨架、中轴和最大球 503

13.5.3  细化、粗化和同伦骨架 505

13.5.4  熄灭函数和最终腐蚀 506

13.5.5  最终腐蚀和距离函数 508

13.5.6  测地变换 509

13.5.7  形态学重构 510

13.6  粒度测定法 511

13.7  形态学分割与分水岭 513

13.7.1  粒子分割、标记和分水岭 513

13.7.2  二值形态学分割 513

13.7.3  灰度级分割和分水岭 515

13.8  总结 516

13.9  习题 517

13.10  参考文献 518

第14章  图像数据压缩 520

14.1  图像数据性质 521

14.2  图像数据压缩中的离散图像变换 521

14.3  预测压缩方法 523

14.4  矢量量化 525

14.5  分层的和渐进的压缩方法 525

14.6  压缩方法比较 526

14.7  其他技术 527

14.8  编码 527

14.9  JPEG和MPEG图像压缩 528

14.9.1  JPEG——静态图像压缩 528

14.9.2  JPEG-2000压缩 529

14.9.3  MPEG——全运动的视频

压缩 531

14.10  总结 532

14.11  习题 533

14.12  参考文献 535

第15章  纹理 537

15.1  统计纹理描述 539

15.1.1  基于空间频率的方法 539

15.1.2  共生矩阵 540

15.1.3  边缘频率 541

15.1.4  基元长度(行程) 542

15.1.5  Laws纹理能量度量 543

15.1.6  局部二值模式(LBPs) 544

15.1.7  分形纹理描述 547

15.1.8  多尺度纹理描述——小波

域方法 549

15.1.9  其他纹理描述的统计方法 551

15.2  句法纹理描述方法 552

15.2.1  形状链语法 553

15.2.2  图语法 554

15.2.3  分层纹理中的基元分组 555

15.3  混合的纹理描述方法 556

15.4  纹理识别方法的应用 557

15.5  总结 557

15.6  习题 559

15.7  参考文献 561

第16章  运动分析 566

16.1  差分运动分析方法 568

16.2  光流 571

16.2.1  光流计算 571

16.2.2  全局和局部光流估计 573

16.2.3  局部和全局相结合的光流

估计 575

16.2.4  运动分析中的光流 575

16.3  基于兴趣点对应关系的分析 578

16.3.1  兴趣点的检测 578

16.3.2  Lucas-Kanade点跟踪 578

16.3.3  兴趣点的对应关系 580

16.4  特定运动模式的检测 582

16.5  视频跟踪 585

16.5.1  背景建模 585

16.5.2  基于核函数的跟踪 588

16.5.3  目标路径分析 592

16.6  辅助跟踪的运动模型 596

16.6.1  卡尔曼滤波器 596

16.6.2  粒子滤波器 600

16.6.3  半监督跟踪——TLD 603

16.7  总结 605

16.8  习题 607

16.9  参考文献 608

词汇 613

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘