目录
Contents
1绪论
1.1图像工程的发展
1.2图像理解概述
1.2.1图像理解
1.2.2计算机视觉
1.2.3其他相关学科
1.2.4图像理解的应用领域
1.3主要内容和安排
总结和复习
2视感觉和视知觉
2.1从感觉到知觉
2.2视觉特性
2.2.1视觉的时间特性
2.2.2视觉的空间特性
2.3形状知觉
2.3.1形状的感知
2.3.2轮廓
2.3.3图形和背景
2.3.4几何图形视错觉
2.4空间知觉
2.4.1非视觉性深度线索
2.4.2双目深度线索
2.4.3单目深度线索
2.5运动知觉
总结和复习
3高维图像采集
3.1高维图像
3.1.1高维图像种类
3.1.2本征图像和非本征图像
3.2成像变换和摄像机模型
3.2.1一般摄像机模型
3.2.2近似投影模式
3.2.3通用成像模型
3.3摄像机标定
3.3.1标定程序和参数
3.3.2两级标定法
3.4深度图像采集
3.4.1飞行时间法
3.4.2结构光法
3.4.3莫尔等高条纹法
3.4.4深度和亮度图像同时采集
3.5显微镜3D分层成像
3.5.1显微镜3D成像
3.5.2共聚焦显微镜3D成像
总结和复习
43D目标表达
4.1曲线和曲面的局部特征
4.1.1曲线局部特征
4.1.2曲面局部特征
4.23D表面表达
4.2.1参数表达
4.2.2表面朝向表达
4.3等值面的构造和表达
4.3.1行进立方体算法
4.3.2覆盖算法
4.4从并行轮廓插值3D表面
4.53D实体表达
4.5.1基本表达方案
4.5.2广义圆柱体表达
总结和复习
5立体视觉: 双目
5.1立体视觉
5.1.1立体成像方式
5.1.2立体视觉模块
5.2双目成像和视差
5.2.1双目横向模式
5.2.2双目横向会聚模式
5.2.3双目纵向模式
5.3基于区域的双目立体匹配
5.3.1模板匹配
5.3.2双目立体匹配
5.4基于特征的双目立体匹配
5.4.1基本方法
5.4.2动态规划匹配
5.5视差图误差检测与校正
总结和复习
6立体视觉: 多目
6.1水平多目立体匹配
6.1.1水平多目图像
6.1.2倒距离
6.2正交三目立体匹配
6.2.1基本原理
6.2.2基于梯度分类的正交匹配
6.3多目立体匹配
6.3.1任意排列三目立体匹配
6.3.2正交多目立体匹配
6.4亚像素级视差计算
总结和复习
7景物恢复: 多图像
7.1单目景物恢复
7.2光度立体学
7.2.1景物亮度和图像亮度
7.2.2表面反射特性和亮度
7.2.3目标表面朝向
7.2.4反射图和亮度约束方程
7.2.5光度立体学求解
7.3从运动求取结构
7.3.1光流和运动场
7.3.2光流方程求解
7.3.3光流与表面取向
总结和复习
8景物恢复: 单图像
8.1从阴影恢复形状
8.1.1阴影与形状
8.1.2利用单目图像求解照度方程
8.2纹理与表面朝向
8.2.1单目成像和畸变
8.2.2由纹理变化恢复朝向
8.2.3线段纹理消失点的确定
8.3由焦距确定深度
8.4根据三点透视估计位姿
总结和复习
9知识和表达
9.1知识分类和表达
9.2场景知识
9.2.1模型
9.2.2属性超图
9.2.3基于知识的建模
9.3过程知识
9.4知识表达基础
9.4.1对知识表达的要求
9.4.2知识表达类型
9.4.3图像理解系统中的知识模块
9.4.4图像理解中的知识表达
9.5逻辑系统
9.5.1谓词演算规则
9.5.2利用定理证明来推理
9.6语义网络
9.7产生式系统
总结和复习
10广义匹配
10.1匹配基础
10.1.1匹配策略和类别
10.1.2匹配和配准
10.2目标匹配
10.2.1匹配的度量
10.2.2字符串匹配
10.2.3惯量等效椭圆匹配
10.3动态模式匹配
10.4关系匹配
10.5图同构
10.5.1图论简介
10.5.2图同构和匹配
10.6线条图标记
总结和复习
11图像模式识别
11.1模式和分类
11.2统计模式识别
11.2.1最小距离分类器
11.2.2最优统计分类器
11.3感知机和支持向量机
11.3.1感知机
11.3.2支持向量机
11.4结构模式识别
11.4.1字符串结构识别
11.4.2树结构识别
11.4.3学习和推理
总结和复习
12图像理解理论和系统
12.1从感知到理解
12.2图像理解理论框架
12.2.1马尔视觉计算理论
12.2.2对马尔理论框架的改进
12.2.3关于马尔重建理论的讨论
12.2.4新理论框架的研究
12.3图像理解系统模型
12.3.1系统模型结构
12.3.2多层次串行结构
12.3.3以知识库为中心的辐射结构
12.3.4以知识库为根的树结构
12.3.5多模块交叉配合结构
12.4具体系统分析
12.4.1VISIONS系统
12.4.2ACRONYM系统
12.4.3KB Vision系统
12.5典型系统比较
12.6讨论和展望
总结和复习
附录A多传感器图像信息融合
A.1信息融合概述
A.1.1多信息融合
A.1.2传感器模型
A.2图像融合
A.2.1图像融合的主要步骤
A.2.2图像融合的三个层次
A.2.3图像融合效果评价
A.2.4像素级融合示例
A.3像素级融合方法
A.3.1基本融合方法
A.3.2融合方法的结合
A.3.3小波融合时的最佳分解层数
A.4特征级和决策级融合方法
A.4.1贝叶斯法
A.4.2证据推理法
A.4.3粗糙集理论法
附录B人脸和表情识别
B.1生物特征识别
B.2人脸检测定位
B.2.1人脸检测定位的基本方法
B.2.2基于Hausdorff距离的人脸检测定位
B.3脸部器官提取和跟踪
B.3.1眼睛几何模型及确定
B.3.2眨眼过程中的眼睛轮廓跟踪
B.4表情识别
B.4.1表情识别和步骤
B.4.2表情特征提取
B.4.3基于Gabor变换的表情特征提取
B.4.4表情分类
B.4.5基于高阶奇异值分解的表情分类
B.5人脸识别
B.5.1边缘本征矢量加权的Hausdorff距离
B.5.2非特定表情人脸识别
附录C基于内容的图像和视频检索
C.1基于视觉特征的图像检索
C.1.1颜色匹配
C.1.2纹理匹配
C.1.3形状匹配
C.2基于运动特征的视频检索
C.2.1全局运动特征匹配
C.2.2局部运动特征匹配
C.3基于区域的AdaBoost检索
C.4视频节目分析和检索
C.4.1新闻视频结构化
C.4.2体育比赛视频排序
C.4.3家庭录像视频组织
C.5语义分类检索
C.5.1基于视觉关键词的图像分类
C.5.2高层语义与气氛
部分习题解答
参考文献