本书用丰富的图示和实验,将物体的自动理解技术和机器学习的理论 相结合,以实现物体的自动理解技术为主线,以机器学习的理论作为主要 方法,结合实例逐步深入地介绍了机器学习相关理论。主要内容包括特征 提取、三维网格分割、三维场景重建、三维模型功能性分析等,涵盖了目 前常用的主流的各种学习方法。 本书结构紧凑,内容逐步深入,同时包含大量实验进行讲解说明。适 合相关领域的本科生、研究生以及工程技术人员阅读。
物体自动理解是室内机器人、无人驾驶汽车、无人飞行器面临的一项复杂课题。理解的任务在于,利用搭载的深度传感器、多视角相机、机载雷达等,主动识别场景中的物体,认识物体与物体之间的结构关系,明确场景中人作为活动对象与物体之间的交互作用。理解的实现方式为,将室内场景、外部道路周边环境、空间环境自动转换为物体标注,解析物体关系,建立人与物体的交互关系,重建三维环境。正确的场景感知可以实现自主认知和适应环境,有利于室内机器人室内定位和移动路径规划;有利于无人驾驶汽车实现在复杂道路上的安全自动驾驶;有利于无人飞行器实现空中搜救与环境监测等无人值守的全自动任务。
机器学习也是近年来的研究热点,在机器学习领域,各种新型的算法层出不穷。本书将物体自动理解与机器学习相结合,从多个方面对基于机器学习的物体自动理解技术进行了详细的介绍。
本书由以下几部分构成:
第一部分叙述了物体自动理解技术的概念和研究意义,详细阐述了本书的研究价值。
第二部分介绍了多种前沿的、有效的特征提取方法。针对图像的场景解析,本书提出了一种全新的深度学习框架,能够有效地进行结构化学习。设计了两套构建高层结构化信息的三维信息学习框架:基于环特征的学习框架和基于词包编码的特征学习框架。同时,提出了基于深度置信网络的三维形状高层特征提取方法,成功将深度学习方法应用于三维形状数据的理解中。
第三部分在分析研究主流三维网格分割算法的基础上,提出了两个新的基于多标准的三维网格评价度量手段,提供了一种更符合人类认知的评价方法,解决了网格分割标准不唯一的问题。同时,提出了一种基于凹陷区域探测和启发式快速行进二分类方法的三维模型自动分割算法,利用该方法提取三维模型的标准姿态,实现了对非刚性三维模型的检索。
第四部分在三维物体识别的基础上,进行了三维场景的重建。与传统重建技术有着本质区别,本书提出的三维重建方法不是简单地将深度相机获得的点云数据进行配准得到场景重建,而是对场景中的所有物体进行识别并与数据库中的模型进行匹配,实现了三维场景的语义重建。本书利用随机回归森林法从数据库中匹配出物体的最相似三维模型,并根据深度信息变换到场景中,得到单幅图像的模型重建,利用改进的迭代最近点方法进行数据配准,得到多幅图像之间的坐标变换,从而将单幅图像的重建结果融合到一个完整的场景。
第五部分对三维模型的功能性分析技术进行了介绍。功能性检测是最近几年才被提出来的三维模型理解方法,本书将以基于人体骨架的三维模型功能性分析为主,对该类方法进行详细的论述。通过将特定的模型与待检测的物体模型互相交互来判断某物体是否具有某项功能,进而找到该物体的功能位置;同时,采用基于舒适性的姿态调整方法生成人体模型,通过舒适程度的大小来判断当前人体模型的姿态合理性。
查看全部↓
前言
第一部分 绪论
第1章 什么是物体自动理解技术
1.1 物体自动理解技术概念
1.2 研究意义
第二部分 特征提取
第2章 三维模型概述
2.1 三维模型的起源与发展
2.2 三维模型的获取与存储
2.3 国内外三维模型特征提取的研究现状
第3章 基于二维图像的特征提取
3.1 深度学习的出现和发展
3.2 深度学习原理概述
3.3 基本的前馈神经网络模型
3.4 深度学习模型训练中的优化方法和常用技巧
3.5 内嵌推理的深度网络框架
3.6 特征学习层
3.7 结构学习层
3.8 特征融合层
3.9 实验分析
第4章 基于深度学习的三维模型特征提取
4.1 三维模型的底层特征提取
4.2 模型的中层特征提取
4.3 三维模型的高层特征提取
4.4 实验验证与分析
第5章 基于深度置信网络的三维模型特性提取
5.1 相关算法理论
5.2 算法框架
5.3 数据预处理和视角图像的生成
5.4 特征提取
5.5 实验验证与结果分析
5.6 小结
第三部分 三维网格分割与模型检索
第6章 视觉分割技术概述
6.1 分割背景和意义
6.2 图形分割的国内外研究现状
第7章 二维图像分割算法研究
7.1 颜色空间及分析
7.2 纹理特征及分析
7.3 常用彩色图像分割方法
7.4 小结
第8章 三维网格分割研究
8.1 网格分割概述
8.2 基于有监督学习的三维模型分割
8.3 基于谱嵌入的三维模型共分割
8.4 基于用户交互的快捷分割
8.5 基于凸度估计和快速行进方法的三维模型自动分割算法
第9章 多标准三维物体分割评价
9.1 相似性汉明距离
9.2 熵增
9.3 自适应熵增
9.4 评价实验
9.5 其他评价方法
第10章 非刚性单位模型检索应用
10.1 三维形状分类方法简介
10.2 形状检索定义
10.3 三维形状检索研究现状
10.4 常用检索评价方法
10.5 非刚性三维模型检索
第四部分 三维场景重建
第11章 基于三维场景分割的三维重建
11.1 图像预处理
11.2 基于边缘检测的RGBD图像过分割
11.3 地面和墙的测定及对分割结果的处理
11.4 基于随机回归森林的场景区域识别
11.5 目标提取
11.6 场景更新
11.7 实验结果
11.8 小结
第五部分 三维模型功能性分析
第12章 功能性分析相关理论
12.1 功能性分析的引入
12.2 基于舒适性的人体骨架模型姿态设计
12.3 研究现状
第13章 基于人体骨架的三维模型功能性分析
13.1 三维模型功能性检测及应用
13.2 基于舒适性的人体模型生成
13.3 功能性分析实验验证
13.4 相关讨论
参考文献
查看全部↓