《视觉注意和人脑记忆机制启发下的感兴趣目标提取与跟踪》将人类的认知机制与计算机视觉、图像处理和模式识别相结合,从认知心理学出发对基于视觉注意和人脑记忆机制的感兴趣目标提取和跟踪认知建模方法进行了研究。首先基于生物视觉注意机制对人类视觉显著性特征的感知进行建模和研究,并将其用于感兴趣目标的提取:然后基于人类记忆机制特别是人脑三阶段记忆模型建立一种视觉信息处理认知模型,用于模拟人类对视觉模式进行感知、注意、匹配、分类、学习和决策的过程,并将其与混合高斯背景建模、码本背景建模、Mean-shift目标跟踪、粒子滤波目标跟踪以及多智能体协同进化等相结合,详细研究了其在感兴趣目标提取以及跟踪中的应用,并通过大量的视频目标检测与跟踪实验对算法进行了验证,为在动态复杂视频环境中实现快速鲁棒的感兴趣目标提取和跟踪提供了一条新的研究思路和实现途径。
《视觉注意和人脑记忆机制启发下的感兴趣目标提取与跟踪》可供计算机科学领域人工智能、模式识别、智能信息处理专业研究生、博士生以及相关专业的研究人员参考。
感兴趣目标的提取和跟踪是计算机视觉、图像处理、模式识别以及人工智能等领域最重要的研究内容之一,在目标识别、智能监控、视频(图像)检索、人机接口、车辆导航、导弹制导等多种领域都有着极其重要的应用价值。然而实际场景的复杂多变,如光照变化、背景中各种杂物和噪声的影响、室外场景中各种不确定因素的干扰、目标状态的变化(如姿态、大小、运动速度、运动轨迹等)、目标与背景颜色的相似程度、背景稳定程度、目标被遮挡等,使得运动目标的提取和跟踪一直是计算机视觉研究领域中一个公认的具有挑战性的课题。目前所提出的算法大多在一定条件下或特定应用场合对解决上述问题中的某一个或某几个具有较好的效果,能够解决复杂场景中各种不确定情况及适应不同应用场合的运动目标提取和跟踪算法很少甚至没有。因此,深入探讨和研究新的运动目标提取和跟踪算法,仍然是计算机视觉研究领域的一项非常艰巨的任务。
众所周知,无论场景怎样变化、目标的姿态怎样变化、目标遮挡程度怎样,人类都能毫不费力地区分前景、背景以及辨识运动目标。根据神经生理学、心理学以及认知科学的研究成果,人类之所以能够轻而易举地做到这一点与人类拥有一套功能强大和完善的视觉感知、注意和记忆机制密切相关。其中,视觉注意机制帮助我们完成特定目标的提取以及多个目标间注意焦点的转移;而人脑记忆机制能够让我们记住所看到和经历的情景,从而有助于我们快速辨别所见到的物体、认知新的事物、适应新的环境等。因此,研究和探讨基于人类视觉注意和人脑记忆机制的运动目标提取与跟踪方法具有重要的理论意义和科学价值。
基于此,本书将探讨和研究融合视觉注意与人脑记忆机制的感兴趣目标提取与跟踪方法。首先借鉴认知心理学的研究成果和生物视觉注意机制对人类视觉显著性特征的感知进行建模和研究,并将其用于感兴趣目标的提取;然后基于人类记忆机制特别是人脑三阶段记忆模型建立一种视觉信息处理认知模型,用于模拟人类对视觉模式进行感知、注意、匹配、分类、学习和决策的过程,并将其用于复杂场景的建模以及运动目标的跟踪,以解决复杂场景下目标间的遮挡、目标发生变形、目标姿态变化以及场景中出现新目标等与视觉注意和记忆机制密不可分的问题。
王延江,男,山东海阳人,中共党员,博士,教授,博士生导师,中国自动化学会会员。目前为中国石油大学(华东)信息与通信工程学科带头人,第三届山东省优秀研究生导师。主要从事信号与信息处理领域的教学和科研工作,研究方向包括:模式识别与智能信息处理、视觉注意与人脑记忆计算建模,以及人脑结构与功能网络连接分析。主持或参加国家自然科学基金面上项目3项、国家自然科学基金重点项目1项、山东省自然科学基金项目5项、中国石油天然气总公司重点攻关项目1项、中石化重大科技攻关项目2项、中石油创新基金项目1项,并荣获北京市科技进步二等奖、山东省高等学校优秀科研成果三等奖、中国石油天然气总公司科技进步三等奖、胜利油田科技进步一等奖和二等奖各一次。在IEEE Trans.Industrial Electronics、Pattern Recognition、Signal Processing、Neurocomputing、《中国科学》、《自动化学报》、《电子学报》等国内外重要学术期刊与国际会议上发表学术论文160余篇。
齐玉娟,女,山东诸城人,博士,目前为中国石油大学(华东)讲师,主要研究方向为计算机视觉、模式识别等;已在Applied Intelligence、Journal of Computational Information Systems、《自动化学报》、《模式识别与人工智能》、《石油大学学报(自然版)》等国内外学术期刊与国际会议上发表学术论文10余篇,其中多篇被SCI、EI收录。参加并完成国家自然科学基金面上项目2项,主持山东省自然科学青年基金项目1项。
前言
第1章 概述
1.1 运动目标检测
1.1.1 相邻帧差法
1.1.2 光流法
1.1.3 背景减除法
1.2 运动目标跟踪
1.2.1 目标描述
1.2.2 特征选取
1.2.3 运动目标跟踪方法
1.3 运动目标跟踪方法研究现状
1.4 运动目标检测和跟踪中存在的难点
1.5 视觉注意机制在感兴趣目标提取中的应用
参考文献
第2章 人类视觉系统与视觉注意机制
2.1 人类视觉系统
2.1.1 人眼结构及视觉通路
2.1.2 视皮层
2.1.3 视觉感知机制
2.2 视觉注意机制
2.2.1 视觉注意机制概述
2.2.2 视觉注意建模的理论基础
2.3 经典视觉注意计算模型
2.3.1 Itti视觉注意计算模型
2.3.2 GBVS视觉注意计算模型
2.3.3 SR视觉注意计算模型
2.4 本章小结
参考文献
第3章 基于视觉注意机制的感兴趣目标提取
3.1 基于快速字典学习与特征稀有性的自然图像显著目标提取
3.1.1 稀疏编码
3.1.2 快速字典学习算法
3.1.3 稀有性量化
3.1.4 实验结果及讨论
3.2 基于动态视觉显著性的感兴趣目标提取
3.2.1 静态显著性提取
3.2.2 基于SIFT流的动态显著性提取
3.2.3 实验结果及讨论
3.3 本章小结
参考文献
第4章 基于人类记忆机制的视觉信息处理认知建模
4.1 人脑记忆的分类
4.2 人脑记忆机制的神经基础
4.2.1 神经细胞的基本结构
4.2.2 人脑记忆机制的生理学基础
4.3 人脑记忆计算模型
4.3.1 基于认知心理学的记忆计算模型
4.3.2 基于认知神经科学的记忆计算模型
4.4 基于人脑三阶段记忆模型的视觉信息处理认知建模
4.4.1 信息粒
4.4.2 记忆空间
4.4.3 认知行为
4.4.4 决策
4.4.5 记忆空间更新规则
4.4.6 MVIPM的实现
4.5 本章小结
参考文献
第5章 基于人脑三阶段记忆机制的场景建模
5.1 混合高斯背景建模
5.1.1 混合高斯模型的基本原理
5.1.2 混合高斯背景建模方法存在问题及发展现状
5.2 基于记忆的混合高斯模型
5.2.1 基于记忆的混合高斯背景建模总体框架
5.2.2 基于记忆的混合高斯背景建模算法描述
5.2.3 实验结果及讨论
5.3 基于记忆的码本模型
5.3.1 码本模型
5.3.2 码字的特征参数集合
5.3.3 码本记忆空间的构建
5.3.4 算法流程及描述
5.3.5 实验结果及分析
5.4 本章小结
参考文献
第6章 基于记忆机制Mean-shift和粒子滤波鲁棒运动目标跟踪
6.1 基于记忆的模板更新建模
6.1.1 基于记忆的模板更新模型及定义
6.1.2 模板更新算法详细描述
6.2 基于记忆的模板更新Mean-shift运动目标跟踪
6.2.1 Mean-shift跟踪器初始化及算法描述
6.2.2 实验结果及讨论
6.3 基于记忆的模板更新粒子滤波运动目标跟踪
6.3.1 粒子滤波跟踪器初始化及具体算法描述
6.3.2 实验结果及讨论
6.4 基于记忆的多特征融合粒子滤波目标跟踪
6.4.1 目标特征的描述与提取
6.4.2 基于记忆的多特征融合
6.4.3 基于记忆的多特征融合粒子滤波目标跟踪
6.4.4 实验结果及分析
6.5 本章小结
参考文献
第7章 基于记忆的多智能体协同进化运动目标跟踪
7.1 基于记忆的多智能体协同进化运动目标跟踪建模
7.1.1 基于记忆的智能体模型
7.1.2 多智能体协同进化行为
7.1.3 YCbCr颜色空间非参数目标建模
7.1.4 算法的实现
7.2 实验结果及讨论
7.3 本章小结
参考文献
彩图