本书较好地把握了《数字图像处理》这部教材在相关专业基础课教学中的基础性地位,把全书的内容始终定位在基础知识、基本理论和基本技术上。所以,没有引入那些涉及到相对深奥的数学理论的图像处理内容,比如基于模糊理论的图像处理方法、基于神经网络的图像处理方法等;也没有引入相对来说是非基础性图像处理方法的内容,比如图像融合方法、图像数字水印技术等。书中专门开辟小波图像处理这一章比较难点的内容,是考虑了小波理论和小波图像处理方法在图像处理中的基础性和重要性作用,该部分内容虽然相对较难较深入,但总体上把握住了难和深的度。
随着计算机技术、电子技术、信息处理技术和Internet技术的迅猛发展,图像处理技术已经成为信息技术领域中的核心技术之一,并已在国民经济的各个领域得到了十分广泛的应用,在推动社会进步和改善人们生活质量方面起着越来越重要的作用。
自本书第1版和第2版分别在2007年和2013年出版以来,在几十所院校相关专业的本科生和研究生课程教学中得到了应用,许多学生、老师和读者对本书的进一步改版给予了特别的关心,并提出了许多宝贵的建议。出版第3版的原因是纠正第2版中的一些不准确的描述,删除一些不重要的内容,与时俱进地加入一些新内容和新主题。
本书主要有以下特点:
(1) 将离散傅里叶变换、离散余弦变换和小波变换三部分图像变换内容,分别作为第5章的频率域图像处理、第7章的图像压缩编码、第8章的小波图像处理的数学基础放在相应章的*节,不再把图像变换设为独立的一章内容。对图像变换部分内容的这种组织方式,不仅化解了学生在刚开始学习本课程时,就遇到了学习“数学”知识的困惑和畏难情绪; 而且实现了数字图像处理技术中的这三种*重要的变换方法与图像本体技术的紧耦合。一方面会使学生直接体会到这些数学基础在图像本体技术上的作用和重要性,另一方面会使学生自然地体验到自己是在学习数字图像处理课而不是在学数学课,进而增加学生对学习这些图像变换基础理论的主动性。
(2) 从吸收*新数字图像处理基础技术研究成果和紧跟目前基于特征的图像处理方法研究热点的需求出发,进一步完善了第10章的图像特征提取内容,构成了由图像的边缘特征及其检测方法、图像的点与角点特征及其检测方法、图像的纹理特征及其检测方法、图像的形状特征和图像的统计特征组成的较为完整的图像特征及检测方法的内容体系,进一步突出了图像特征检测与提取在图像处理技术领域的基础性和重要性。
(3) 深入浅出,并较为全面系统地给出了小波理论及其在图像处理技术中应用的基础性内容。该部分内容的学习,为学生今后进一步学习基于多尺度和多分辨率分析的图像分析方法和计算机视觉理论与技术奠定了基础。
(4) 分别将彩色图像处理、形态学图像处理作为单独的一章内容,并且在其内容的系统性和深入性方面,与国内的同类教科书相比,具有独特性。
(5) 新增了视频图像处理一章内容,适应了目前智能视频监控系统和视频图像通信系统广泛应用,以及视频检测和视频压缩编码技术迅猛发展的需求。
(6) 本书较好地把握了《数字图像处理》这部教材在相关专业基础课教学中的基础性地位,把全书的内容始终定位在基础知识、基本理论和基本技术上。所以,没有引入那些涉及相对深奥的数学理论的图像处理内容,比如基于模糊理论的图像处理方法、基于神经网络的图像处理方法等; 也没有引入相对来说是非基础性图像处理方法的内容,比如图像融合方法、图像数字水印技术等。书中专门开辟了小波图像处理这一章比较有难度的内容,是考虑了小波理论和小波图像处理方法在图像处理中的基础性和重要性,并且从总体上把握住了相关内容的难度和深度。
本书的大部分内容都提供了比较详细的数学推导和说明,本书假设读者具备基本的线性系统理论、概率和向量代数的相关基础知识。如果学习者不具备第6章图像恢复涉及的矩阵向量运算及对其求偏导的知识,可略讲其中的相关内容。
全书共分为14章,第1章介绍数字图像处理的基本概念; 第2章介绍数字图像处理的基础知识; 第3章介绍数字图像的基本运算; 第4章介绍空间域图像增强; 第5章介绍频率域图像处理; 第6章介绍图像恢复; 第7章介绍图像压缩编码; 第8章介绍小波图像处理; 第9章介绍图像分割; 第10章介绍图像特征提取; 第11章介绍彩色图像处理; 第12章介绍形态学图像处理; 第13章介绍目标表示与描述; 第14章介绍视频图像处理。
本书可作为高等院校计算机类的计算机科学与技术和数字媒体技术专业,电子信息类的电子信息工程、通信工程、光电信息科学与工程和信息工程专业,自动化类的自动化专业,测绘类的遥感科学与技术专业,兵器类的探测制导与控制技术专业,医学技术类的医学影像技术专业,以及特设专业电子信息类的医学信息工程专业的大学本科生的专业基础课或高年级学生的专业课教材。也可作为计算机科学与技术、信息与通信工程、控制科学与工程、测绘科学与技术、兵器科学与技术、光学工程、医学技术等学科,从事图像处理与分析、目标识别与跟踪、景象匹配及制导、视频检测与识别、视频信息压缩及编码、计算机视觉及应用等研究方向研究生的专业基础课或专业课教材。还可供从事上述相关学科专业的研究人员和工程技术人员参考。
本书的第1章至第10章内容由李俊山编写,第11章和第12章内容由李俊山和李旭辉共同编写,第13章内容由李旭辉编写,第14章内容由李俊山和朱子江共同编写,附录部分由李俊山编写。
在本书第1版到第3版的编写过程中,胡双演、李建军、杨威、谭圆圆、杨亚威、李堃、张雄美、张姣、隋中山等参与了书中部分算法和实验图例的验证。此外,书中还引用了一些著作、论文和相关资料的观点,并汲取了教材在教学使用中一些读者的反馈意见,在此一并向他们表示衷心的感谢。
另外,书中难免有不当和疏漏之处,敬请广大读者不吝批评、指正。
作者
第5章频率域图像处理
频率域图像是把空间域图像像素的灰度值表示成随位置变化的空间频率,并以频谱(也称为频谱图)的形式表示图像信息分布特征的一种表示方式。频率域图像处理是指在图像的频率域中对图像进行某种处理的方法,这种方法以傅里叶变换为基础,也即先通过傅里叶变换把图像从空间域变换到频率域,然后用频率域方法对图像进行处理,处理完后再利用傅里叶反变换把图像变换回空间域。
本章首先介绍面向空间域图像的二维离散傅里叶变换及其频谱特性,然后介绍频率域图像处理的基本实现思路,*后介绍基于频率域的图像噪声消除(频率域低通滤波)和基于频率域的图像增强(频率域高通滤波)方法,*后介绍面向某些特殊应用的带阻滤波和带通滤波。
5.1二维离散傅里叶变换
1822年,法国工程师傅里叶(Fourier)指出: 一个“任意”的周期函数f(x)都可以分解为无穷多个不同频率的正弦和/或余弦的和,即傅里叶级数。求解傅里叶级数的过程就是傅里叶变换。傅里叶级数和傅里叶变换又统称为傅里叶分析或谐波分析。
离散傅里叶变换(Discrete Fourier Transform,DFT)描述的是离散信号的一维时域或二维空间域表示与频域表示的关系,是信号处理和图像处理中的一种*有效的数学工具之一,在频谱分析、数字滤波器设计、功率谱分析、传递函数建模、图像处理等方面具有广泛的应用。
5.1.1二维离散傅里叶变换的定义和傅里叶频谱
由于一幅数字图像可以描述成一个二维函数,所以下面仅介绍应用于图像处理的二维离散傅里叶变换。
1. 二维离散傅里叶变换的定义
设f(x,y)是在空间域上等间隔采样得到的M×N的二维离散信号,x和y是离散实变量,u和v为离散频率变量,则二维离散傅里叶变换对一般地定义为
F(u,v)=1MN∑M-1x=0∑N-1y=0f(x,y)exp-j2πxuM+yvN
(u=0,1,…,M-1; v=0,1,…,N-1)(5.1)
f(x,y)=1MN∑M-1u=0∑N-1v=0F(u,v)expj2πuxM+vyN
(x=0,1,…,M-1; y=0,1,…,N-1)(5.2)
在图像处理中,有时为了讨论上的方便,取M=N,这样二维离散傅里叶变换对就定义为
F(u,v)=1N∑N-1x=0∑N-1y=0f(x,y)exp-j2π(xu+yv)N
(u,v=0,1,…,N-1)(5.3)
f(x,y)=1N∑N-1u=0∑N-1v=0F(u,v)expj2π(ux+vy)N
(x,y=0,1,…,N-1)(5.4)
其中,exp[-j2π(xu+yv)/N]是正变换核,exp[j2π(ux+vy)/N]是反变换核。
二维离散傅里叶变换的频谱和相位角定义为
|F(u,v)|=R2(u,v)+I2(u,v)(5.5)
(u,v)=arctan[I(u,v)/R(u,v)](5.6)
2. 图像的傅里叶频谱特性及频谱图
傅里叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,从物理效果看,傅里叶变换是将图像从空间域转换到频率域。一幅空间域的图像f(x,y)变换到频率域F(u,v)后,其傅里叶频谱|F(u,v)|可以以频谱图的形式予以显示。比如,图5.1(a)的图像的频谱如图5.1(b)所示; 图5.2(a)的图像的频谱如图5.2(b)所示。
图5.1图像的傅里叶频谱示例1
图5.2图像的傅里叶频谱示例2
在图像的傅里叶频谱中,原空间域图像上的灰度突变部位、图像结构复杂的区域、图像细节及干扰噪声等信息集中在高频区,对应于图5.1(b)和图5.2(b)的傅里叶频谱的中间部位; 原空间域图像上灰度变化平缓部位(也即空间域图像的平坦区域)的信息集中在低频区,对应于图5.1(b)和图5.2(b)的傅里叶频谱的4个角部分。也即在傅里叶频谱图上,4个角反映的是原图像的低频特性,中间部位反映的是原图像的高频特性。
按照图像空间域和频率域的对应关系,空间域中的强相关性,也即图像中一般都存在有大量的平坦区域,使得图像平坦区域中的相邻或相近像素一般趋向于取值相同或值相近的灰度值,它们在频率域中对应于低频部分,低频部分对应于傅里叶频谱的4个角部分。由于低频部分能量较集中,因而在频谱图上的视觉效果较亮。
5.1.2二维离散傅里叶变换的若干重要性质
二维离散傅里叶变换的性质包括线性性、可分离性、平均值性质、周期性、共轭对称性、空间位置和空间频率的平移性、旋转性、尺度变换性、卷积性质等。下面仅介绍几种比较重要且在本书的有关内容中涉及的性质。
1. 变换系数矩阵
由二维离散傅里叶反变换式(5.4)可知,由于u和v均有0,1,…,N-1的N个可能的取值,所以f(x,y)由N2个频率分量组成,所以每个频率分量都与一个特定的(u,v)值相对应; 且对于某个特定的(u,v)值来说,当(x,y)取遍所有可能的值(x=0,1,…,N-1; y=0,1,…,N-1)时,就可得到对应于该特定的(u,v)值的一个变换系数矩阵:
expj2π0u+0vNexpj2π0u+1vN…expj2π0u+(N-1)vN
expj2π1u+0vNexpj2π1u+1vN…expj2π1u+(N-1)vN
expj2π(N-1)u+0vNexpj2π(N-1)u+1vN…expj2π(N-1)u+(N-1)vN(5.7)
显然,对应于不同(u,v)值的变换系数矩阵共有N2个,且它们与f(x,y)无关。
2. 可分离性
式(5.3)和式(5.4)的二维离散傅里叶变换对可写成如下的分离形式:
F(u,v)=1N∑N-1x=0
∑N-1y=0f(x,y)exp-j2πyvNexp-j2πxuN
(u,v=0,1,…,N-1)(5.8)
f(x,y)=1N∑N-1u=0∑N-1v=0F(u,v)expj2πvyNexpj2πuxN
(x,y=0,1,…,N-1)(5.9)
上述的可分离表示形式说明,可以连续运用两次一维DFT来实现一个二维DFT。以式(5.8)为例,可先沿y轴方向进行一维的(列)变换而求得
F(x,v)=1N∑N-1y=0f(x,y)exp-j2πvyN(v=0,1,…,N-1)(5.10)
然后再对F(x,v)沿x方向进行一维的(行)变换而得到*后结果
F(u,v)=1N∑N-1x=0F(x,v)exp-j2πuxN(u,v=0,1,…,N-1)(5.11)
3. 平均值
一幅图像的灰度平均值可表示为
f-=1N2∑N-1x=0∑N-1y=0f(x,y)(5.12)
如果将u=v=0代入式(5.3),可得
F(0,0)=1N∑N-1x=0∑N-1y=0f(x,y)(5.13)
所以,一幅图像的灰度平均值可由DFT在原点处的值求得,即
f-=1NF(0,0)(5.14)
对于M×N的图像f(x,y)和二维离散傅里叶变换对的一般定义式(5.1)和式(5.2),图像的灰度平均值公式为
f-=1MNF(0,0)(5.15)
4. 周期性
对于M×N的图像f(x,y)和二维离散傅里叶变换对的一般定义式(5.1)和式(5.2),F(u,v)的周期性定义为
F(u,v)=F(u+mM,v+nN)(m,n=0,±1, ±2,…)(5.16)
5. 共轭对称性
设f(x,y)为实函数,则其傅里叶变换F(u,v)具有共轭对称性
F(u,v)=F(-u,-v)(5.17)
|F(u,v)|=|F(-u,-v)|(5.18)
……