数字图像处理重点汇总
数字图像处理研究的内容主要有:(1)图像获取,表示和表现(2)图像增强(3)图像复原(4)图像分割(5)图像分析(6)图像重建(7)图像压缩编码
数字图像处理:利用计算机对图像进行去除噪声、增强、复原、分割、特征提取、识别等处理的理论、方法和技术。一般情况下,图像处理是用计算机和实时硬件实现的,因此,也称之为计算机图像的实现。 数字图像处理的特点:(1)处理精度高,再现性好(2)易于控制处理效果(3)处理的多样性(4)图像数据量庞大(5)处理费时(6)图像处理技术综合性强 图像:就是三维场景在二维平面上的影像
数字图像:是用配置在二维平面(画面)上的灰度值或彩色值来表示信息的,信息扩展在二维平面上。数字图像以数字格式存储图像数据,数字图像常用矩阵来描述。 图像处理的研究目的:(1)提高图像的视感质量,以达到赏心悦目的目的(2)提取图像中所包含的某些特征或特殊信息,只要用于计算机分析,经常用作模式识别,计算机视觉的预处理(3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输
图像工程三层示意图:图像工程的内容可分为图像处理、图像分析和图像理解三个层次,这三个层次既有联系又有区别,如下图所示。
图像处理、图像分析、图像理解各有什么特点?它们之间有何联系和区别?
图像处理:的重点是图像之间进行的变换。尽管人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要是对图像进行各种加工,以改善图像的视觉效果并为自动识别奠定基础,或对图像进行压缩编码以减少所需存储空间
图像分析:主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。这里的数据可以是目标特征的测量结果,或是基于测量的符号表示,它们描述了目标的特点和性质。 图像理解:的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。 如果说图像分析主要以观察者为中心来研究客观世界,那么图像理解在一定程度上是以客观世界为中心,借助知识、经验等来把握整个客观世界(包括没有直接观察到的事物)的。
联系:图像处理、图像分析和图像理解处在三个抽象程度和数据量各有特点的不同层次上。图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的非图形式的描述。图像理解主要是高层操作,基本上是对从描述抽象出来的符号进行运算,其处理过程和方法与人类的思维推理有许多类似之处。 数字图像处理系统的组成:(1)数字图像处理系统的硬件【图像输入设置、图像输入卡、显示卡、计算机、图像存储装置】(2)高速图像处理卡【GPB-K】(3)图像处理系统软件 试述连续图像f(x,y)和数字图像g(i.j)中变量的含义,它们有何联系和区别?
连续图像中,图像为一个二维平面,(x,y)图像中的任意一点,f(x,y)为图像于(x,y)于处的值。连续图像中,(x,y)的取值是连续的,f(x,y)也是连续的
数字图像中,图像为一个由有限行有限列组成的二维平面,(i,j)为平面中的任意一点,g(i,j)则为图像在(i,j)处的灰度值,数字图像中,(i,j) 的取值是不连续的,只能取整数,对应第i行j列,g(i,j) 也是不连续的,表示图像i行j列处图像灰度值。
联系:数字图像g(i,j)是对连续图像f(x,y)经过采样和量化这两个步骤得到的。其中g(i,j)=f(x,y)|x=i,y=j【f(x,y)表示二维图像在空间(x,y)上的幅值,数字图像I(r,c)表示位于图像矩阵上第r行,第c列的元素幅值。I(r,c)是通过对f(x,y)抽样和量化得来的。f(x,y)各量是连续的,I(r,c)各量是离散的】 ●第二章
图像的数字化包括采样和量化两个过程。 采样:【概念:】图像在空间上的离散化称为采样。用空间上部分点的灰度值代表图像,这些点称为采样点。 【方法:】先沿垂直方向采样,再沿水平方向采样,用两个步骤完成采样操作。 对于运动图像,需先在时间轴上采样,再沿垂直,最后沿水平方向采样。 模拟图像经采样后,在空间上离散化为像素,但采样所得的像素值仍是连续量。 量化:把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。 像素值量化后用一个字节8bit来表示。
总结:采样点数越多,图像质量越好;采样点数减少时,图像的块状效应就逐渐明显;量化级数越多,图像质量越好,量化级数最小的极端情况就是二值图像,图像出现假轮廓。 采用如下原则可以得到质量较好的图像:(1)对缓变的图像,应该细量化,粗采样,以避免假轮廓(2)对细节丰富的图像,应细采样,粗量化,以避免模糊 数字图像类型:静态图像可分为:(1)矢量图:(用数学公式描述一幅图像)优点[①文件数据量很小②图像质量与分辨率无关(2)位图:(用许多像素点表示一幅图像,每个像素具有颜色属性和位置属性,也叫栅格图像)
位图分为:线画稿、灰度图像、索引颜色图像、真彩色图像(其中灰度图像和索引颜色图像有调色板,真彩色图像不需要调色板)
调色板的作用:索引颜色 24色:真彩色 ●图像文件格式:(1)BMP格式:windows系统交换图形、图像数据的一种标准格式(2)DIB(3)TIF(4)PBM、PGM、PPM(5)PCX(6)JPEG ●BMP图像的数据由四部分组成:(1)位图文件头(2)位图信息头(3)调色板(4)位图数据
●常见的文件格式有哪些?它们各有何特点? jpg(jpeg)
JPEG:联合摄影专家组
JPEG 图片以 24 位颜色存储单个光栅图像。JPEG 是与平台无关的格式,支持最高级别的
压缩,不过,这种压缩是有损耗的。渐近式 JPEG 文件支持交错。可以提高或降低 JPEG 文件压缩的级别。但是,文件大小是以图像质量为代价的。压缩比率可以高达 100:1。(JPEG 格式可在 10:1 到 20:1 的比率下轻松地压缩文件,而图片质量不会下降。)JPEG 压缩可以很好地处理写实摄影作品。但是,对于颜色较少、对比级别强烈、实心边框或纯色区域大的较简单的作品,JPEG 压缩无法提供理想的结果。有时,压缩比率会低到 5:1,严重损失了图片完整性。这一损失产生的原因是,JPEG 压缩方案可以很好地压缩类似的色调,但是 JPEG 压缩方案不能很好地处理亮度的强烈差异或处理纯色区域。
优点:摄影作品或写实作品支持高级压缩,利用可变的压缩比可以控制文件大小。支持交错(对于渐近式 JPEG 文件)。JPEG 广泛支持 Internet 标准。
缺点:有损耗压缩会使原始图片数据质量下降。当您编辑和重新保存 JPEG 文件时,JPEG 会混合原始图片数据的质量下降。这种下降是累积性的。不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显的较简单的图片。是最常见的格式之一。 BMP:Windows 位图
Windows 位图可以用任何颜色深度(从黑白到 24 位颜色)存储单个光栅图像。Windows 位图文件格式与其他 Microsoft Windows 程序兼容。它不支持文件压缩,也不适用于 Web 页。从总体上看,Windows 位图文件格式的缺点超过了它的优点。为了保证照片图像的质量,请使用 PNG 文件、JPEG 文件或 TIFF 文件。BMP 文件适用于 Windows 中的墙纸。 优点:BMP 支持 1 位到 24 位颜色深度。BMP 格式与现有 Windows 程序(尤其是较旧的程序)广泛兼容。
缺点:BMP 不支持压缩,这会造成文件非常大,BMP 文件不受 Web 浏览器支持。 GIF:图形交换格式;
GIF 图片以 8 位颜色或 256 色存储单个光栅图像数据或多个光栅图像数据。GIF 图片支持透明度、压缩、交错和多图像图片(动画 GIF)。
PGIF 透明度不是 alpha 通道透明度,不能支持半透明效果。GIF 压缩是 LZW 压缩,压缩比大概为 3:1。GIF 文件规范的 GIF89a 版本中支持动画 GIF。
优点:GIF 广泛支持 Internet 标准。支持无损耗压缩和透明度。动画 GIF 很流行,易于使用许多 GIF 动画程序创建。很多QQ表情都是GIF的~
缺点:GIF 只支持 256 色调色板,因此,详细的图片和写实摄影图像会丢失颜色信息 ●图像数字化设备的组成:(1)采样孔(2)图像扫描机构(3)光传感器(4)量化器(5)输出存储装置 ●第四章
●直方图是灰度级的函数,它反映了图像中的每一灰度级出现的次数(该灰度级的像素数)或频率(该灰度级像素于图像总像素质比)。
●直方图均衡化的基本思想是把原始图像的直方图变换为均匀分布的形式,从而增加图像灰度的动态范围,达到增强图像对比度的效果。
●直方图均衡化步骤:1。计算直方图 2。计算累积直方图 3。舍入与合并灰度级 4。确定映射关系5。计算像素数
●直方图规定化就是把直方图变换为某个特定的形状,从而有选择地增强某个灰度范围内的对比度。
●直方图规定化步骤:1。对原直方图进行均衡化处理,得到映射关系rk→sk 2.对规定直方图进行均衡化处理,得到映射关系zl→vl
3.对于每个sk迭代计算出vl-sk>=0的最小vl,得到映射关系rk→zl ●模板卷积是数字图像处理中常用的一种淋雨运算方式,它是指模板与图像进行类似于卷积或相关的运算。模板卷积可实现图像平滑、图像锐化、边缘检测等功能。
●模板卷积的基本步骤: 1.模板在输入图像上移动,让模板原点依次与输入图像中的每个像素重合 2.模板系数与跟模板重合的输入图像的对应像素相乘,再将乘机相加 3.把结果赋予输出图像,其像素位置与模板原点在输入图像的位置一致。
●邻域平均法的思想是用像素及其指定邻域内像素的平均值或加权平均值作为该像素的新值,以便去除突变的像素点,从而滤除一定的噪声。
●3*3高斯模版1/16
●中值滤波把以某像素为中心的小窗口内的所有像素的灰度按从小到大排序,取排序结果的中间值作为该像素的灰度值。
●比较均值滤波和中值滤波的优缺点:均值滤波:优点:算法简单,对高斯噪声平滑效果好 缺点:在降低噪声的同时使图像产生模糊,特别是在边缘和细节处。
中值滤波:优点:在滤除噪声的同时很好地保存图像边缘,对椒盐噪声平滑效果好 缺点:对处理高斯噪声效果不如均值滤波
●图像锐化的目的是使模糊的图像变清晰,增强图像的边缘等细节。 用途:轮廓的抽取,图像的分割
方法:空间域法(微分运算)和频率域法(高通滤波) 梯度算子(一阶微分) 算子名称 Roberts Prewitt Sobel GX Gy 特点 各向同行;对噪声敏感;模板尺寸为偶数,中心位置不明显 引入了平均因素,对噪声有抑制作用;操作简便 引入了平均因素,增强了最近像素的影响,噪声抑制效果比Prewitt要好 ●平滑模板和微分模板的区别:(1.)微分模板的权系数之和为0,使得灰度平坦区的响应为0。平滑模板的权系数都为正,其和为1,这使得灰度平坦区的输出与输入相同
(2)一阶微分模板在对比度大的点产生较高的响应,二阶微分模板在对比度大得点产生零交叉。一阶微分一般产生更粗的边缘,二阶微分则产生更细的边缘。相对一阶微分而言,二阶微分对细线、孤立点等小细节有更强的响应。
(3)平滑模板的平滑或去噪程度与模板的大小成正比,跳变边缘的模糊程度与模板的大小成正比。
●伪彩色处理是指对不同的灰度级赋予不同的颜色,从而将会对图像变成彩色图像。(原来是黑白图片)
假彩色原来是彩色图像
●空间域的平滑滤波器和锐化滤波器的区别和联系 联系:模板结构相同,运算形式相同(加权求和)
区别:①模板权值不同,平滑模板权系数之和为1,锐化模板权系数为0 ②平滑滤波器是积分运算,锐化滤波器为差分运算
③含义不同:平滑是消除噪声,模糊图像,去除小的细节或弥合目标间缝隙 锐化是使模糊的图像变清晰,增强图像的边缘等细节。 ●第五章.图像分割与边缘检测
●图像分割就是指把图像分成一系列有意义的、各具特色的目标或区域的技术或过程。 图像分割算法可分为两类:利用灰度不连续的基于边界的分割和利用灰度相似性的基于区域的分割
●简述全局阈值、局部阈值和动态阈值的含义和区别 全局阈值:选取的阈值仅与各个像素的灰度有关
局部阈值:选取的阈值与像素本身及其局部性质相关
动态阈值:阈值随图像中的位置缓慢变化,可以将整幅图像分解成一系列子图像,对不同的子图像使用不同的阈值进行分割,阈值和坐标有关。 区别:全局阈值可以分割图像目标与背景之间具有高对比度的双峰图像。但当图像受到噪声等因素的影响或当图像目标与背景面积差别很大时,具有双峰性质的图像基本上变成了单峰,此时使用局部阈值能更好的分割图像;动态阈值适用于图像目标与背景的对比度有变化的图像。
●高斯-拉普拉斯算子把高斯平滑滤波器和拉普拉斯锐化滤波器结合起来实现边缘检测,即先通过高斯平滑抑制噪声以减轻噪声对拉普拉斯算子的影响,在进行拉普拉斯运算,通过检测其过零点来确定边缘位置。
●哈夫变换原理:图像空间中同一条直线(斜率为a,截距为b)上的点对应于参数空间中相交于一点(坐标为(a,b))的一系列直线。哈夫变换就是利用这种点-线对应关系,把图像空间中的检测问题转换到参数空间中处理 ●轮廓提取:掏空目标区域的内部点
假设图像的目标像素为黑色,背景像素为白色,如果图像中某个像素为黑色,切它的8个邻点都是黑色时,表明该点是内部点,否则为边界点
●轮廓跟踪就是顺序找出边界点,不仅可以跟踪出边界,还可以同时记录边界信息,如生成边界链码,为图像分析做准备
●投影法就是把图像在某一方向(常用水平方向和垂直方向)上进行投影,在投影图上便可反映出图像中目标对象的位置、尺寸等信息,用于确定目标位置。
●差影法:图像的想减运算,是指同一景物在不同时间拍摄的图像,或同一景物在不同波段的图像想减
差影法检测变化目标的流程图
固定背景图像或背景模 当前图像 型图像或前一幅图像 差影运算及阈值化处理
●第六章
●齐次坐标法:用n+1维向量表示n维向量的方法。
●齐次坐标几何含义:相当于点(x,y)落在3D空间H=1的平面上。
●引入齐次坐标原因:为了能够用统一的矩阵线性变换的形式表示和实现这些常见的图像几何变换,所以引入了齐次坐标,采用齐次坐标并将变换矩阵改成3x3阶的形式后,便可实现所以2D图像几何变换的基本变换。
●实现2D图像几何变换的过程:将2xn阶的二维点集矩阵【X0i,Y0i】T表示成齐次坐标【X0i,Y0i,1】T的形式,然后乘以相应的变换矩阵即可,即:变换后的点集矩阵=变换矩阵Tx变换前的点集矩阵。
fx000fy0 01010△x-1001△y0100100fwidth01100-100fheight10cossin0sincos000 1 1比例缩放 2平移 3水平镜像 垂直镜像 图像旋转
●图像比例缩放是指将给定的图像在x轴方向按比例缩放fx倍,在y轴方向按比例缩放fy倍,从而获得一幅新的图像,若fx=fy,则称为图像的全比例缩放。
●图像平移是指将一幅图像上的所有点都按照给定的偏移量在水平方向沿x轴、在垂直方向沿y轴移动,平移后的图像与原图形相同。 ●图像的镜像变换不改变图像的形状。图像的水平镜像操作是将图像的左半部分和右半部分以图像垂直中轴线为中心进行镜像对换;图像的垂直镜像操作是将图像的上半部分和下半部分以图像水平中轴线为中心进行镜像对换。 ●图像旋转是指以图像的中心为原点,将图像上所有像素都旋转一个相同的角度。图像旋转变换是图像的位置变换,但旋转后,图像的大小一般会改变。
●步骤:图像旋转前,为了避免信息的丢失,一定要平移坐标;图像旋转之后,会出现许多的空洞点,对这些空洞点必须进行填充处理,否则画面效果不好,最简单的方法是行插值或列插值:①找出当前行的最小和最大的非白点的坐标,记做(i,k1)、(I,k2)②在(k1,k2)范围内进行插值,插值的方法是:空白的像素值等于前一点的像素值③同样的操作重复到所有行。
●图像的复合变换也称为级联变换,是对给定的图像连续施行若干次如前所述的平移、镜像、比例缩放、旋转等基本变换后所完成的变换。
●过程:将复合变换分解成一系列基本变换,相应的,使用齐次坐标后,图像复合变换的矩阵由一系列图像基本几何变换矩阵一次相乘而得到。在进行图像的比例缩放、旋转变换时,整个变换过程由两个独立的算法组成,首先需要一个算法来完成几何变换本身,用它描述每个像素如何从其初始位置变换到最终位置,同时还需要一个用于灰度级插值的算法填补“空穴”。
●灰度级插值:①像素移交(向前映射法):把几何变换想象成将输入图像的灰度一个像素一个像素的转移到输出图像中,若一个输入像素呗映射到四个输出像素之间的位置,则其灰度值就按插值算法在四个像素之间进行分配。②像素填充(向后映射法):输出像素一次一个的映射回到原始图像中,以便确定其灰度级。
●把世界坐标系中的三维物体或对象转变为二维图像表示的过程称为投影变换,根据视点(投影中心)与投影平面之间距离的不同,投影可分为平行投影和透视投影。平行投影的视点与投影平面之间的距离为无穷大,影像大小与物体大小相同。透视投影距离有限,这个距离决定着透视缩小效应,即三维物体的大小与形体到视点的距离成反比。 ●灭点:不平行于投影面的平行线的投影会聚集到一个点。灭点可以看做是无限远处的一点在投影面上的投影。主灭点:坐标轴方向的平行线在投影面上形成的灭点又称主灭点,主灭点最多有三个。
●为什么2x2矩阵不能直接实现2D图像的平移变换?
没有引入平移常量,需要先进行齐次坐标转换。
●在图像比例缩放中,如放大倍数太大,按前面的方法处理会出现马赛克效应,如何解决? 为了提高几何变换后的图像质量,常采用线性插值法,原理:当求出的分数地址与像素点不一致时,求出与围四个像素点的距离比,根据该比率,由四个邻域的像素灰度值进行线性插值。
●列插值步骤?
①找出当前列的最小和最大的非白点的坐标,记作(k1,j),(k2,j)②在(k1,k2)范围内进行插值,插值的方法是:空点的像素值等于上一点的像素值③同样的操作重复到所有列。 ●简述图像几何畸变校正过程与步骤? 主要处理步骤:①输入畸变图像②建立校正函数③确定校正后图像的范围④对每个像素进行逐个几何变换⑤灰度的重采样⑥输出校正后的图像 具体实现步骤:①利用控制点对图像数据建立一个模拟几何畸变的数学模型,以此来建立畸变图像空间与标准空间的某种对应关系。②利用这种对应关系把畸变空间中的全部元素换到标准空间中去。 ●第七章
●频域变换的理论基础:任意波形都可以用单纯的正弦波的加权和来表示。 ●频域处理的步骤: ① 用② ③ ④ ⑤
乘以输入图像各像素值,以将图像频谱原点移动到频谱图中心
计算图像的DFT,得到F(u,v)
用滤波函数H(u,v)乘以F(u,v),得到处理结果G(u,v) 计算滤波后的IDFT
取IDFT变换结果中的实部
乘以IDFT变换结果的实部,得到处理后的图像
⑥ 用
H(u,v)称为滤波器
●击中击不中:如果A∩B≠ф,称B集中A,记B↑A。等于空集则B击不中A, ●反射:即将A中每个点的坐标取相反数后所得的新图像。 ●腐蚀:目标图像X和结构元素S
S+x ⊆X ; S+x ⊆; S+x∩X与S+x⊆都不为空。满足这些条件的点x的全体构成结构元素与图像最大相关点集,称这个点集为S对X的腐蚀。用S来腐蚀X得到的集合是S完全包括在X中时S的原点位置的集合。
●膨胀:X中的每一个点x扩大为S+x。用S来膨胀X得到的集合是的位移与X至少有一个公共的非零元素相交时,S的原点位置的集合。
●开闭运算:开运算即先腐蚀后膨胀;闭元算即先膨胀后腐蚀 ●灰值形态学与二值形态学的区别:灰值形态学运算的操作对象不再看作聚合而看作图像函数;相同点:处理的范围,操作,定义相同 ●二值形态学的应用:形态学滤波,骨架抽取 ●第九章
●三色原理:人眼中锥状细胞将电磁光谱的可见部分分为三个波段:红、绿、蓝。所有颜色都可以看做是三种基本颜色按照不同的比例组合而成的,因此这三种颜色被称为三基色。
●颜色的三个基本属性:色调、饱和度、亮度。
●颜色模型:①RGB模型:加色系统。每个分量量化范围为0~255,可表示1670万种颜色,又称24位真彩色。红(255,0,0)、绿(0,255,0)、蓝(0,0,255)、青(0,255,255)、品红(255,0,255)、黄色(255,255,0)、白(255,255,255)、黑(0,0,0)。灰色分布在黑白两点连线上,称为灰度线。②CIE XYZ模型:与RGB相比特点是颜色不受光线的影响。③Lab颜色模型:Lab颜色由亮度或光亮度分量L和a、b两个色度分量组成,其中a在正向的数值越大表示越红,在负向数值越大表示越绿,b正黄负蓝。与设备无关。④HIS颜色模型:以色调、饱和度、强度三种基本特征量来感知颜色。色调H:与光波的 波长有关,表示人的感官对不同颜色的感受,也可以表示一定范围的颜色。饱和度S:表示颜色的纯度,纯光谱色是武琼饱和的,加入白光会稀释饱和度,饱和度越大,颜色越鲜艳。强度I:对应成像亮度和图像灰度,是颜色的明亮程度。⑤CMY模型:通过颜色相减来产生其他颜色,又称减色合成法。以青色、品红、黄色为三原色,青色吸收红光,品红吸收绿光,黄色吸收蓝光。应用于印刷业。⑥YUV电视信号彩色坐标系统⑦YCbCr模型:降低彩色数字图像存储量。适合于彩色图像压缩。
0.43400.37620.18980.21270.71520.0721 0.01780.10950.8727CIE XYZ 与RGB的转换矩阵
●彩色切片:通过识别图像中感兴趣的颜色,将其作为一个整体从图像中分离出来。
●彩色直方图:Ha,b.c[r1,r2,r3]=N·P{A=r1,B=r2,C=r3},其中A、B、C为颜色通道,N为图像的总像素数,p为概率,r1r2r3为颜色值。将图像中颜色量化后统计每种颜色出现个数绘制直方图。①分通道彩色直方图:首先对彩色图像执行通道分离操作,得到各通道的直方图②单变量彩色直方图m=a+Na·b+NaNb·c。h[m]=N·P{M=m}。③近似彩色直方图:取R、G、B颜色通道的高两位拼成一个值表示一种颜色,统计其出现次数。 ●彩色图像处理的应用:
1、去红眼,步骤:①确定眼部区域R②对R中的每一个像素,将其由RGB模型转换为HIS模型③将满足-π/4 2、肤色检测,在基于内容的图像检索、身份鉴定和确认、人机交互操作等方面有广泛应用,步骤:①根据肤色模型,将一幅彩色图像转变为灰度图像,像素的灰度值对应于改点属于皮肤区域的概率②选取合适的阈值,将灰度图像转换为二值图像,其中0,1分别表示非皮肤区域和皮肤区域③以该二值图像作模版,在原图像中检测肤色区域。 ●第十章 ●图像特征:用于区分内部最基本的特征和属性。可以是人的视觉能够识别的自然特征,也可以是通过对图像的测量和处理、人为定义的某些特征。 ●图像的几何特征: 1.位置:用物体的面积的中心点作为物体的位置。面积中心就是单位面积质量恒定的相同 1n1形状图形的质心O 质心位置坐标xmni01n1xi,ymni0j0m1yj0m1j 2.方向: 把较长方向的轴定为物体的方向 3.周长:区域的周长即区域的边界长度。计算方法: (1)周长就是计算隙码的长度。 (2)把像素看作一个个点时,则周长用链码表示,求周长也即计算链码长度。此时,(3) 当链码值为奇数时,其长度记作2; 当链码值为偶数时,其长度记作1。即周长p表示为pNe2NNe和No分别是边界链码(8方向)中走偶步与走奇步的数目。 (3)周长用边界所占面积表示, 也即边界点数之和, 每个点占面积为1的一个小方块 4.面积:物体的总尺寸的一个方便的度量。 (1)像素计数面积:统计边界内部(也包括边界上)的像素的数目Af(x,y) x1y1NM(2)由边界行程码或链码计算面积:已知区域的行程编码,只需把值为1的行程长度相加, 即为区域面积; 若给定封闭边界的某种表示,则相应连通区域的面积应为区域外边界包围的面积与内边界包围的面积(孔的面积)之差。 屏幕左上角为坐标原点,起始点坐标为(x0, y0),第k段链码终端的y坐标为 yky0yiεi=1, 2, 3 yi=-1;εi=0,4 yi=0;εi=5, 6, 7 yi=1. i1k边界所包围的面积为 (用链码表示边界时边界内所包含的单元方格数) A(yi1xia) εi=0, 1, 7 xi=1;εi=2,6 xi=0;εi=3, 4, 5 xi=-1。εi=1, 5 i1na=0.5; εi=0,2,4,6 a=0;εi=3, 7 a=-0.5。 (3)用边界坐标计算面积:在x-y平面中的一个封闭曲线包围的面积由其轮廓积分给定 1Nb1NbA[xi(yi1yi)yi(xi1xi)][xiyi1xi1yi] Nb为边界点的数目 2i12i1 5.长轴和短轴:计算MER(最小外接矩形)的一种方法是,将物体的边界以每次3°左右的增量在90°范围内旋转。每旋转一次记录一次其坐标系方向上的外接矩形边界点的最大和最小x、y值。旋转到某一个角度后,外接矩形的面积达到最小。取面积最小的外接矩形的参数为主轴意义下的长度和宽度。主轴可以通过矩(Moments)的计算得到,也可以用求物体的最佳拟合直线的方法求出。 6.距离:图像中两点P( x , y )和Q( u , v )之间的距离测量方法: (1) 欧几里德距离:de(P,Q)(xu)2(yv)2 (2) 市区距离:d4(P,Q)|xu||yv| (3) 棋盘距离:d8(P,Q)max(|xu|,|yv|) ●形状特征: 1.矩形度:矩形度反映物体对其外接矩形的充满程度,用物体的面积与其最小外接矩形的面积之比来描述,即RAO AO是该物体的面积,而AMER是MER的面积 AMER 2.圆形度:刻画物体边界的复杂度 P2(1)致密度C:度量圆形度最常用的是致密度, 即周长(P)的平方与面积(A)的比: C A(2)边界能量E: (3)圆形性(Circularity)C:是一个用区域R的所有边界点定义的特征量,即CR RR是从区域重心到边界点的平均距离,δR是从区域重心到边界点的距离均方差 (4)面积与平均距离平方的比值:从边界上的点到物体内部某点的平均距离 1ddNxxi是从具有N个点的物体中的第i个点到与其最近的边界点的距离 ii1N 3.球状性 (Sphericity) S:既可以描述二维目标也可以描述三维目标,其定义为Sri rc在二维情况下,ri代表区域内切圆(Inscribed circle)的半径, 而rc代表区域外接圆(Circumscribed circle)的半径, 4.不变矩: (1)矩的定义:对于二元有界函数f ( x , y ),它的( j + k )阶矩为 Mjkxjykf(x,y)dxdyj,k0,1,2, (2)质心坐标与中心矩:当j=1, k=0时,M10对二值图像来讲就是物体上所有点的x坐标的总和,类似地,M01就是物体上所有点的y坐标的总和,所以x值图像中一个物体的质心的坐标 (3)主轴:使二阶中心矩从μ11变得最小的旋转角θ可以由下式得出:tan2M10M,y01就是二M00M00211将 2002x、y轴分别旋转θ角得坐标轴x′、y′,称为该物体的主轴。 (4)不变矩:相对于主轴计算并用面积归一化的中心矩, 在物体放大、 平移、 旋转时保持不变。只有三阶或更高阶的矩经过这样的规一化后不能保持不变性。 不变矩及其组合具备了好的形状特征应具有的某些性质, 已经用于印刷体字符的识别、飞机形状区分、景物匹配和染色体分析中,但它们并不能确保在任意情况下都具有这些性质。一个物体形体的惟一性体现在一个矩的无限集中,因此,要区别相似的形体需要一个很大的特征集。这样所产生的高维分类器对噪声和类内变化十分敏感。在某些情况下,几个阶数相对较低的矩可以反映一个物体的显著形状特征。 5.性状描述算子:能对物体进行简洁地描述。 (1)边界链码:链码是对边界点的一种编码表示方法,其特点是利用一系列具有特定长度和方向的相连的直线段来表示目标的边界。因为每个线段的长度固定而方向数目有限, 所以只有边界的起点需要用绝对坐标表示,其余点都可只用接续方向来代表偏移量。由于表示一个方向数比表示一个坐标值所需比特数少,而且对每一个点又只需一个方向数就可以代替两个坐标值,因此链码表达可大大减少边界表示所需的数据量。数字图像一般是按固定间距的网格采集的,因此最简单的链码是跟踪边界并赋给每两个相邻像素的连线一个方向值。常 用的有4方向和8方向链码,它们的共同特点是直线段的长度固定,方向数有限。 (2)一阶差分链码:用链码表示给定目标的边界时,如果目标平移,链码不会发生变化, 而如果目标旋转则链码会发生变化。为解决这个问题, 可利用链码的一阶差分来重新构造一个表示原链码各段之间方向变化的新序列,这相当于把链码进行旋转归一化。差分可用相邻两个方向数按反方向相减(后一个减去前一个)得到。上面一行为原链码(括号中为最右一个方向数循环到左边),下面一行为上面一行的数两两相减得到的差分码。左边的目标在逆时针旋转90°后成为右边的形状,可见,原链码发生了变化,但差分码并没有变化。 (3)傅立叶描述子:对边界的离散傅立叶变换表达,可以作为定量描述边界形状的基础。采用傅立叶描述的一个优点是将二维问题简化为一维问题。 ●欧拉数和孔洞数:欧拉数(Euler number)E定义如下: E=C-H 是区域的拓扑特性之一。例如:图像有1个连接部分和1个孔,所以它的欧拉数E为0;有1个连接部分和2个孔,它的欧拉数为-1。 ●拓扑学(Topology)是研究图形性质的理论。区域的拓扑性质对区域的全局描述很有用,这些性质既不依赖距离,也不依赖基于距离测量的其他特性。如果把区域中的孔洞数H作为拓扑描述子,显然,这个性质不受伸长、旋转的影响, 但如果撕裂或折叠时孔洞数会发生变化。区域内的连接部分C的个数是区域的另一拓扑特性。一个集合的连通部分就是它的最大子集,在这个子集的任何地方都可以用一条完全在子集中的曲线相连接。 ●四叉树:表达表示图像是一个“金字塔”式的观察和处理过程。这种数据结构是一种有效的对空间占有数组的编码,可以很好地描述一幅图像。当图像是方形的, 且像素点的个数是2的整数次幂(即图像尺寸为2k×2k,k为正整数)时四叉树法最适用。在这种表达中,所有的节点可分成三类: 目标节点(用白色表示)、 背景节点(用深色表示)和混合节点(用浅色表示)。四叉树的树根对应整幅图, 而树叶对应各单个像素或具有相同特性的像素组成的方阵。四叉树由多级构成, 数根在0级, 分一次叉多一级。对一个有n级的四叉树,其节 4n114n4 点总数N最多为N433i0ni●四叉树表示图像的具体做法:树的根节点表示整幅图像, 如果该图像只有一个值,就用 那个值和终点标记根节点;否则, 在根节点上加上4个分支,产生新的节点,每个分支表示1/4图像。对每个新节点重复上述过程, 直到整个四叉树产生为止。通常,在h层上的节点(如果有的话)表示尺寸为2k-h×2k-h的块, 那些块的坐标位置是2k-h的倍数。假如其中一块为同一值,它的节点即叶节点; 否则,会产生h+1层上的4个分支,将h层上的块4等分。在n层上的节点(假如有的话)全对应于单个像素的叶节点。 ●图像匹配:一个复杂的视觉系统,它的内部常同时存在着多种输入和其他只是共存的表达形式。干只是把视觉输入与事前已有表达结合的过程。面识别也需要建立和发现各种内部表达式之间的联系。图像匹配就是建立这些练习的技术和过程。有: ●模板匹配:在一副大图像中搜寻目标,一直改途中又要找的目标,且该目标与模板由相同的尺寸、方向和图像元素,通过一定的算法可以在图中找到目标,确定其坐标位置。 ●直方图匹配:为利用图像的颜色特征描述图像,可借助图像特征的统计直方图进行图像的匹配。有直方图相交法、欧几里得距离发、中心距法、参考颜色法、闵可夫斯基距离法和X2直方图匹配。 ●形状匹配:依据一定的度量准则来衡量形状之间的相似性 ●图像特征:用于区分内部最基本的特征和属性。可以是人的视觉能够识别的自然特征,也可以是通过对图像的测量和处理、人为定义的某些特征。 因篇幅问题不能全部显示,请点此查看更多更全内容