在经过图像分割得到各种感兴趣的区域之后,可以利用下面将要介绍的一些简单区域描绘子作为代表该区域的特征。通常将这些区域特征组合成特征向量以供分类使用。
常用的简单区域描绘子如下。
周长:区域边界的长度,即位于区域边界上的像素数目。
面积:区域中的像素总数。
致密性:(周长)2 /面积。
区域的质心。
灰度均值:区域中所有像素的平均值。
灰度中值:区域中所有像素的排序中值。
包含区域的最小矩形。
最小或最大灰度级。
大于或小于均值的像素数。
欧拉数:区域中的对象数减去这些对象的孔洞数。
直方图及其统计特征在第3章点运算中,已经学习过直方图的概念和计算方法,当时直方图更多的是作为一种辅助图像分析的工具。这里则要将直方图作为图像纹理描述的一种有力手段,以直方图及其统计特征作为描述图像的代表性特征。
首先来看纹理的概念。纹理 是图像固有的特征之一,是灰度(对彩色图像而言是颜色)在空间以一定的形式变换而产生的图案(模式),有时具有一定的周期性。图13.2(d)~图13.2(f)给出了3种不同特点的纹理:金属表面的平滑纹理、龟壳表面的粗糙无规则纹理,以及百叶门图像中具有一定周期性的纹理。既然纹理区域的像素灰度级分布具有一定的形式,而直方图正是描述图像中像素灰度级分布的有力工具,因此用直方图来描述纹理就顺理成章了。
毫无疑问,相似的纹理具有相似的直方图;而由图13.2可见,3种不同特点的纹理对应着3种不同的直方图。这说明直方图与纹理之间存在着一定的对应关系。因此,可以用直方图或其统计特征作为图像纹理特征。直方图本身就是一个向量,向量的维数是直方图统计的灰度级数,因此可以直接以此向量作为代表图像纹理的样本特征向量,从而交给分类器处理,对于LBP直方图就常常这样处理(见13.5节)。另一种思路是进一步从直方图中提取出能够很好地描述直方图的统计特征,将直方图的这些统计特征组合成为样本特征向量,这样做的好处是大大降低了特征向量的维数。
应认识到直方图及其统计特征是一种区分能力相对较弱的特征,主要是由于直方图属于一阶统计特征,而像直方图、均值这样的一阶统计特征是无法反映纹理结构的变化的。
直方图与纹理的对应关系并不是一对一的:首先,不同的纹理可能具有相同或相似的直方图;其次,即便是两个不同的直方图,也可能具有相同的统计特征,如均值、标准差等。因此,依靠直方图及其统计特征来作为分类特征需要特别注意。
灰度共现矩阵灰度直方图是一种描述单个像素灰度分布的一阶统计量;而灰度共现矩阵描述的则是具有某种空间位置关系的两个像素的联合分布,可以看成是两个像素灰度对的联合直方图,是一种二阶统计量。
纹理是由灰度分布在空间位置上反复交替变化而形成的,因此在图像中具有某种空间位置关系的两个像素之间会存在一定的灰度关系,这种关系被称为图像灰度的空间相关特性。作为一种灰度的联合分布,灰度共现矩阵能够较好地反映这种灰度空间相关性。
特征降维 维度灾难之前已经不止一次提到了特征向量的维数过高会增加计算的复杂度,给后续的分类问题带来负担。实际上维数过高的特征向量对于分类性能(识别率)也会造成负面的影响。直观上通常认为样本向量的维数越高,就了解了样本更多方面的属性,掌握了更多的情况,应该对提高识别率有利。然而,事实却并非如此。
对于已知的样本数目,存在着一个特征数目的最大值,当实际使用的特征数目超过这个最大值时,分类器的性能不是得到改善,而是退化。这种现象正是在模式识别中被称为“维度灾难”的问题的一种表现形式。例如,要区分西瓜和冬瓜,表皮的纹理和长宽比例都是很好的特征,还可以再加上瓜籽的颜色以辅助判断,然而继续加入重量,体积等特征可能是无益的,甚至还会对分类造成干扰。
基于以上所述的原因,降维就对操作者产生了巨大的吸引力。在低维空间中计算和分类都将变得简单很多,训练(教授分类器如何区分不同类样本的过程)所需的样本数目也会大大降低。通过选择好的特征,摒弃坏的特征,将有助于分类器性能的提升;在通过组合特征降维时,在绝大多数情况下,丢弃某些特征所损失的信息通过在低维空间中更加精确的映射可以得到补偿。