数字图像处理笔记 (24)

图像识别中著名的的模板匹配模型认为,要识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。但这种模型强调图像必须与脑中的模板完全匹配才能成功识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。这就提示操作者,匹配过程不应基于完全相同的比较而是应基于某种相似性的度量。

关键概念

模式类(Pattern Class):是指共享一组共同属性(或特征)的模式集合,通常具有相同的来源。

特征(Feature):是一种模式区别于另一种模式的相应(本质)特点或特性,是通过测量或处理能够抽取的数据。

噪声(Noise):是指与模式处理(特征抽取中的误差)和(或)训练样本联合的失真,它对系统的分类能力(如识别)产生影响。

分类/识别(Classification/Recognition):是指根据特征将模式分配给不同的模式类,识别出模式的类别的过程。

分类器(Classifier):可理解为为了实现分类而建立起来的某种计算模型,它以模式特征为输入,输出该模式所属的类别信息。

训练样本(Training Sample):是一些类别信息已知的样本,通常使用它们来训练分类器。

训练集合(Training Set):训练样本所组成的集合。

训练/学习(Training/Learning):是指根据训练样本集合,“教受”识别系统如何将输入矢量映射为输出矢量的过程。

测试样本(Testing Sample):是一些类别信息对于分类器未知(不提供给分类器其类别信息)的样本,通常使用它们来测试分类器的性能。

测试集合(Testing Set):测试样本所组成的集合。当测试集合与训练集合没有交集时,称为独立的测试集。

测试(Testing):是将测试样本作为输入送入已训练好的分类器,得到分类结果并对分类正确率进行统计的过程。

识别率(Accuracy):是指对于某一样本集合而言,经分类器识别正确的样本占总样本数的比例。

泛化精度(Generalization Accuracy):分类器在独立于训练样本的测试集合上的识别率。

识别问题的一般描述

TODO.

过度拟合

一般来说,简单的模型具有计算复杂度上的优势,训练它们所需的样本数目通常也更少,但它们对空间的划分往往不够精确,导致识别精度受到一定的限制;而复杂的模型可以更好地拟合训练样本,产生非常适应训练数据的复杂决策边界,从而有理由期望它们在测试集上也会有好的表现。然而,这一美好的愿望并不总能实现,事实上,过度复杂的决策边界常常导致所谓“过度拟合”(Overfit)现象的发生。

模式识别系统结构

TODO.

训练/学习方法分类

教师指导的学习:又称为有监督学习。是指在训练样本集中的每个输入样本类别均已知的情况下进行学习,也就是使用训练模式和相应的类别标记一起来教授分类器。日常生活中有监督学习的一个例子是教孩子识字,教师将字本身(样本)和具体是什么字(类别)一起教给孩子。

无教师指导的学习又称为无监督学习。是指在样本中没有相应的类别信息的情况下,系统对输入样本自动形成“自然的”组织或簇(Cluster)。如“聚类算法”就是一种典型的无监督学习。

加强学习又称为基于评价的学习。在加强学习中,并不把类别信息直接提供给分类器,而是让分类器自己根据输入样本计算输出类别,将它与已知的类别标记进行比较,判断对已知训练模式的分类是否正确,从而辅助分类器的学习。日常生活中加强学习的一个例子是提供正确答案的考 试讲评,这里考生就相当于分类器,他们先是独立考试(分类),而后根据教师提供的标准答案来改善知识体系(分类器模型)。

模式识别方法分类

有两种基本的模式识别方法,即统计模式识别(Statistical Pattern Recognition)方法和句法(结构)模式识别(Syntactic Pattern Recognition)方法。统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决策系统 进行模式识别的技术,又称为决策理论识别方法;而利用模式与子模式分层结构的树状信息所完成的模式识别工作,就是句法(结构)模式识别。

最小距离分类器和模板匹配

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwgdys.html