具体地说,降低维度又存在着两种方法:特征选择和特征抽取。特征选择是指选择全部特征的一个子集作为特征向量;特征抽取是指通过已有特征的组合建立一个新的特征子集,主成分分析方法(Principal Component Analysis, PCA)就是通过原特征的线性组合建立新的特征子集的一种特征抽取方法。
特征选择简介批注:本节是通过部分特征组合来枚举测试效果的。
主成分分析主元分析也就是PCA,主要用于数据降维。
批注:很复杂。
参考链接:
https://www.zhihu.com/question/41120789?sort=created
局部二进制模式(Local Binary Patterns ,LBP)最早是作为一种有效的纹理描述算子提出的,由于其对图像局部纹理特征的卓越描绘能力而获得了十分广泛的应用。LBP特征具有很强的分类能力(Highly Discriminative)、较高的计算效率并且对于单调的灰度变化具有不变性。
TODO.
图像识别初步 模式识别概述模式识别(Pattern Recognition )是人类 的一项基本智能,在日常生活中,人们经常在进行“模式 识别”。随着20世纪40年代计算机 的出现以及20世纪50年代人工智能 的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。
模式与模式识别模式是由确定的和随机的成分组成的物体、过程和事件。在一个模式识别问题中,它是本节识别的对象。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,简单地说就是应用计算机对一组事件或过程进行鉴别和分类。
本节所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物的传感器等对象 进行测量的具体模式进行分类和辨识。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征提取环节需要应用图像处理的技术;而图像处理中的图像分析也常常应用模式识别的技术。
图像识别将模式识别的方法和技术应用于图像领域,即当识别的对象是图像时就称为图像识别 。虽然对人类而言,理解和识别所看见的东西似乎是一件再平常不过的事情,但让计算机具有类似的智能却是一项极具挑战性的任务,然而两者在很多环节上是相似的,下面从熟悉的人类视觉过程开始,认识机器的图像识别机理。
将模式识别的方法和技术应用于图像领域,即当识别的对象是图像时就称为图像识别 。虽然对人类而言,理解和识别所看见的东西似乎是一件再平常不过的事情,但让计算机具有类似的智能却是一项极具挑战性的任务,然而两者在很多环节上是相似的,下面从熟悉的人类视觉过程开始,认识机器的图像识别机理。
图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。所以说在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。这一点和计算机的识别中,需要先学习一些已经类别的样本(训练样本),才能识别那些类别未知的新样本(测试样本)是相似的。
人的图像识别能力是很强的。图像距离的改变或图像在感觉器官上作用位置的改变,都会造成图像在视网膜上的大小和形状的改变,即使在这种情况下,人们仍然可以认出他们过去知觉过的图像;此外,人类还具有非凡的3D重建能力,比如说可能只见过某人的正面照片,但可以认出此人的侧脸甚至是背脸。从这个意义上说,目前计算机的识别能力与人类就相差甚远了。
图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。相关研究表明,识别时视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。这一点正好说明了图像识别中特征提取的必要性。